ラァンフォーヱヴアー

出先・常駐先用コマンドリスト。2020年からリモートワークなので常駐なくなったけど。その他思ったことメモ。

おかーさーん、インターネットが壊れたー(OSが起動しなくなる話)

毎回久しぶりになるが、原因がわかりにくいパソコントラブルが起きて解決したので情報共有として残す。少しでも皆様の参考になれば。
(2023/6/30追記) 5月の記事だが同じ症状で別の問題も起きたので追記。

症状

  1. BIOS(UEFI)の設定がデフォルト値に戻ってしまう。
  2. 突然、電源は入っているが画面が真っ暗になり、反応しなくなる状態になる。リモートログインもできず、完全ハングアップの状態。
    • この状態だと電源長押しが効かず、電源コンセントを抜くしかない。
    • BIOSは正常に起動する。
    • ディスプレイやマウス、キーボードは正常。
    • 少しずつ頻度が上がり、最終的にはBIOSは起動するがOSは起動しない状態になった。

結論(同じ症状に悩んでおり、早く結論を知りたい方へ)

  1. BIOSボタン電池切れ。新品のボタン電池に交換。
  2. CPU破損。交換して解消。
  3. マザーボード破損。交換して解消。(6/30追記)

経緯

今年に入ったぐらいの時期からBIOSの値がデフォルト値になったり、日付が古くなったりする現象(症状1)が発生。
ただ、PC電源起動しっぱなしであったため、あまり気になっていなかった。

2月から3月にかけて、いつの間にか画面が真っ暗でマウス、キー操作を受け付けない状態になることがあった(症状2)。
大抵は朝起きると起きている感じ。
週に1回、数日に1回とだんだんペースが上がり、毎晩起こるようになった。
イベントログを見ても特段異常は見られなかった。パフォーマンスモニターで停止する時刻を見極めようとしたが、設定後は問題が起きなくなる。やったか?

【Windows】パフォーマンスモニターとデータコレクターセット | hirota.noの技術ブログ〜 It's all over the network.

が、勿論そんなことはなく再発した。
この頃までにはいろいろ検索するうちに「BIOSボタン電池」を疑うようになった。特に症状1や「少しずつ悪化していく」様子がいかにも電池のトラブルっぽいと感じられた。
以下の対策を試す。一時的に効果があることもあったが、問題は解決せず。

そこでボタン電池交換。使用しているマザーボードは「ASRock > Fatal1ty X370 Gaming-ITX/ac」でボタン電池が外に飛び出しているタイプだった。
以下を購入して交換。

ちなみに、Fatal1ty X370 Gaming-ITXacにおいては上記ボタン電池は間違いで、「逆極性」の電池を買うべきだったっぽい。
同じ問題に引っかかっている人がレビュー欄にいたので、その人に従ってケーブルを入れ替えて解決したが、この記事を読んでいる人は交換前のボタン電池のケーブルのどっちが赤でどっちが黒かをちゃんと確認しよう。

これで解決したはず…だが1週間後くらいに再発。むしろ更に状況は悪化し、OSが起動しなくなった。

ボタン電池ではなく電源が原因か?と考え、電源を交換したが、効果はなかった。
ギブアップして以下ドスパラに持ち込み、診断してもらった。

www.dospara.co.jp

「電源なのは間違いないと思ってるんですがね…」「いや^ー、電源はないっすねー」と秒で論破。論破王はここにもいたか。
症状を確認してもらったり、システムディスク(M.2 SSD)を差し替えたりと30分くらいやりとり。
「前に同じ症状が出たときはCPUが破損してましたねー」ということでCPU見てみる。

と、CPUクーラーのネジが本来4か所止めるべきところ2か所、しかも四角形の対角上でなく片側しか止まっていなかったのが発覚。
そういえば手が入らず、片側は止められそうになかったからそうしたんだった。

止まってない方を押さえながら起動すると一瞬だけ起動することが確認できた。とは言えすぐ停止するのでCPUは壊れてしまってる可能性大。
うせやろ?Ryzen 7 1700がWindows 11非対応ということで品薄時に中古で新品より高い値段を払ったのに…

CPUを交換してみると、構成変更によるいつもより長い起動時間の後、待望のOS起動画面が表示した。CPU破損確定濃厚バレバレ。
半年くらい使っていたCPUが壊れていたとは思わなかったが、状況からしてCPUクーラーのネジ止め問題は少なくとも原因の一つではありそう。

結局CPUを交換して、2023/4/21に問題が解決した。

教訓

ネジはちゃんと止めよう。

ちなみに

普段はゲームとYouTubeとStable Diffusion動かしてキャッキャしてるだけのパソコンだったが3月4月は珍しく資料作らないといけなかったため、よりにもよってという感じ。
過去何度か登場してるMiniBookで凌いだけど。

後日譚(5/10書いた理由)

2023/5/10 朝起きたら同じことになっていた… 電源を抜き差ししたら直ったが…
2023/5/11 再発した…
2023/5/12 BIOSのfTPM2.0設定が無効になっており、有効にしたら「CPUが変更されました。リセットしますか?」みたいなメッセージがでてYesしたら直った。
TPMが有効な状態で動いていたOSから見て、TPMが無効となったCPUが認識できなくなった」という理屈はとおるような気もするが…うーん。じゃあしばらく動いていたのはどういうことだろう?
とりあえずバックアップとったので様子見。

後日譚2(6/30書いた理由)

2023/6/14 週一くらいのペースでおきて、都度電源抜き差しで対応していたが、ついにうんともすんとも言わず。ドスパラの引取修理サービスで診てもらう。
2023/6/23 ドスパラから連絡。マザーボードの破損とのこと。miniITXから変更するような修理提案を受けたが、miniITXがいいので修理はキャンセル。
2023/6/27 なかなかminiITXの現行マザボない中、GIGABYTE B550I AORUS PRO AX Rev.1.xを購入した。
全体的に放熱プレートなどで覆われていてゴツめ。CPUファン取付で干渉したが、同じケース、CPU、マザボでレビューを挙げられているこちらの記事を参考にさせていただいた。
起動した。PCMark10も動作する。
2023/6/30 とりあえず3日間起動しっぱなしだが、安定している様子。