自宅サーバで得体の知れないCPU負荷30%ほどがずーっとかかるようになった。 ソフトの更新で動きの怪しいパッケージが入ったかと思い、 調べるが top でも、観察できない。 次に考えるのは、クラックされたとの疑いだけど、カーネルなどの更新もまめに 行っているし、Firewall も iptables でそれなりに鉄壁のはず。
となると、以前にも同様のことがあったのは、HDD の故障の時。 ディスクアクセスでリトライが頻発しているのだろう。 実際 reboot をかけると、一旦 fsck 付近で OS 起動が止まってしまった。 再び reboot で普通に起動し、変な負荷も消えたので、 過去の実績からすれば HDD 故障の前触れかもしれない。 週末は、本当に壊れる前に HDD を買い物しておこう…
まずは fsck
インターネット回線越しなので輻輳の影響受けてるかもしれないけど、 故障した前サーバに入れていた160GBのHDD(バックアップ用)で
# fsck.ext3 -C 0 -f /dev/hdd1
を実行中 fsck 自体は正常終了したけど、40%付近で妙に棒グラフが遅くなってた… 怪しい…
S.M.A.R.T. の確認
次に
# smartctl -a /dev/hdd1
を実行するが、"READ SECTOR" エラーがポロポロ…決定的だな…
バックアップ用なので、データが消えても影響は無いが、家族の写真等のデータなどは、 何もバックアップが無いのは、心配。(一応 NAS でも3重にバックアップしてるけど…)
ただ、root パーティションでも、"READ DMA" エラーが記録されていた。 こちらは致命的ではないらしいけど、ちょっと心配。