Raspberry Piに、SSDやHDD等のストレージにを接続する場合もあるかと思いますが。
それらが不調の場合、gmailで通知してくれるように、先日設定を行いました。
では、本当にストレージが不調な場合、どのような通知が来るのでしょうか?
そのあたりを記録させて頂こうと思います。
目次
smartdのストレージ状態通知の内容
smartdデーモンが警告またはエラーのログを記録
通知が来るタイミングは、smartdが警告またはエラーを検出し、ログを記録したタイミングになります。
- ホスト名
- ドメイン名
- デバイス名 /dev/sda と警告・エラーの内容
- デバイスの詳細情報 型番やシリアル番号、容量、ファームウェアバージョン等。
- 詳細はsyslogをみて下さい
上記のメールでは「16 Currently unreadable(pending) sectors」が内容になります。読めないということで、エラーかと思います。
これは、無視して良いものでしょうか?
警告やエラーが頻繁に続く場合はデバイスの交換が必要
最初は、数日おきの頻度でメールが来ましたが。
2週間ほど経つと、このように毎日、通知が来るようになりました。
つまり、これは毎日「読めないセクタが存在」している状況です。
これはストレージの故障と言って良いでしょう。
仮にOSやアプリケーションの動作に影響がなくても、ストレージの交換が必要です。現状はエラーの範囲が小さいため、たまたま、うまく動いているに過ぎません。
そのうち故障の範囲が広がり、ファイルシステムのエラー訂正ができないレベルまで大きくなる可能性もあります。
SSDは特に書き込み制限回数近くの通知が必要
Raspberry Piに取り付けたストレージの健康状態をメールで通知するように設定したおかげで、故障の初期状態を知ることができました。
OSやアプリケーションの動作にはまだ影響が無く、ファイルシステムのエラー訂正機能の範疇で、故障が収まっている状態でした。
もしも、そのような通知設定を行わない場合。
故障が進み、実際にOSやアプリケーションの動作に影響が及んでから、故障を知ることになります。
smartdによる通知は、HDDだけではなくSSDでも有効です。
HDDは突然故障する場合もありますが、今回のようにバッドセクタ、読めないセクタが出てきて、徐々に広がって壊れてゆくパターンもあります。
一方、SSDはそのようなセクタは無いため、突然、すべてのデータにアクセスできなくなる場合があります。
SSDの書き込み回数の制限に近づいた場合、このようなsmartdの通知を行っていれば、制限に近づいたことに気づけますが。通知がない場合、実際に書き込み制限回数に達して、データにアクセスできなくなって、気づくことになります。
データにアクセスできるうちに不調に気づくのと、アクセスできなくなってから不調に気づく。
どちらが良いかは、言うまでも無いと思います。
これは、PCやサーバにも言えることです。
HDD,SSDどちらの場合でも、ストレージを使っているのでしたら、smartdによる通知は有効にしておいたほうが良いと思います。
仮にRAIDを導入していれば、実際に大きな故障が発生しても、データが消失しない場合もありますが。2台同時または連続で故障した場合はどうでしょうか?
やはり何よりも、故障の影響が実際に出る前に。故障の初期段階で、通知を受け取ることが重要だと思います。
これは必須です。smartdの通知を設定しましょう。