スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

ハードディスクの異常を監視するSMARTツールの導入/WD製省電力ハードディスクの問題…

ハードディスクの異常を監視するSelf-Monitoring, Analysis and Reporting Technology略してSMARTというものがありますが、これのモニターツールをDebianにインストールできます。

# apt-get install smartmontools

インストールが済んだら、

# smartctl -a /dev/sda

これで情報を得ることができます。/dev/sda はSMART情報を見たいハードディスクにあわせて書き換えてください。オプションの -a は全ての情報を表示するという意味です。

まあ、SMARTの値に異常が出なくても壊れるときは壊れると言われているので、気休めではありますが、一応確認しておきましょう…

…おかしい。俺のマシン、ひとつ明らかにおかしな数値を返しています。193 Load_Cycle_Count が、49万という数値を叩き出しています。嘘だ、そんな数値になっているはずがない。9 Power_On_Hours が9500時間程度になっているので、一時間に51回もヘッド退避/復帰をしている計算になります。ハードディスクの省電力設定をBIOSやOSで設定できる場合がありますが、それだって30分~一時間アクセスがないと電源を落とすとかそういうものであって (ハードディスクの機械的ストレスになり寿命を縮めかねないと言われているため俺はそれだって設定していない) 、これはどう考えても異常です。何かの間違いじゃないかと思ってもう一回上のsmartctlコマンドをしてみると、この文章を入力している間にも更に3・4数値が上昇しています。

まあ、多分バグだろう、バグじゃないかな…覚悟はしておけ?いやいやいや。やっぱり心配です。何かの故障を示している可能性がありますし、正常な動作だとしても先ほどのwikipediaのページにメーカー保証は通常30万~60万回とありますから、それを超えたらすぐ壊れるというものでもないだろうけれど、既にかなりの負担になっていることは間違いありません。これはまずい。んで、ググってみると。

Western Digital の、省電力を唱った製品に、8秒間アクセスがないとヘッダを退避させるという仕様のものがあるそうです (IntelliParkと呼ぶそうな) 。確かに、俺のハードディスクはWDで、省電力を唱った製品でした。型番はSMARTに表示されます (WD20EARX) が、Greenなんちゃらともあるのでほぼ間違いないでしょう。…そんな仕様だと知っていたら買わなかったよ、ハードディスクは可動部品から壊れやすく、スタートストップやイレギュラーな動作が特に負担をかけるなんて言われているからなあ…買ったときは省電力そのものよりも省電力・低回転による発熱の小ささを期待していたのです、要するに長期間トラブルなしに使えることを期待していたのです。それが裏目に出たって話になりますね。

しかし嘆いてもはじまらない。とにかく、自分のがそれなのか確認しなきゃ、そしてそうなら何とかしなきゃ。ググったところ、よさそうなものを発見。

ReadyNASでWD Caviar Green の IntelliParkを止める (idle3-tools) | azkの日記 | スラッシュドット・ジャパン

idle3-tools、これでこの振る舞いを止められるそう。しかもこれ、Debianのパッケージに含まれています、やった。WD公式のツールもあるみたいですが、これはバグがあるという報告も見られますし、DOS上で動作するツール (Windowsのコマンドプロンプト上では動かないっぽい) ということなので、Linuxユーザーにとっては使い勝手はこっちの方が上でしょう。aptでインストール。

# apt-get install idle3-tools

で、上にリンクしたページとマニュアル (# man idle3ctl) によると -g オプションが現在の数値を出すものとのことなので、確認。

# idle3ctl -g /dev/sda
Idle3 timer set to 80 (0x50)

はい、うちのハードディスクはまさにそれでした。合掌、礼拝、お直りください。原因が分かったこと、この振る舞いが故障そのものではないというだけでも幸せだと考えましょう。とにかくこれ以上命を縮めないように、この機能を無効にしなきゃ。省エネは大切ですが、でもハードディスクを二年程度で死なせていたらそれはそれで省エネじゃないでしょうから。マニュアルと上のページによると -d オプションが無効化を意味するようなので、実行。

# idle3ctl -d /dev/sda
Idle3 timer disabled
Please power cycle your drive off and on for the new setting to be taken into account. A reboot will not be enough!

上にリンクしたページと同じ、このようなメッセージをもらえたので、リブートじゃないシャットダウンと再起動。

んで、Load_Cycle_Count の数値をしばらく監視します。今のところ、シャットダウンや再起動のように明らかに心当たりのあるもの以上に数値が増える様子がないので、これで成功ということでしょう。ちなみに、これがファームウェアに働きかけて完全にこの振る舞いを止めてしまうものなのか、それともLinux上で擬似的にこの動作を止めているだけに過ぎないのかちょっと気になったので、例のWD公式ユーティリティーをダウンロードしてきて、MS-DOS起動用CD(ブートCD)の作成:no-mi_blog:So-netブログ こちらの記事を参考にMS-DOSの起動ディスクを作って WDIDLE3 /R とやってみましたが、timer disabled と返ってきたので、前者だったようです。

しかし、もうメーカー保証値はとっくに超えていました…WDのサイトにあるスペックシートによると、WD20EARXのロード・アンロード保証値は30万回でした。THRESHの0までまだ37残ってはいますが、バックアップしなきゃ。


今回の教訓
SMARTに異常が現れる前に故障することも多いとは言っても、このとおり異常を検知する助けにはなることもあるのでバカにはできない
イレギュラーな動作がハードディスクの負担になるのなら、特段省電力をウリにしているものは警戒した方がいいかも。ノートPCのように熱がこもりやすいものならともかく、デスクトップやサーバーでは。

いずれにせよバックアップは怠ってはいけませんけれどもね。

関連記事

テーマ : ハードウェア
ジャンル : コンピュータ

コメントの投稿

非公開コメント

プロフィール

ざっぱー

Author:ざっぱー
(この画像について)

当ブログについて
メール
(このメールアドレスへの特定電子メール (迷惑メール) の送信はお断りします)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。