2009年11月14日

RAIDのプライマリーHDD故障

今朝、事務所の鍵を開けようと入り口に立つと室内がピーピーとやかましい。

停電か何かでUPSの警報音が鳴っているんだろう。
室内に入り、音源を探ってみると、違っていた。
音源は実験用サーバーのRAID1ユニット(ARAID99 2000)だった。
(RAID1ユニットとは、2台のハードディスクをペアにして使い、常時は2台に同時にデータを書き込む。
ハードディスクの1台が故障しても残りの1台を利用でき、コンピュータを使い続けることができるという優れものだ)
前面の液晶画面には「上部のハードディスクが故障した」(意訳)と表示されている。

やかましいので、ブザーON/OFFボタンを押し込んでブザーをOFFにする。
このユニットはボタンを押し込むとブザーが鳴り止む。面白い。
ブザーをオフにするスイッチと考えるとわかりやすい。

ディスクが1台故障している状態でもサーバーを運用することはできるが、
交換時にディスクアクセスがあると復旧に時間がかかる。cronで30分おきに情報を
読み書きするプログラムを起動していたので、プログラムが起動されないようにする。
(このプログラム画一度移動すると10分間くらいハードディスクへの読み書きが続く)

交換用のHDDを探すとWD1600YS(160GB)とST3200822AS(200GB)しかなかった。
サーバーは160GBだったので、WD1600YSと交換することにした。
RAID1ユニットはSATA IIには非対応なのだが、大丈夫なんだろうか。


トレイをユニットから取り外し、ハードディスクを交換した後、ユニットに戻す。
ハードディスクが無事に認識され、リビルドと呼ばれる、正常なディスクから新しいディスクへの
データコピーが自動的に開始される。
リビルドは結構時間がかかるのだが、今回は2時間程度(早い!)で終了した。
これで、無事に交換修理(?)は完了だ。

忘れていけないことが2つあった。
(1)ブザーをONにするため、ボタンをもう一度押し込み、ボタンが飛び出した状態に戻すこと。
(2)cronで30分おきに起動しているプログラムが元のように起動されるようにすること。

サーバーの起動時間を確認すると441日だった。前回起動する前に2年は使っているので3年以上は使っている計算だ。
よくもった方だと思う。しかし、ハードディスクの故障が起こるのがいつも忙しい時は何でだろう。

予備ディスクも1台になってしまったので、しばらくはディスクの故障が起こらないことを祈った。
ハードウェアRAIDというのはディスクさえあれば本当に楽に対応ができてよい。
内蔵型のソフトウェアRAIDとはえらい違いだ。ソフトウェアRAIDは専用ユニットがいらないので安いんだけど、
何かあった時には、コンピュータのケースを開けてディスクを取り出したりする手間もあり結構面倒くさい。

Posted by 植物お手伝い係 at 14:21│Comments(0)
 
<ご注意>
書き込まれた内容は公開され、ブログの持ち主だけが削除できます。
削除
RAIDのプライマリーHDD故障
    コメント(0)