はじめてHDDクラッシュ

我が家では Linux サーバに RAID-5 の箱を詰め込んでおりますが,どうやらはじめてディスクがクラッシュしたようです!!!
使っているのは,Areca ARC-5010
朝っぱらから携帯にメールが飛んできて,行ってみると,ぴーぴーと BEEP がなっている.ちょっとわくわくしてきました.
早速,朝から年休とって新しい HDD を買ってこよう!!!

新しい HDD 買ってきた

午前休みをいただいて,新しい HDD を買ってきました.
今までは HDS722525VLAT80 (ATA 250GB) x5 で RAID-5構成してましたが,今後は一つだけ HDS722525VLAT80 (250GB)が混じっているというかっこわるい構成になりました!!
今こんな感じ.

Raid Set Hierarchy
Raid Set        IDE Channels Volume Set(Ch/Drv#)    Volume State     Capacity
Raid Set # 00 	Ch01         Volume Set # 00 (0/0)  Rebuilding(0.5%) 1000.0GB
                Ch02← 	  	  	 
                Ch03  	  	  	 
                Ch04  	  	  	 
                Ch05  	  	  	 
IDE Channels
Channel Usage           Capacity        Model
Ch01    Raid Set # 00   250.1GB         HDS722525VLAT80
Ch02    Raid Set # 00   250.1GB         Hitachi HDP725025GLAT80
Ch03    Raid Set # 00   250.1GB         HDS722525VLAT80
Ch04    Raid Set # 00   250.1GB         HDS722525VLAT80
Ch05    Raid Set # 00   250.1GB         HDS722525VLAT80

ホットスワップはらくでいいですね.Linux立ち上がったままで引っこ抜いてさしてOKだから.ちなみに,RAID-1やRAID-5なんかでは,ホットスワップに対応しているならオンライン(起動)状態でディスク交換したほうが確実でごいす.というのも,電源を切ってしまうと,RAIDコントローラが どのディスクに障害があって どのディスクに障害がないのか わからなくなって,障害ディスクをマスタとして,正常なディスクに間違ったリビルドを仕掛けるという珍現象が起きうるからです.特に論理的な障害だとこういうことがたまに起きます.事実,私はこれでRAIDボリュームを破壊してしまったことがあります(RAIDコントローラ自体はRAIDボリュームを正しく作ってるつもりだけど,中身が全部壊れている状態).

リビルド始まったけどまだまだ怖い

リビルドが完了していない現時点の恐怖.

  • 現時点で正常とされている残り4台のディスクに顕在化していない障害があり,リビルドに失敗する.
  • これらのディスクはほぼ同ロットなので,立て続けに故障し,同時に2台壊れる.

こわいなぁ.