トピックス記事     カテゴリ :ネットとサーバー

debian GNU/Linux のRAIDから不具合通知メール

RAIDに不具合が発生すると、 /etc/mdadm/mdadm.conf の MAILADDR に設定したメールアドレスに通知が届く。

Debian のRAID不具合で届くメール

X-Original-To: raidadmin@example.jp
Delivered-To: raidadmin@example.jp
From: mdadm monitoring <root@debian.example.jp>
To: raidadmin@example.jp
Subject: DegradedArray event on /dev/md2:debian
Date: Fri, 23 Oct 2009 16:29:26 +0900 (JST)

This is an automatically generated mail message from mdadm
running on debian

A DegradedArray event had been detected on md device /dev/md0.   <- md0が異常

Faithfully yours, etc.

P.S. The /proc/mdstat file currently contains the following:

Personalities : [raid1]
md4 : active raid1 sdb7[1]   <- secondaryしかない
1349312 blocks [2/1] [_U]   <- primaryが動いていない

md3 : active raid1 sdb6[1]   <- secondaryしかない
29294400 blocks [2/1] [_U]   <- primaryが動いていない

md2 : active raid1 sdb5[1]   <- secondaryしかない
497856 blocks [2/1] [_U]   <- primaryが動いていない

md1 : active raid1 sdb3[1]   <- secondaryしかない
7815552 blocks [2/1] [_U]   <- primaryが動いていない

md0 : active raid1 sdb2[1]   <- secondaryしかない
248896 blocks [2/1] [_U]   <- primaryが動いていない

unused devices:
片側のHDDが動作不良になったときは、同内容のメールが不具合が生じたアレイの数だけ届く。

RAIDに不具合が生じたときの HDD交換

不具合が生じた HDDを、新しい HDDに入れ替えて稼働させる。
installのときスペアデバイスを用意しておくと作業が簡単になる。

片肺になったとき復旧できなければ RAIDにした意味がない。Hot Swapでコケたら泣くに泣けないので一度止める。
.....Cobalt Qube では入れ替えるだけでrebootすれば再構築してくれたのだが...。
交換手順
  1. 故障したHDDをアレイから外す。
  2. shutdown する。
  3. 不具合が生じた HDDを外す。
  4. 新しい HDD(スペアデバイス)を取り付ける。
  5. 起動する。
  6. 追加 HDD に、アレイに合わせた Pertitionを切る。
  7. 追加 HDDをアレイに組込む。
  8. 同期を確認する。
  9. 追加した HDDに GRUBの設定を行う。
primaryで不具合が発生したとき、primaryにスペアデバイスを取り付けても構わない。
master(primary)でのみ bootするハードウェアならば、動作している HDD を master(primary)に入れ替え、新しい HDDを slaveに入れる。BIOSの変更で起動ディスクを変更できればそれでもいい。

不具合が発生した状態で再起動すると起動メッセージに次のような警告が現れる。
madam:/dev/md0 has been stared with 1 drive (out of 2)
madam:/dev/md1 has been stared with 1 drive (out of 2)
スペアデバイスのアレイを装着し、デバイスを追加する。
# mdadm /dev/md0 -a /dev/sda2   <- デバイスを追加する

........略........
UUID : ccad581e:255c5ff1:6c782c16:d0cdbe79
Events : 0.1057

Number Major Minor RaidDevice State
2 3 2 0 spare rebuilding /dev/sda2   <- 構成に入った
1 3 2 1 active sync /dev/sdb2
同期の状態を確認する。
# cat /proc/mdstat

Personalities : [raid1]
md3 : active raid1 sda6[0] sdb6[1]
5855616 blocks [2/2] [UU]

md2 : active raid1 sda5[2] sdb5[1]
29294400 blocks [2/1] [_U]
[==>..................] recovery = 11.6% (340416/29294400) finish=3.5min speed=19394K/sec

md1 : active raid1 sda3[0] sdb3[1]
7815552 blocks [2/2] [UU]

md0 : active raid1 sda2[0] sdb2[1]
248896 blocks [2/2] [UU]

unused devices:
HDDの作動LEDの点灯状態で、同期の終了を知ることができる。watch コマンドを使うのもいい。
# watch -n30 cat /proc/mdstat   <- 30秒ごとに mdstatを表示

まっさらなHDDを組み込むときは、fdiskでパーティションを切ってからアレイに追加する。

Comments

Add Comment

このアイテムは閲覧専用です。コメントの投稿、投票はできません。
 
Copyright | 8 Peaks Inc. | Saku City NAGANO | 0267-82-7082 | Back to top