ストレージサーバの障害

投稿者: | 2011年7月31日

昨日の夕方からストレージサーバの調子が思わしくなく、結局RAID10を構成している
4台のディスクのうち、1台が怪しかったので交換して復旧しました。

/var/log/messages にはこんな感じのメッセージがあふれてました。
ahci関係のエラーは実はちょっと前から出てて、時間有るときディスク買ってきて、
様子を見ようと思ってたのが甘かった。

Jul 30 18:06:33 eggplant kernel: ahcich2: Timeout on slot 26 port 0
Jul 30 18:06:33 eggplant kernel: ahcich2: is 00000000 cs 04000000 ss 00000000 rs 04000000 tfd d0 serr 00000000
Jul 30 18:06:34 eggplant istgt[1157]: istgt_iscsi.c: 793:istgt_iscsi_write_pdu_internal: ***ERROR*** iscsi_write() failed (errno=32)
Jul 30 18:06:34 eggplant istgt[1157]: istgt_iscsi.c:3027:istgt_iscsi_transfer_in_internal: ***ERROR*** iscsi_write_pdu() failed
Jul 30 18:06:34 eggplant istgt[1157]: istgt_iscsi.c:3392:istgt_iscsi_task_response: ***ERROR*** iscsi_transfer_in() failed

RAIDのリビルドするのには、300GBぐらで、1時間30分ぐらい掛かったらしい。

とりあえず、復旧して良かった。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください