昨日の夕方からストレージサーバの調子が思わしくなく、結局RAID10を構成している
4台のディスクのうち、1台が怪しかったので交換して復旧しました。
/var/log/messages にはこんな感じのメッセージがあふれてました。
ahci関係のエラーは実はちょっと前から出てて、時間有るときディスク買ってきて、
様子を見ようと思ってたのが甘かった。
Jul 30 18:06:33 eggplant kernel: ahcich2: Timeout on slot 26 port 0
Jul 30 18:06:33 eggplant kernel: ahcich2: is 00000000 cs 04000000 ss 00000000 rs 04000000 tfd d0 serr 00000000
Jul 30 18:06:34 eggplant istgt[1157]: istgt_iscsi.c: 793:istgt_iscsi_write_pdu_internal: ***ERROR*** iscsi_write() failed (errno=32)
Jul 30 18:06:34 eggplant istgt[1157]: istgt_iscsi.c:3027:istgt_iscsi_transfer_in_internal: ***ERROR*** iscsi_write_pdu() failed
Jul 30 18:06:34 eggplant istgt[1157]: istgt_iscsi.c:3392:istgt_iscsi_task_response: ***ERROR*** iscsi_transfer_in() failed
RAIDのリビルドするのには、300GBぐらで、1時間30分ぐらい掛かったらしい。
とりあえず、復旧して良かった。