2018年11月10日土曜日

openmediavalut zfs ディスク障害 そしてreplace

ある時、ふと思い立って、本当に久しぶりにログインしてみた。

ふむふむ、zfsのステータスがDEGRADEDとな。。。。
ググってみたら。。。
---引用
DEGRADED
仮想デバイスで障害が発生しましたが、デバイスはまだ動作しています。この状態は、ミラーデバイスまたは RAID-Z デバイスを構成するデバイスのうち、1 つ以上のデバイスが失われたときによく発生します。プールの耐障害性が損なわれる可能性があります。別のデバイスで続けて障害が発生した場合には、回復できない状態になることがあります。
--引用終わり
ん?
なぬ???DEGRADED???
さらっと書いてあるけど要するに1台死んでるけど、今わ何とか動いてるよ、でも、もう1台ダメになったらデータ帰ってこないよっていうことじゃない??

え、そりゃやばい。。。
デバイスをみてみると。。。
なんか、ディスクが足りないような・・・・・
回復してみてみたら、WDのHDDが回転しておらず完全に逝ってました。

暗い気持ちで、さて、復旧ってどうやるんだっけ?
というわけで、replace するまでのメモ書き

新しいHDDを買ってきて・・・・
まずは
 zpool status -x
  pool: tank1
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Nov 10 11:28:53 2018
    462G scanned out of 5.31T at 27.4M/s, 51h45m to go
    154G resilvered, 8.49% done
config:

        NAME                                   STATE     READ WRITE CKSUM
        tank1                                  DEGRADED     0     0     0
          raidz1-0                             DEGRADED     0     0     0
            replacing-0                        UNAVAIL      0     0     0
              16086014737414349741             UNAVAIL      0     0     0  was /dev/sda2
              ata-ST3000DM007-1WY10G_WFN0B2QY  ONLINE       0     0     0  (resilvering)
            sdd                                ONLINE       0     0     0
            sdb                                ONLINE       0     0     0

errors: 1 data errors, use '-v' for a list

上記はすでにreplace中のときのだけど、、、

新しいHDDに交換したら、実際のコマンドは

#zpool replace tank1 16086014737414349741 ata-ST3000DM007-1WY10G_WFN0B2QY

16086014737414349741は、UNAVAILとなったディスクらしい
そして、後ろの ata-ST3000DM007-1WY10G_WFN0B2QYは
コマンド
# ls /dev/disk/by-id/
で表示された中から、新しく交換したHDDの名称
ata-ST3000DM001-1ER166_Z502G1VR                   wwn-0x5000039fe3c937b9
ata-ST3000DM001-1ER166_Z502G1VR-part1             wwn-0x5000039fe3c937b9-part1
ata-ST3000DM001-1ER166_Z502G1VR-part2             wwn-0x5000039fe3c937b9-part2
ata-ST3000DM007-1WY10G_WFN0B2QY                   wwn-0x5000c50087de04e7
ata-ST3000DM007-1WY10G_WFN0B2QY-part1             wwn-0x5000c50087de04e7-part1
ata-ST3000DM007-1WY10G_WFN0B2QY-part9             wwn-0x5000c50087de04e7-part2
ata-TOSHIBA_DT01ACA300_Y5QN8LSGS                  wwn-0x5000c500ba1cc85d
ata-TOSHIBA_DT01ACA300_Y5QN8LSGS-part1            wwn-0x5000c500ba1cc85d-part1
ata-TOSHIBA_DT01ACA300_Y5QN8LSGS-part2            wwn-0x5000c500ba1cc85d-part9
ata-WDC_WD2500BEVT-08A23T1_WD-WXC1A21W5817        wwn-0x50014ee25afc3d48
ata-WDC_WD2500BEVT-08A23T1_WD-WXC1A21W5817-part1  wwn-0x50014ee25afc3d48-part1
ata-WDC_WD2500BEVT-08A23T1_WD-WXC1A21W5817-part2  wwn-0x50014ee25afc3d48-part2
ata-WDC_WD2500BEVT-08A23T1_WD-WXC1A21W5817-part5  wwn-0x50014ee25afc3d48-part5

そうそう、新しくつないだら、openmediavaultでちゃんとフォーマットしておかないとダメです。
ファイルシステム→作成→デバイスを選んで、ext4でフォーマットです。

それでは、あと50時間、ちゃんと復旧しますように!!!