Hitachi

 ボリュームミラーリング クイックリファレンス 


1.7.36 正サイトに発生した障害から回復する(外部ストレージシステムを正サイトに設置した場合)

Qurumディスク用外部ストレージシステムを正サイトに設置した場合、正サイトに障害が発生したときは、正サイトのストレージシステムとQuorumディスク用外部ストレージシステムに、同時に障害が発生するおそれがあります。正サイトのストレージシステムとQuorumディスク用外部ストレージシステムに同時に障害が発生すると、GADペアが中断し、GADボリュームへのアクセスが停止します。この場合の回復手順の例を次に示します。

障害回復の概要

[図データ]

障害の部位

発生することのあるSIMのリファレンスコード

GADボリュームへのアクセス可否※1

正サイトのストレージシステム

副サイトのストレージシステム

P-VOL

S-VOL

正サイトのストレージシステムとQuorumディスク用外部ストレージシステムの両方

障害の種類による※2

  • dd0xyy

  • dd2xyy

  • dd3xyy

  • 2180xx

  • 21d0xx

  • 21d2xx

  • ef5xyy

  • efd000

  • ff5xyy

  • def0zz

×

×※3

(凡例)

×:アクセスできない

P-VOL:プライマリボリューム

S-VOL:セカンダリボリューム

注※1

VSP G150, G350, G370, G700, G900VSP F350, F370, F700, F900、またはVSP E990を構成するハードウェア(ドライブ、キャッシュ、CHB、DKBMPBなど)は冗長化されています。冗長化されているハードウェアの一部で障害が発生しても、GADペアが障害によって中断したり、GADボリュームへアクセスできなくなったりすることはありません。また、次のパスを冗長化すると、ハードウェアの一部で障害が発生してもGADペアが障害によって中断したり、GADボリュームへアクセスできなくなったりすることはありません。

  • サーバと正サイトおよび副サイトのストレージシステム間の物理パス

  • 正サイトおよび副サイトのストレージシステムと外部ストレージシステム間の物理パス

  • 正サイトと副サイトのストレージシステム間の物理パス

注※2

障害の種類に応じたSIMが発生します。障害によってSIMを参照できないこともあります。

注※3

セカンダリボリュームのペア状態がSSWSのときに障害が発生した場合は、セカンダリボリュームにアクセスできます。

障害回復の流れ

  1. 交替パスソフトウェアを使用して、GADペアのプライマリボリュームへのパスを削除します。

  2. 副サイトのストレージシステムで、GADペアを強制削除します。

    GADペアを強制削除するときは、仮想LDEV IDを残して、サーバからアクセスできるようにしてください。

    コマンド例:pairsplit -g oraHA -d dev1 -RFV -IH2

  3. 仮想LDEV IDが残っていることを確認します。

    コマンド例:

    raidcom get ldev -ldev_id 0x2222 -fx -IH2
    (略)
    LDEV : 2222
    VIR_LDEV : 1111
    (略)
    
  4. GADペアが削除されたことを確認します。

  5. 交替パスソフトウェアを使用して、GADペアのセカンダリボリュームへのI/Oを再開します。

  6. 障害が発生している正サイトのストレージシステムを回復します。

  7. 正サイトのストレージシステムで、GADペアを強制削除します。

    GADペアを強制削除するときは、仮想LDEV IDを削除して、サーバからアクセスできないようにしてください。

    正サイトのストレージシステムで発生した障害の種別によっては、正サイトのストレージシステムを回復すると、プライマリボリュームのペア状態がSMPLに変わり、仮想属性にGAD予約が割り当てられていることがあります。この場合、GADペアの強制削除は不要です。

    コマンド例:pairsplit -g oraHA -d dev1 -SF -IH1

  8. 仮想LDEV IDが、GAD予約になっていることを確認します。

    コマンド例:

    raidcom get ldev -ldev_id 0x1111 -fx -IH1
    (略)
    LDEV : 1111
    VIR_LDEV : ffff
    (略)
    

    VIR_LDEV : ffffは、GAD予約を示しています。

  9. GADペアが削除されたことを確認します。

  10. 障害が発生している外部ストレージシステムを回復します。

  11. 正サイトと副サイトのストレージシステムの両方から、Quorumディスクを削除します。

    外部ストレージシステムで発生した障害の種別によっては、外部ストレージシステムを回復すると、Quorumディスクが削除されていることがあります。この場合、Quorumディスクの削除は不要です。

  12. 正サイトと副サイトのストレージシステムの両方から、Quorumディスクを追加します。

  13. 副サイトのストレージシステムで、GADペアを再作成します。

    誤ってセカンダリボリュームの仮想LDEV IDを削除すると、再度GADペアを作成できません。raidcom map resource コマンドを使用して、仮想LDEV IDをセカンダリボリュームに再設定してください。

    コマンド例:raidcom map resource -ldev_id 0x2222 -virtual_ldev_id 0x1111 -IH1

    仮想LDEV IDの再設定後に、確認コマンドを使用して、仮想LDEV IDがプライマリボリュームの実LDEV IDと一致していることを確認してください。

  14. 交替パスソフトウェアを使用して、GADペアのプライマリボリュームへのパスを追加し、I/Oを再開します。

  15. 必要に応じて、プライマリボリュームとセカンダリボリュームを入れ替えます。