Hitachi

 ボリュームミラーリング クイックリファレンス 


1.7.32 新しい外部ストレージシステムと交換して障害から回復する

故障した外部ストレージシステムと、新しい外部ストレージを交換することで、GADペアを削除しないで、Quorumディスクの障害から回復できます。

〈この項の構成〉

(1) 新しい外部ストレージシステムと交換する

故障した外部ストレージシステムと、新しい外部ストレージを交換する手順を次に示します。

障害回復の概要

[図データ]

障害回復の流れ

注意

GADペアが同じQuorumディスクIDに指定されていない場合、いったんQuorumディスクを削除したあとに、Quorumディスクを再度作成してください。GADペアが同じQuorumディスクIDに指定されていないまま、新しいQuorumディスクに交換すると、正しくQuorumディスクを交換できないことがあります。Quorumディスクを再度作成したあとは、必要に応じてGADペアを作成してください。

  1. Quorumディスクを用意します。

    1. 外部ストレージシステムのディスクをフォーマットします。

    2. 外部ストレージシステムのディスクを、正サイトと副サイトのストレージシステムにマッピングします。

      作業の流れは、Quorumディスクを作成する流れと同じです。ただし、外部ボリュームをQuorumディスクに設定する作業は不要です。詳細は、関連概念を参照してください。

  2. Quorumディスクの状態を確認します。

    1. 正サイトのストレージシステムで、Quorumディスクの状態がBlockedになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH0
      QRDID : 1
      LDEV : 2045
      QRP_Serial# : 411111
      QRP_ID : M8
      Timeout(s) : 30
      STS : BLOCKED
    2. 副サイトのストレージシステムで、Quorumディスクの状態がBlockedになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH1
      QRDID : 1
      LDEV : 2045
      QRP_Serial# : 422222
      QRP_ID : M8
      Timeout(s) : 30
      STS : BLOCKED
  3. Quorumディスク閉塞時のペア動作モードを確認し、必要に応じてGADペアを分割します。

    1. Quorum ディスク閉塞時のペア動作モードを確認します。

      コマンド例:
      # pairdisplay -g oraHA -fcxe -d dev0
      Group PairVol(L/R) (Port#,TID, LU),Seq#,LDEV#.P/S,Status,Fence,%,
      P-LDEV# M CTG JID AP EM E-Seq# E-LDEV# R/W QM
      oraHA dev0(L) (CL1-C-0, 0, 0) 411111 400.P-VOL PAIR NEVER,100
      500 - - 0 1 - - - L/M AA
      oraHA dev0(R) (CL7-C-0,28, 0) 422222 500.S-VOL PAIR NEVER,100
      400 - - 0 1 - - - L/M AA
      

      QMAAの場合は、手順4に進みます。QMAA以外の場合は、手順b.に進みます。

    2. GADペアが分割されていない場合は、GADペアを分割します。

      コマンド例:
      pairsplit -g oraHA -IH0
  4. Quorumディスク用の外部ボリュームを、新しいQuorumディスク用の外部ボリュームと交換します。

    1. 正サイトのストレージシステムで、現在のQuorumディスク用の外部ボリュームを、新しいQuorumディスク用の外部ボリュームと交換します。

      コマンド例:
      raidcom replace quorum -quorum_id 1 -ldev_id 1234 -IH0
    2. 正サイトのストレージシステムで、Quorumディスクの状態がReplacingになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH0
      QRDID : 1
      LDEV : 1234
      QRP_Serial# : 411111
      QRP_ID : M8
      Timeout(s) : 30
      STS : REPLACING
    3. 副サイトのストレージシステムで、現在のQuorumディスク用の外部ボリュームを、新しいQuorumディスク用の外部ボリュームと交換します。

      コマンド例:
      raidcom replace quorum -quorum_id 1 -ldev_id 1234 -IH1
    4. 副サイトのストレージシステムで、Quorumディスクの状態がReplacingになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH1
      QRDID : 1
      LDEV : 1234
      QRP_Serial# : 422222
      QRP_ID : M8
      Timeout(s) : 30
      STS : REPLACING
    メモ

    raidcom replace quorumコマンドが正常に実行された場合、数秒でQuorumディスクの状態がReplacingに変わります。数分経過しても、Quorumディスクの状態がBlockedから変わらない場合は、お問い合わせ先に連絡してください。

  5. 手順3.でGADペアを分割した場合、GADペアを再同期します。

    コマンド例:
    pairresync -g oraHA -IH0
  6. Quorumディスクの状態がNormalになっていることを確認します。

    1. 正サイトのストレージシステムで、Quorumディスクの状態がNormalになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH0
      QRDID : 1
      LDEV : 1234
      QRP_Serial# : 411111
      QRP_ID : M8
      Timeout(s) : 30
      STS : NORMAL
    2. 副サイトのストレージシステムで、Quorumディスクの状態がNormalになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH1
      QRDID : 1
      LDEV : 1234
      QRP_Serial# : 422222
      QRP_ID : M8
      Timeout(s) : 30
      STS : NORMAL

    raidcom replace quorumコマンドが正常に実行された場合、1分以内にQuorumディスクの状態がNormalに変わります。5分経過しても、Quorumディスクの状態がReplacingから変わらない場合は、ストレージシステム間のリモートパスの状態が正常であることを確認してください。また、手順5.でGADペアを再同期した場合、正常に同期していることを確認してください。

    メモ

    ストレージシステムの障害などによって、Quorumディスクの状態がReplacingからNormalに変わった場合、障害が発生していないストレージシステムのQuorumディスクの状態が、5分経過してもReplacingから変わらないことがあります。この場合、障害回復後にGADペアを再同期すると、Normalに変わります。

    Quorumディスク交換後、QuorumディスクIDにGADペアが割り当たっていない場合も、Quorumディスクの状態がReplacingから変わりません。この場合、Quorumディスクを削除してQuorumディスクを作成したあとに、GADペアを作成することを推奨します。Quorumディスクを削除しないでGADペアを作成する場合は、GADペアを作成後、もう一度手順6.を実施してください。

    これらを実行しているにも関わらず、Quorumディスクの状態がReplacingから変わらない場合は、お問い合わせ先に連絡してください。

    メモ

    Quorumディスクの状態がFailedの場合は、交換先のQuorumディスクが、正サイトのストレージシステムと副サイトのストレージシステムでそれぞれ異なっているおそれがあります。正サイトのストレージシステムと副サイトのストレージシステムで、同じQuorumディスクに接続するように外部ボリュームを指定して、Quorumディスクの状態のFailedを解決してください。詳細は、関連概念を参照してください。同じQuorumディスクに接続するように外部ボリュームを指定したあとは、手順5以降の手順を実施してください。

(2) Quorumディスクの状態のFailedを解決する手順例

交換先のQuorumディスクが、正サイトのストレージシステムと副サイトのストレージシステムでそれぞれ異なると、Quorumディスクの状態がFailedになります。この場合、Quorumディスクとの接続を切断したあと、新しいQuorumディスク用の外部ボリュームと交換してください。

  1. Quorumディスクの状態を確認します。

    1. 正サイトのストレージシステムで、Quorumディスクとの接続を切断します。

      コマンド例:
      raidcom disconnect external_grp -ldev_id 0x2045 -IH0
    2. 副サイトのストレージシステムで、Quorumディスクとの接続を切断します。

      コマンド例:
      raidcom disconnect external_grp -ldev_id 0x2045 -IH1
  2. Quorumディスクとの接続が切断されていることを確認します。

    1. 正サイトのストレージシステムで、Quorumディスクとの接続が切断されていることを確認します。

      コマンド例:
      raidcom get path -path_grp 1 -IH0
      PHG GROUP STS CM IF MP# PORT   WWN                 PR LUN PHS  Serial# PRODUCT_ID LB PM
        1 1-1   DSC E  D    0 CL5-A  50060e8007823520     1   0 NML  433333  VSP Gx00   N M
    2. 副サイトのストレージシステムで、Quorumディスクとの接続が切断されていることを確認します。

      コマンド例:
      raidcom get path -path_grp 1 -IH1
      PHG GROUP STS CM IF MP# PORT   WWN                 PR LUN PHS  Serial# PRODUCT_ID LB PM
        1 1-2   DSC E  D    0 CL5-C  50060e8007823521     1   0 NML  433333  VSP Gx00   N M
  3. Quorumディスク用の外部ボリュームを、新しいQuorumディスク用の外部ボリュームと交換します。

    1. 正サイトのストレージシステムで、現在のQuorumディスク用の外部ボリュームを、新しいQuorumディスク用の外部ボリュームと交換します。

      コマンド例:
      raidcom replace quorum -quorum_id 1 -ldev_id 1234 -IH0
    2. 正サイトのストレージシステムで、Quorumディスクの状態がReplacingになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH0
      QRDID : 1
      LDEV : 1234
      QRP_Serial# : 411111
      QRP_ID : M8
      Timeout(s) : 30
      STS : REPLACING
    3. 副サイトのストレージシステムで、現在のQuorumディスク用の外部ボリュームを、新しいQuorumディスク用の外部ボリュームと交換します。

      コマンド例:
      raidcom replace quorum -quorum_id 1 -ldev_id 1234 -IH1
    4. 副サイトのストレージシステムで、Quorumディスクの状態がReplacingになっていることを確認します。

      コマンド例:
      raidcom get quorum -quorum_id 1 -IH1
      QRDID : 1
      LDEV : 1234
      QRP_Serial# : 422222
      QRP_ID : M8
      Timeout(s) : 30
      STS : REPLACING
      メモ

      raidcom replace quorumコマンドが正常に実行された場合、数秒でQuorumディスクの状態がReplacingに変わります。数分経過しても、Quorumディスクの状態がFailedから変わらない場合は、お問い合わせ先に連絡してください。