1.12.32 移行元の正サイトのプライマリボリュームの障害(LDEV閉塞)から回復する手順例
「1.12.29 障害発生前の状態」に示した、それぞれの状態で、移行元のUR正サイトのプライマリボリュームに障害(LDEV閉塞)が発生した場合の回復手順を説明します。
- 〈この項の構成〉
(1) 「移行作業中」のデータ移行中状態で発生した、移行元のURプライマリボリューム障害
障害発生前後のペアの状態の変化を、次に示します。
ペアの種類 |
障害発生前のペア状態 |
障害発生後のペア状態 |
||
---|---|---|---|---|
P-VOL |
S-VOL |
P-VOL |
S-VOL |
|
GADペア |
COPY(Local) |
COPY(Block) |
PSUE(Local) | PSUE(Block) |
移行元のURペア |
PAIR |
PAIR |
PSUE |
PSUE |
- (凡例)
-
P-VOL:プライマリボリューム
S-VOL:セカンダリボリューム
この障害に対する回復では、サーバからのI/Oを継続させるために、移行元のUR副サイトのセカンダリボリュームがI/O受け付け可能となるようにペア操作します。対象ペア復旧後のセカンダリボリュームのデータを用いて元の構成へ復旧させます。
以降の回復手順は、ジャーナル内で複数のペアがある中で、1つのボリューム障害が発生したことを想定したものです。
障害回復の概要
障害回復の流れ
-
サーバから移行元のUR正サイトのストレージシステムの障害対象のペアが属するジャーナルへのI/Oを停止します。
-
移行元のUR副サイトから、セカンダリボリュームを指定してURペアを中断(スワップサスペンド)します。
コマンド例:pairsplit -g oraUR00 -RS -IH2
-
サーバから移行元のUR副サイトのストレージシステムへのI/Oを開始します。
-
移行元のUR正サイトのプライマリボリューム障害の対象URペアを削除します。
コマンド例:pairsplit -g oraUR00 -d dev00 -S -IH1
-
移行元のUR正サイトのプライマリボリューム障害の対象GADペアを、プライマリボリューム指定で削除します。
コマンド例:pairsplit -g oraHA00 -d dev10 -S -IH1
-
移行元のUR正サイトのプライマリボリュームの障害を取り除き回復します(フォーマットによる回復が必要な場合はフォーマットします)。
-
障害対象となったURペアが属するジャーナルを使用する他のURペアと連携するGADペアを、プライマリボリューム指定でペア分割します。
コマンド例:pairsplit -g oraHA00 -IH1
-
移行元のUR副サイトから、セカンダリボリュームを指定して、URペアを再同期(スワップリシンク)します。
コマンド例:pairresync -g oraUR00 -swaps -IH2
移行元のURペアは、正サイトのボリュームがセカンダリボリュームに、副サイトのボリュームがプライマリボリュームに変わります。
-
移行元のUR副サイトから、障害から回復したボリュームを使用するURペアを形成します。
コマンド例:paircreate -g oraUR00 -d dev00 -f async -vl -jp 0 -js 0 -IH2
-
URのペア状態がPAIRに変わったことを確認します。
-
サーバから移行元のUR副サイトのストレージシステムへのI/Oを停止します。
-
移行元のUR正サイトから、セカンダリボリュームを指定して、URペアを中断(スワップサスペンド)します。
コマンド例:pairsplit -g oraUR00 -RS -IH1
-
サーバから移行元のUR正サイトのストレージシステムへのI/Oを再開します。
-
移行元のUR正サイトから、セカンダリボリュームを指定して、URペアを再同期(スワップリシンク)します。
コマンド例:pairresync -g oraUR00 -swaps -IH1
移行元のURペアは、正サイトのボリュームがプライマリボリュームに、副サイトのボリュームがセカンダリボリュームに変わります。
-
URのペア状態がPAIRに変わったことを確認します。
-
移行元のUR正サイトから、GADペアを再同期します。
コマンド例:pairresync -g oraHA00 -IH1
-
障害から回復したボリュームに対するGADペアを形成します。
コマンド例:paircreate -g oraHA00 -d dev10 -f never -vl -jq 0 -IH1
(2) 「移行作業中」のデータ移行完了後状態で発生した、移行元のURプライマリボリューム障害
障害発生前後のペアの状態の変化を、次に示します。
ペアの種類 |
障害発生前のペア状態 |
障害発生後のペア状態 |
||
---|---|---|---|---|
P-VOL |
S-VOL |
P-VOL |
S-VOL |
|
GADペア |
PAIR(Mirror(RL)) |
PAIR(Mirror(RL)) |
PSUE(Block)※2 |
SSWS(Local)※2 |
移行元のURペア |
PAIR |
PAIR |
PSUE※3 |
PSUE※3 |
移行先のURペア※1 |
COPY /PAIR |
COPY /PAIR |
COPY /PAIR |
COPY /PAIR |
- (凡例)
-
P-VOL:プライマリボリューム
S-VOL:セカンダリボリューム
- 注※1
- 移行先のURペアが形成されていた場合のペア状態です。
- 注※2
- 障害が発生したボリュームを使用しているペアが、サーバからI/Oを受けたときの状態です。それ以外の場合は、障害発生前のペア状態と同じです。
- 注※3
-
障害が発生したボリュームを使用しているペアが、サーバからI/Oを受けたときのペア状態です。このURペアのエラーレベルを「ミラー」に設定している場合は、ミラーに属するすべてのURペアが、このペア状態になります。
この障害に対する回復では、既存の移行元のURの環境をシステムの回復に利用します。サーバからのI/Oを継続させるために、移行元のUR副サイトのセカンダリボリュームがI/O受け付け可能となるようにペア操作します。その後、正サイトを回復させてから、セカンダリボリュームのデータを用いて元の構成へ復旧させます。
障害回復の概要
障害回復の流れ
移行先のURペアがない場合は、移行先のURペアへの手順をスキップしてください。
-
サーバから移行元のUR正サイトのストレージシステムの障害対象のペアが属するジャーナルへのI/Oを停止します。
-
移行元のUR副サイトから、セカンダリボリュームを指定してURペアを中断(スワップサスペンド)します。
コマンド例:pairsplit -g oraUR00 -RS -IH2
-
サーバから移行元のUR副サイトのストレージシステムへI/Oを開始します。
-
移行元のUR正サイトのプライマリボリューム障害の対象URペアを削除します。
コマンド例:pairsplit -g oraUR00 -d dev00 -S -IH1
-
移行元のUR正サイトのプライマリボリューム障害の対象GADペアを、プライマリボリュームの仮想LDEV IDが残るように指定して、強制削除します。
コマンド例:pairsplit -g oraHA00 -SFV -d dev10 -IH1
-
プライマリボリューム障害の対象GADペアに連携していた移行先のURペアを削除します。
コマンド例:pairsplit -g oraUR01 -d dev20 -S -IH3
-
移行元のUR正サイトのプライマリボリューム障害の対象GADペアを、セカンダリボリュームの仮想LDEV IDが残らないように指定して、強制削除します。
コマンド例:pairsplit -g oraHA00 -RF -d dev10 -IH3
-
移行元のUR正サイトのプライマリボリュームの障害を取り除き回復します(フォーマットによる回復が必要な場合はフォーマットします)。
-
障害対象となったURペアが属するジャーナルを使用する他のURペアと連携するGADペアを、プライマリボリューム指定でペア分割します。
コマンド例:pairsplit -g oraHA00 -IH1
-
移行先のUR正サイトから、プライマリボリュームを指定して、URペアを分割します。
コマンド例:pairsplit -g oraUR01 -IH3
-
移行元のUR副サイトから、セカンダリボリュームを指定して、URペアを再同期(スワップリシンク)します。
コマンド例:pairresync -g oraUR00 -swaps -IH2
移行元のURペアは、正サイトのボリュームがセカンダリボリュームに、副サイトのボリュームがプライマリボリュームに変わります。
-
移行元のUR副サイトから、障害から回復したボリュームを使用するURペアを形成します。
コマンド例:paircreate -g oraUR00 -d dev00 -f async -vl -jp 0 -js 0 -IH2
-
URのペア状態がPAIRに変わったことを確認します。
-
サーバから移行元のUR副サイトのストレージシステムへのI/Oを停止します。
-
移行元のUR正サイトから、セカンダリボリュームを指定して、URペアを中断(スワップサスペンド)します。
コマンド例:pairsplit -g oraUR00 -RS -IH1
-
サーバから移行元のUR正サイトのストレージシステムへI/Oを再開します。
-
移行元のUR正サイトから、セカンダリボリュームを指定して、URペアを再同期(スワップリシンク)します。
コマンド例:pairresync -g oraUR00 -swaps -IH1
移行元のURペアは、正サイトのボリュームがプライマリボリュームに、副サイトのボリュームがセカンダリボリュームに変わります。
-
URのペア状態がPAIRに変わったことを確認します。
-
移行元のUR正サイトから、GADペアを再同期します。
コマンド例:pairresync -g oraHA00 -IH1
-
障害から回復したボリュームに対するGADペアを形成します。
コマンド例:paircreate -g oraHA00 -f never -vl -jq 0 -d dev10 -IH1
-
すべてのGADのペア状態がPAIRに変わったことを確認します。
-
移行先のUR正サイトから、URペアを再同期します。
コマンド例:pairresync -g oraUR01 -IH3
-
障害が発生したGADペアに連携するための移行先URペアを形成します。
コマンド例:paircreate -g oraUR01 -d dev20 -f async -vl -jp 0 -js 0 -IH3
(3) 「移行完了後」の移行元URペア撤去前状態で発生した、移行元のURプライマリボリューム障害
障害発生前後のペアの状態の変化を、次に示します。
ペアの種類 |
障害発生前のペア状態 |
障害発生後のペア状態 |
||
---|---|---|---|---|
P-VOL |
S-VOL |
P-VOL |
S-VOL |
|
GADペア |
PAIR(Mirror(RL)) |
PAIR(Mirror(RL)) |
PSUE(Block)※1 |
SSWS(Local)※1 |
移行元のURペア |
PAIR |
PAIR |
PSUE※2 |
PSUE※2 |
移行先のURペア |
PAIR |
PAIR |
PAIR |
PAIR |
- (凡例)
-
P-VOL:プライマリボリューム
S-VOL:セカンダリボリューム
- 注※1
-
障害が発生したボリュームを使用しているペアが、サーバからI/Oを受けたときの状態です。それ以外の場合は、障害発生前のペア状態です。
- 注※2
-
障害が発生したボリュームを使用しているペアが、サーバからI/Oを受けたときのペア状態です。このURペアのエラーレベルを「ミラー」に設定している場合は、ミラーに属するすべてのURペアが、このペア状態になります。
この障害に対する回復では、URのリモートコピーのシステム環境の移行が完了しているため、移行元のURのシステム環境の撤去を実施してから、回復操作を実施します。
障害回復の概要
障害回復の流れ
-
障害ボリューム以外のGADペアを、セカンダリボリューム指定でペア中断(スワップサスペンド)します。
コマンド例:pairsplit -g oraHA00 -RS -IH3
-
移行元のURペアを削除します。
-
GADペアのセカンダリボリュームに仮想LDEV IDを残すように指定して、GADペアを削除します。
コマンド例:pairsplit -g oraHA00 -R -IH3
- 移行元のUR正サイトのボリュームの障害を取り除き回復します(フォーマットによる回復が必要な場合はフォーマットします)。