2.3.2 系のリセット

系のリセットとは,障害が発生した系の入出力を閉塞させるため,システムを強制停止させることです。系のリセットによって,同じ実行サーバが複数の系で稼働することを防ぎます。

HAモニタはaliveメッセージを使用して他系の系障害を監視し,系障害を検知したら系のリセットを要求します。系のリセットでの動作は,実行系と待機系によって異なります。

<この項の構成>
(1) 実行系のリセット(HI-UX/WE2)
(2) 実行系のリセット(AIX)
(3) 実行系のリセット(HP-UX(PA-RISC))
(4) 実行系のリセット(HP-UX(IPF))
(5) 実行系のリセット(Linux(IPF))
(6) 待機系のリセット

(1) 実行系のリセット(HI-UX/WE2)

実行系の系障害を待機系で検出すると,HAモニタはカーネルに実行系のリセットを要求します。

HAモニタからリセット要求を受けたカーネルは,リセットパスで実行系をリセットします。リセットされた系では,無条件にセルフダンプを取得します。

リセットが失敗した場合は,手動でリセットして,ダンプを取得してください。

系のリセットはハードウェアとの連携で実現しているので,HAモニタの環境設定で系ごとに固有のホストアドレスを指定しておきます。これは,TCP/IPのIPアドレスやOSIのMACアドレスではなく,HAモニタの管理者が任意に指定するアドレスです。ホストアドレスのハードウェアへの通知は,HAモニタから指示します。

リセットが完了すると,HAモニタが系切り替えを開始します。

HAモニタが行う系の状態監視と系のリセットの概要を,次の図に示します。

図2-15 系の状態監視と系のリセット(HI-UX/WE2)

[図データ]

(2) 実行系のリセット(AIX)

実行系の系障害を待機系で検出すると,HAモニタはリセットパスを介して実行系のSPにリセットコマンドを発行して実行系のリセットを要求します。

リセットされた系では,OSの設定によって,セルフダンプを取得するかどうかを変更できますが,HAモニタはセルフダンプを取得する設定にしています。詳細は,「4.7 カーネルの設定(AIX)」を参照してください。

リセットが失敗した場合は,手動でリセットして,ダンプを取得してください。

系のリセットはハードウェアとの連携で実現しているので,HAモニタの環境設定で系ごとに固有のホストアドレスを指定しておきます。これは,TCP/IPのIPアドレスやOSIのMACアドレスではなく,HAモニタの管理者が任意に指定するアドレスです。ホストアドレスのハードウェアへの通知は,HAモニタから指示します。

リセットが完了すると,HAモニタが系切り替えを開始します。

HAモニタが行う系の状態監視と系のリセットを,次の図に示します。

図2-16 系の状態監視と系のリセット(AIX)

[図データ]

リセットパスを二重化している場合,系のリセットは,monsetupコマンドで最初に設定したリセットパスを使用して行います。最初に設定したリセットパスが障害の場合に,交代用リセットパスを使用します。リセットパスの障害回復後は,再び最初に設定したリセットパスを使用します。それぞれのリセットパスの状態は,monspコマンドで確認できます。

(3) 実行系のリセット(HP-UX(PA-RISC))

実行系の系障害を待機系で検出すると,HAモニタはリセットパスを介して実行系のGSPにリセットコマンドを発行して実行系のリセットを要求します。

リセットされた系では,HAモニタから発行するリセットコマンドがセルフダンプを取得するコマンドのため,セルフダンプを取得します。

リセットが失敗した場合は,手動でリセットして,ダンプを取得してください。

系のリセットはハードウェアとの連携で実現しているので,HAモニタの環境設定で系ごとに設定したGSPのIPアドレスに対応するホスト名を指定しておきます。また,系ごとに固有のホストアドレスも指定しておきます。これは,TCP/IPのIPアドレスやOSIのMACアドレスではなく,HAモニタの管理者が任意に指定するアドレスです。GSPのIPアドレスおよびHAモニタの環境設定の設定方法については,「3.2 HAモニタの環境設定」および「4.3 障害管理プロセサの設定(HP-UX(PA-RISC))」を参照してください。

リセットが完了すると,HAモニタが系切り替えを開始します。

HAモニタが行う系の状態監視と系のリセットを,次の図に示します。

図2-17 系の状態監視と系のリセット(HP-UX(PA-RISC))

[図データ]

(4) 実行系のリセット(HP-UX(IPF))

実行系の系障害を待機系で検出すると,HAモニタはリセットパスを介して実行系のMPにリセットコマンドを発行して実行系のリセットを要求します。

リセットされた系では,HAモニタから発行するリセットコマンドがセルフダンプを取得するコマンドのため,セルフダンプを取得します。

リセットが失敗した場合は,手動でリセットして,ダンプを取得してください。

系のリセットはハードウェアとの連携で実現しているので,HAモニタの環境設定で系ごとに設定したMPのIPアドレスに対応するホスト名を指定しておきます。また,系ごとに固有のホストアドレスも指定しておきます。これは,TCP/IPのIPアドレスやOSIのMACアドレスではなく,HAモニタの管理者が任意に指定するアドレスです。MPのIPアドレスおよびHAモニタの環境設定の設定方法については,「3.2 HAモニタの環境設定」および「4.4 障害管理プロセサの設定(HP-UX(IPF))」を参照してください。

リセットが完了すると,HAモニタが系切り替えを開始します。

HAモニタが行う系の状態監視と系のリセットを,次の図に示します。

図2-18 系の状態監視と系のリセット(HP-UX(IPF))

[図データ]

(5) 実行系のリセット(Linux(IPF))

実行系の系障害を待機系で検出すると,HAモニタはリセットパスを介して実行系のMPにリセットコマンドを発行して実行系のリセットを要求します。

Linux(IPF)の場合,セルフダンプを取得する機能がないため,系のリセット時にセルフダンプを取得できません。リセットが失敗した場合は,手動でリセットして,系を再起動してください。

系のリセットはハードウェアとの連携で実現しているので,HAモニタの環境設定で系ごとに設定したMPのIPアドレスに対応するホスト名を指定しておきます。また,系ごとに固有のホストアドレスも指定しておきます。これは,TCP/IPのIPアドレスやOSIのMACアドレスではなく,HAモニタの管理者が任意に指定するアドレスです。MPのIPアドレスおよびHAモニタの環境設定の設定方法については,「3.2 HAモニタの環境設定」および「4.5 障害管理プロセサの設定(Linux(IPF))」を参照してください。

リセットが完了すると,HAモニタが系切り替えを開始します。

HAモニタが行う系の状態監視と系のリセットを,次の図に示します。

図2-19 系の状態監視と系のリセット(Linux(IPF))

[図データ]

(6) 待機系のリセット

HAモニタの環境設定のpatrolオペランドに指定した系障害監視時間を超えても待機系からaliveメッセージが送信されなかった場合,実行系のHAモニタは待機系に系障害が発生したと判断します。この場合,実行サーバの業務処理には影響がないため,実行系のHAモニタは何もしません。

ただし,待機系に系障害が発生した状態では,実行系に障害が発生した場合に待機系に系切り替えができなくなるため,待機系の系障害を検出した時点で,実行系のHAモニタに待機系をリセットさせることもできます。系障害時に待機系をリセットするかどうかは,HAモニタの環境設定のstandbyresetオペランドで指定します。なお,待機系のリセットは,1:1系切り替え構成以外では使用しないでください。

待機系の系障害時に待機系がリセットされた場合は,系障害が発生した原因を調査し,対策を取ってください。