Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


2.3.5 系のリセット

系のリセットとは,障害が発生した系の入出力を閉塞させるため,システムを強制停止させることです。系のリセットによって,同じ実行サーバが複数の系で稼働することを防ぎます。

系のリセットは,HAモニタとSPが連携することで実現しています。

HAモニタは系障害を監視し,系障害を検出した時点で系切り替えができる状態だった場合は,系のリセットを要求します。通常は,待機系が,障害が発生した実行系をリセットします(実行系のリセット)。系切り替え構成の種類によっては,実行系が待機系をリセットすることもできます(待機系のリセット)。

メモ

系のリセットに失敗する場合の対処については,「7.5.3 系のリセット失敗に対処する」を参照してください。

〈この項の構成〉

(1) 実行系のリセット

実行系の系障害を待機系で検出すると,HAモニタはリセットパスを介してリセットコマンドを発行し,実行系のSPに実行系のリセットを要求します。リセット時には,システムダンプが取得できる状態であれば,OSの機能によって,リセットされた系のシステムダンプが取得されます。リセットが完了すると,HAモニタが系切り替えを開始します。リセットが失敗した場合は,ユーザが手動でリセットして,システムダンプを取得する必要があります。

HAモニタが行う系の状態監視と系のリセットを,次の図に示します。

図2‒12 系の状態監視と系のリセット

[図データ]

HAモニタは,aliveメッセージを送信し合って,他系の状態監視をします。実行系で系障害が発生すると,待機系のHAモニタは実行系からのaliveメッセージを受信できないため,待機系のHAモニタはSPにリセットを要求します。要求を受けたSPは,系のリセットを指示します。

系のリセットはハードウェアとの連携で実現しているので,系ごとに固有のホストアドレスをHAモニタの環境設定のaddressオペランドで指定しておきます。指定するホストアドレスは,TCP/IPのIPアドレスやOSIのMACアドレスではなく,HAモニタの管理者が任意に指定するアドレスです。

リセットパスにTCP/IP LANを使用する場合は,リセットパスを二重化できます。リセットパスを二重化している場合,系のリセットは,HAモニタの環境設定コマンド(monsetupコマンド)で最初に設定したリセットパスを使用して行われます。最初に設定したリセットパスが障害の場合には,交代用リセットパスが使用されます。リセットパスの障害回復後は,再び最初に設定したリセットパスが使用されます。ユーザがそれぞれのリセットパスの状態を確認するには,SP状態表示コマンド(monspコマンド)を使用します。

リセットパスの設定については,「6.4 リセットパスの設定」を参照してください。

(2) 待機系のリセット

系切り替え構成の種類によっては,実行系やほかの待機系が,待機系をリセットすることがあります。

(a) 1:1系切り替え構成の場合

HAモニタの環境設定のpatrolオペランドに指定した系障害監視時間を超えても待機系からaliveメッセージが送信されなかった場合,実行系のHAモニタは,待機系に系障害が発生したと判断します。この場合,実行サーバでは業務を継続できるため,実行系のHAモニタは何もしません。

ただし,待機系に系障害が発生した状態では,実行系に障害が発生した場合に待機系に系切り替えができません。そのため,待機系の系障害を検出した時点で,実行系のHAモニタに待機系をリセットさせることもできます。系障害時に待機系をリセットするかどうかは,HAモニタの環境設定のstandbyresetオペランドで指定します。なお,待機系のリセットは,1:1系切り替え構成以外では使用しないでください。

待機系の系障害時に待機系がリセットされた場合,オペレータは系障害が発生した原因を調査し,対策を取る必要があります。

(b) 複数スタンバイ構成の場合

複数スタンバイ構成では,一つの実行系に対して複数の待機系があります。待機系に系障害が発生した場合,別の待機系が,障害が発生した待機系をリセットすることがあります。複数スタンバイ構成での系のリセットについては,「4.2.3 複数の待機系がある場合の系のリセット」を参照してください。