Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


4.2.3 複数の待機系がある場合の系のリセット

ここでは,複数スタンバイ構成のように,複数の待機系がある場合の系のリセットについて説明します。

〈この項の構成〉

(1) リセット優先度の決定方法

複数の待機系がある場合,系切り替え構成全体に属するすべての系でリセット発行順序を一意に定めるため,リセット優先度を指定します。

HAモニタは,起動時に他系と接続した際,自系のリセット優先度を決定します。リセット優先度は,接続された系の中で,ホストアドレスの小さい系から順に優先度が高くなります。リセット優先度には0から31まであり,0がいちばん高い優先度と見なされます。

ホストアドレスとリセット優先度の関係を次の図に示します。この例では,系3に障害が発生した場合,ホストアドレスのいちばん小さい系1がリセットを発行します。

図4‒13 ホストアドレスとリセット優先度の関係

[図データ]

系障害を検出した場合,リセット優先度が最も高い系がリセットを発行します。他系は,リセット優先度に従ってリセットの発行を一定時間待ちます。このリセット発行の待ち時間は,「各系のリセット優先度×10(秒)」で計算できます。

なお,計算式で示す10秒は,機種によって異なります。

(2) リセット優先度を指定した場合の系のリセット

リセット優先度を指定した場合,系のリセット時に,各系がどう動作するかについて説明します。

系障害を検出した系は,自系のリセット優先度に従って,障害が発生した系にリセットを発行します。さらに接続しているすべての系にリセット発行を依頼します。リセット発行の依頼を受けた系は,自系のリセット優先度に従って,障害系のリセットを発行します。

リセットが成功した場合

リセットが成功した場合,リセットを発行した系は,すべての系に対してリセットの成功を通知します(リセット成功通知)。系切り替えをする待機サーバがあれば,系切り替えをします。

リセット成功通知を受信した系は,障害が発生した系に対してリセット発行待ちの状態であればリセット発行待ちを中断します。系切り替えをする待機サーバがあれば,系切り替えをします。

リセットが失敗した場合

リセットが失敗した場合,リセットを発行した系は他系からのリセット成功通知を待ちます。

(3) ある待機系からの系のリセットが失敗した場合の動作

待機系からの系のリセットが失敗した場合,複数の待機系があるため,自動的に系切り替えができます。ここでは,ある待機系からの系のリセットが失敗した場合のリセットについて,例を用いて説明します。この例では,系2で障害が発生した場合で,系1からのリセットが失敗し,リセット発行待ち時間が過ぎたら系3がリセットを発行する流れを説明します。複数の待機系がある系切り替え構成で,系のリセットが失敗した場合の系のリセットを次の図に示します。

図4‒14 複数の待機系がある系切り替え構成で,系のリセットが失敗した場合の系のリセット

[図データ]

次に,リセット優先度を指定した場合のリセットの発行の流れの詳細を説明します。番号は,上記の図と対応しています。

  1. リセット指示とリセット依頼

    いちばん高いリセット優先度を持つ系1は,系2の系障害を検出すると,系2にリセットを指示します。また,他系に対してリセットを依頼します。

    系3は,系2の系障害を検出すると,系2のリセット発行を待ちます。

  2. リセット失敗

    系1からのリセット指示が失敗した場合,系1は他系からのリセット成功通知を待ちます。

  3. リセット指示

    系1からのリセット成功通知がなく,リセット優先度に応じたリセット待ち時間が過ぎると,系3は系2にリセットを指示します。

  4. リセット成功通知と系切り替え

    リセットが成功した場合,系3は,他系にリセット成功を通知し,系切り替えができる待機サーバがあれば,系切り替えをします。