Hitachi

高信頼化システム監視機能 HAモニタ Linux(R)(x86)編


4.5.1 系障害の検出(マルチスタンバイ)

ここでは,系障害の検出と系のリセット,系障害の検出とSCSIリザーブ,および系障害の検出とLANの通信可否による系切り替え制御機能について,マルチスタンバイ機能を使用しない場合と比べて異なる点だけについて説明します。

マルチスタンバイ機能を使用する系切り替え構成では,複数の待機系で待機サーバが稼働するため,監視パスの障害時などには複数の待機系が同時に系切り替えをするおそれがあります。同時に系切り替えをするのを防ぐために,マルチスタンバイ機能を使用する場合,HAモニタは待機系間でも系の監視をします。

〈この項の構成〉

(1) 系のリセット

待機系の系障害を検出した場合,系障害を検出した系は,自系の待機サーバより高い優先度を持つ待機サーバが稼働している系をリセットします。マルチスタンバイ機能を使用する場合の,系の状態監視と系のリセットを次の図に示します。

図4‒30 系の状態監視と系のリセット(マルチスタンバイ機能使用時)

[図データ]

上記の図では,障害が発生した待機サーバの優先度は1なので,優先度2の待機サーバを持つ待機系2が待機系1をリセットします。

待機系2からのリセットが失敗した場合や,リセットができなかった場合は,実際にリセットを発行する系が異なります。ある待機系からのリセットが失敗した場合の,リセット発行の流れについては,「4.2.3 複数の待機系がある場合の系のリセット」を参照してください。

(2) SCSIリザーブ

監視パス障害で,複数の構成に分断された場合,それぞれの構成が系切り替えを開始します。最終的に実行系となって業務継続する系は,分断された構成の中で一番サーバ優先度の低いサーバがある構成で,その構成内で一番サーバ優先度の高いサーバの系となります。

複数の系が同時に障害となった場合の系切り替えの流れを次の図に示します。

図4‒31 複数の系が同時に障害となった場合の系の切り替え(マルチスタンバイ機能使用時)

[図データ]

上の図では,実行サーバの障害を検知して,実行系の系1からサーバ優先度の高い系2に系切り替えをします。その後,実行サーバを含めた優先度の高い系の障害を検知しているので,さらに系2から系3に系切り替えをします。

(3) LANの通信可否による系切り替え制御機能

実行系または待機系で系障害を検出した場合,HAモニタは,LANの通信可否をチェックします。そして,LANで通信ができる系のうち,いちばん高い優先度の待機サーバを実行サーバとして稼働し,それ以外の優先度の待機サーバは,待機サーバのままとします。また,LANで通信ができない系のサーバを停止させます。

監視パス障害によって系障害を検出した場合,実行系の業務用LANで通信不可,待機系の業務用LANで通信可だったときの,動作の流れを次の図に示します。

図4‒32 実行系の業務用LANで通信不可,待機系の業務用LANで通信可だったときの系切り替え

[図データ]

監視パス障害によって系障害を検出した場合,実行系の業務用LANで通信可,待機系の業務用LANで通信不可だったときの,動作の流れを次の図に示します。

図4‒33 実行系の業務用LANで通信可,待機系の業務用LANで通信不可だったときの系切り替え

[図データ]