Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


1.2.4 HAモニタが検出する障害

ここでは,HAモニタが検出する障害について説明します。

HAモニタは,サーバに発生するサーバ障害,系に発生する系障害,およびリソース(ディスク)に発生するリソース障害を検出して,系切り替えをします。

〈この項の構成〉

(1) HAモニタが監視する範囲

HAモニタは,サーバ障害,系障害,およびリソース障害を検出するために,次を監視しています。

注※ システムディスクおよび業務ディスクを監視します。

システム構成のうち,HAモニタが監視する範囲を次の図に示します。

図1‒3 HAモニタが監視する範囲

[図データ]

(2) サーバ障害

サーバ障害は,サーバ自身が検知できる障害と,サーバ自身が検知できない障害に分けられます。

(a) サーバ自身が検知できる障害

サーバ自身が検知できる障害を次に示します。

  • サーバの論理エラー

  • リソース(ディスク装置など)の障害が原因で,サーバの運転が続行できない状態

サーバ自身が検知できる障害が発生すると,サーバはHAモニタに障害の発生を連絡して異常終了します。障害連絡を受けたHAモニタは系切り替えを実行します。系切り替え時には,待機していたサーバは引き継ぎ情報からサーバ自身が持つ回復機能で再開始し,業務処理を引き継ぎます。

(b) サーバ自身が検知できない障害

サーバ自身が検知できない障害には,サーバのスローダウンがあります。

サーバ自身が検知できない障害は,HAモニタが検出します。障害を検出すると,HAモニタは障害が発生したサーバを停止させて系切り替えをします。

(c) サーバの運用方法による,検出できるサーバ障害の違い

サーバをサーバモードで運用するか,モニタモードで運用するかによって,検出できる障害が異なります。サーバ障害の検出方法,およびサーバの運用方法での検出可否を次の表に示します。

表1‒2 サーバ障害の検出方法,およびサーバの運用方法での検出可否

検出方法

サーバモード

モニタモード

サーバが検知してHAモニタに連絡する

(サーバの監視コマンドの作成が必要

HAモニタがサーバを監視して検出する

×

(凡例)

○:検出できます。

×:検出できません。

注※

モニタモードの場合,サーバ自身が検知できる障害が発生したときに,HAモニタで自動的に系切り替えをするには,サーバの監視コマンドを作成する必要があります。詳細については,「3.2.1 モニタモードのサーバの監視(実行サーバの場合)」を参照してください。

(3) 系障害

系障害とは,サーバを除いた系に発生する障害です。系障害を次に示します。

上記に挙げた障害によって,すべての監視パスの通信切断や系切替機構からの通報が発生すると,HAモニタは系障害を検出し,障害が発生した系を停止させて,系切り替えをします。

(4) リソース障害

リソース障害とは,システムを構成するハードウェアに発生する障害です。HAモニタは,リソース障害を検出して系切り替えをします。リソース障害を検出した場合,サーバ障害や系障害を検出した場合と同様に,計画系切り替え,または系のペアダウンによる系切り替えを実行します。

(a) ディスク障害

ディスク障害とは,ディスクに発生する障害です。HAモニタは,ディスクに書き込みができる状態かどうかを監視することによって,ディスク障害を検出できます。詳細は「3.4.1 ディスクの監視」を参照してください。