1.2.4 HAモニタが検出する障害
ここでは,HAモニタが検出する障害について説明します。
HAモニタは,サーバに発生するサーバ障害,系に発生する系障害,およびリソース(LAN,ディスク)に発生するリソース障害を検出して,系切り替えをします。
- 〈この項の構成〉
(1) HAモニタが監視する範囲
HAモニタは,サーバ障害,系障害,およびリソース障害を検出するために,次を監視しています。
-
サーバ
-
系
-
リソース(LAN,ディスク※)
注※ システムディスクおよび業務ディスクを監視します。
システム構成のうち,HAモニタが監視する範囲を次の図に示します。
(2) サーバ障害
サーバ障害は,サーバ自身が検知できる障害と,サーバ自身が検知できない障害に分けられます。
(a) サーバ自身が検知できる障害
サーバ自身が検知できる障害を次に示します。
-
サーバの論理エラー
-
リソース(ディスク装置など)の障害が原因で,サーバの運転が続行できない状態
サーバ自身が検知できる障害が発生すると,サーバはHAモニタに障害の発生を連絡して異常終了します。障害連絡を受けたHAモニタは系切り替えを実行します。系切り替え時には,待機していたサーバは引き継ぎ情報からサーバ自身が持つ回復機能で再開始し,業務処理を引き継ぎます。
(b) サーバ自身が検知できない障害
サーバ自身が検知できない障害には,サーバのスローダウンがあります。
サーバ自身が検知できない障害は,HAモニタが検出します。障害を検出すると,HAモニタは障害が発生したサーバを停止させて系切り替えをします。
(c) サーバの運用方法による,検出できるサーバ障害の違い
サーバをサーバモードで運用するか,モニタモードで運用するかによって,検出できる障害が異なります。サーバ障害の検出方法,およびサーバの運用方法での検出可否を次の表に示します。
検出方法 |
サーバモード |
モニタモード |
---|---|---|
サーバが検知してHAモニタに連絡する |
○ |
○ (サーバの監視コマンドの作成が必要※1) |
HAモニタがサーバを監視して検出する |
○ |
×※2 |
- (凡例)
-
○:検出できます。
×:検出できません。
- 注※1
-
モニタモードの場合,サーバ自身が検知できる障害が発生したときに,HAモニタで自動的に系切り替えをするには,サーバの監視コマンドを作成する必要があります。詳細については,「3.2.1 モニタモードのサーバの監視(実行サーバの場合)」を参照してください。ただし,モニタモードのプログラム管理機能でUAPを監視すれば,サーバの監視コマンドにUAPの監視処理を組み込む必要がなくなります。詳細については,「3.6.1 UAPの監視」を参照してください。
- 注※2
-
モニタモードのプログラム管理機能を使用すれば,UAPを監視できます。
(3) 系障害
系障害とは,サーバを除いた系に発生する障害です。HAモニタは,aliveメッセージの途絶によって,系障害を検出します。系障害を次に示します。
-
系のハードウェア障害,または電源断
OSなどの機能を使用してハードウェア(プロセサやディスクなど)を冗長化している場合,一つのハードウェアが縮退稼働している間は系障害とは判断しません。
-
カーネルの障害
-
HAモニタの障害
-
すべての監視パスの障害
-
系のスローダウン
上記に挙げた障害によって,すべての監視パスの通信切断や障害管理プロセサからの通報が発生すると,HAモニタは系障害を検出し,障害が発生した系を停止させて,系切り替えをします。
(4) リソース障害
リソース障害とは,システムを構成するハードウェアに発生する障害です。HAモニタは,次の障害を検出して系切り替えをします。
-
LAN障害
-
ディスク障害
LAN障害やディスク障害を検出した場合,サーバ障害や系障害を検出した場合と同様に,計画系切り替え,または系のペアダウンによる系切り替えを実行します。
(a) LAN障害
LAN障害とは,LANに発生する障害です。HAモニタは,LANが通信できる状態かどうかを監視することによって,LAN障害を検出できます。詳細は「3.4.1 LANの監視および障害時の自動系切り替え」を参照してください。
(b) ディスク障害
ディスク障害とは,ディスクに発生する障害です。HAモニタは,ディスクに書き込みができる状態かどうかを監視することによって,ディスク障害を検出できます。詳細は「3.4.2 ディスクの監視」を参照してください。