2.2.2 系障害の検出
マニュアル高信頼化システム監視機能 HAモニタ Linux(R)(x86)編の「系障害の検出」の説明を参照してください。
ただし,パブリッククラウド環境下では,リセットパスのヘルスチェックをしません。代わりに,AWS CLIまたはAzure CLIの実行可否チェックをします。
(1) AWS CLI,Azure CLI,またはOCI CLIの実行可否チェック
AWS CLI,Azure CLI,およびOCI CLIの実行可否チェックについて,説明します。
パブリッククラウド環境下では,インスタンスの強制停止や業務通信の切り替えなどをAWS CLI,Azure CLI,またはOCI CLIで実施します。CLIが実行できる状態でなければ,系切り替えはできません。そのため,HAモニタはCLIを実行できる状態かどうかを定期的にチェックします。
CLI実行可否チェックは,HAモニタを起動してから停止するまで,60秒間隔で実施します。
CLIを実行できない場合は,メッセージKAMN768-Eを出力します。メッセージに従って,対処してください。
次のどちらかの場合で,CLIを実行できない状態が継続している間は,1時間おきに繰り返しメッセージKAMN769-Wを出力します。
-
HAモニタの環境設定のnotswitch_notifyオペランドにuseを指定している場合
-
HAモニタの環境設定のnotswitch_notifyオペランドを省略した場合
CLIを実行できない状態から,実行できる状態に回復した場合は,CLI実行可否チェック時にメッセージKAMN770-Iを出力します。
CLI実行可否チェックは,シェルスクリプトからCLIを実行することによって実施します。このシェルスクリプトは,パブリッククラウド環境でHAモニタを使用するために必要なスクリプトを集めたシェルスクリプト群に含まれています。環境構築時にこのシェルスクリプト群を展開しておく必要があります。このシェルスクリプト群については,「5.8 【AWS】AWS用のシェルスクリプト群の展開」,「5.9 【Azure】Azure用のシェルスクリプト群の展開」,または「5.10 【OCI】OCI用のシェルスクリプト群の展開」を参照してください。
(2) 【AWS】コントロールプレーンのチェック
AWS環境では,AWS CLIが実行可能かどうかのチェックに加え,コントロールプレーンに対して実行可能かどうかのチェックもできます。HAモニタは系切り替え時に,コントロールプレーンと関連するAWS CLIを実行する場合があります。コントロールプレーンに対するチェックをすることで,早期に障害を検知し,ユーザ対処ができるようになります。
コントロールプレーンのチェックには次の2つの方法があります。
-
ENIの制御によるチェック
-
ルートテーブルの更新によるチェック
どちらか片方だけでもチェックできますが,両方でチェックすることを推奨します。
- ENIの制御によるチェック
-
チェックするインスタンス上のHAモニタは,定期的に次の動作をします。
-
チェック専用のENIについて,デタッチをしたあと,再度アタッチする
チェックするには,次の準備が必要です。
-
チェック専用のENI
チェックするインスタンスごとにチェック専用のENIをアタッチしてください。
-
- ルートテーブルの更新によるチェック
-
チェックするインスタンス上のHAモニタは,定期的に次の動作をします。
-
チェック専用のルートテーブルについて,エントリを削除したあと,再度登録する
チェックするには,次の準備が必要です。
-
チェック専用のルートテーブル
チェックするインスタンスごとにチェック専用のルートテーブルを作成してください。
-
エントリ登録のためのチェック専用のVIP
業務などの通信に影響を与えないように,業務通信には使用しない未使用のVIPを作成してください。
VIPは次の条件を満たしてください。
•VIPはVPCのCIDRの範囲外
•VIPのCIDRブロックは32
-
エントリ登録のためのターゲットとなるENIのID
チェックするインスタンスにアタッチされたENIのIDです。ENIの制御によるチェック専用のENIのIDでも問題ありません。
-
チェックが失敗した場合,syslogにメッセージKAMN558-Eを出力します。また,メッセージKAMN558-Eを出力後,実行した結果が正常だと確認できた場合は,syslogにメッセージKAMN559-Iを出力します。