10.7 クラスタシステムでの障害回復
実行系ノードで障害が発生すると,クラスタソフトによってフェールオーバーが実行され,処理が待機系ノードに移ります。フェールオーバーすると,それまで実行されていた実行系ノードでの処理は停止されます。
システム管理者は,実行系ノードで発生した障害の要因を特定します。また,障害の要因を取り除いたあと,実行系ノードに系切り替えして,障害を回復する必要があります。
障害の要因を特定するには,次のログ情報を採取して分析します。
-
Performance Managementのログ情報
非クラスタシステムで採取する情報と同じです。次の情報を採取します。
-
システムログ
-
共通メッセージログ
-
稼働状況ログ
-
トレースログ
-
-
クラスタソフトやOSのログ情報
クラスタソフトのログ情報や,OS自身が出力するログもあわせて採取してください。
Performance Managementのログ情報の詳細については,「17.4 Performance Management運用時に出力されるログ情報」を参照してください。
- 〈この節の構成〉