JP1/Performance Management システム構築・運用ガイド
実行系ノードで障害が発生すると,フェールオーバーが実行され,処理が待機系ノードに移ります。ここでは,PFM - Managerでフェールオーバーが発生した場合と,PFM - Agentでフェールオーバーが発生した場合の運用について説明します。
- <この項の構成>
- (1) PFM - Managerで障害が発生した場合のフェールオーバーの流れ
- (2) PFM - Managerが停止したときの影響
- (3) PFM - Agentで障害が発生した場合のフェールオーバー
(1) PFM - Managerで障害が発生した場合のフェールオーバーの流れ
運用中にPFM - Managerで障害が発生し,フェールオーバーが発生した場合のシステムの処理を次の図に示します。
図15-24 PFM - Managerホストにフェールオーバーが発生した場合の処理の流れ
システムの処理の流れを次に示します。
- クラスタソフトがフェールオーバー発生時に,PFM - Managerを強制終了する。
- クラスタソフトがPFM - Managerの処理を実行系ノードから待機系ノードに引き継ぐ。
- クラスタソフトが待機系ノードのPFM - Managerを起動する。
(a) PFM - Web Consoleでの操作
PFM - Managerにフェールオーバーが発生した場合,PFM - Web Consoleの画面で操作をすると,「KAVJS0012-E Managerとの通信でエラーが発生しました。」というメッセージが表示されます。この場合は,次の手順でフェールオーバー先のPFM - Managerに接続してください。
- PFM - Web Consoleの画面で,ログアウトする。
[メイン]画面の[ログアウト]メニューをクリックします。
- PFM - Web Consoleの画面で,ログインする。
フェールオーバー先のPFM - Managerが起動したあとに,PFM - Web Consoleの画面で再度ログインします。
- 注意
- ブックマークの操作中にフェールオーバーが発生した場合,正しくブックマークの定義情報に書き込まれなかった情報は,失われます。ブックマークが正しく操作されていなかったときは,操作し直してください。
(b) PFM - Agentでの操作
運用中にPFM - Managerにフェールオーバーが発生した場合,PFM - Agentでは特に操作は必要ありません。PFM - Managerのフェールオーバー中でも,PFM - Agentではパフォーマンスデータが継続して収集されています。
(2) PFM - Managerが停止したときの影響
PFM - Managerが停止すると,Performance Managementシステム全体に影響があります。
PFM - Managerは,各ノードで動作しているPFM - Agentのエージェント情報を一括管理しています。また,PFM - Agentがパフォーマンス監視中にしきい値を超えた場合のアラームイベントの通知や,アラームイベントを契機としたアクションの実行を制御しています。このため,PFM - Managerが停止すると,Performance Managementシステムに次の表のような影響があります。
表15-10 PFM - Managerが停止した場合のPFM - Web Consoleへの影響
影響 対処
- PFM - Web Consoleの画面で赤色点滅していたアラームは,PFM - Managerを再起動したり,フェールオーバーしたりした直後は緑色に戻り,そのあと赤色点滅した状態に戻る。
- PFM - Managerが停止すると次のエラーなどが発生し,以降の操作はできなくなる。
「KAVJS0012-E Managerとの通信でエラーが発生しました。」
PFM - Managerを起動してから再度ログインしてください。
- PFM - Web Consoleの画面からログインしようとするとき,PFM - Managerが停止していると,Performance Managementにログインできない。
PFM - Managerを起動してから再度ログインしてください。 表15-11 PFM - Managerが停止した場合のPFM - Agentへの影響
影響 対処
- パフォーマンスデータは継続して収集される。
- 発生したアラームイベントをPFM - Managerに通知できないため,アラーム定義ごとにアラームイベントが保持され,PFM - Managerが起動するまで通知をリトライする。保持しているアラームイベントが三つを超えると,古いアラームイベントは上書きされる。また,PFM - Agentを停止すると,保持しているアラームイベントは削除される。
- PFM - Managerに通知済みのアラームステータスは,PFM - Managerが再起動したときに一度リセットされる。そのあと,PFM - ManagerがPFM - Agentの状態を確認したあと,アラームステータスは最新の状態となる。
- PFM - Agentを停止しようとした場合,PFM - Managerに停止することを通知できないため,停止に時間が掛かる。
PFM - Managerを起動してください。
動作中のPFM - Agentはそのまま運用できます。ただし,アラームが期待したとおり通知されない場合があるため,PFM - Manager復旧後に,PFM - Agentの共通メッセージログに出力されているメッセージKAVE00024-Iを確認してください。
(3) PFM - Agentで障害が発生した場合のフェールオーバー
運用中にPFM - Agentで障害が発生し,フェールオーバーが発生した場合の処理を次の図に示します。
図15-25 PFM - Agentでフェールオーバーが発生した場合の処理
システムの処理の流れを次に示します。
- クラスタソフトがフェールオーバー発生時に,PFM - Agentを強制終了する。
- クラスタソフトがPFM - Agentの処理を実行系ノードから待機系ノードに引き継ぐ。
- クラスタソフトが待機系ノードのPFM - Agentを起動する。
(a) PFM - Web Consoleの画面での運用
PFM - Agentのフェールオーバー中に,PFM - Web Consoleの画面で操作すると,状況に応じてメッセージが表示されます。この場合は,フェールオーバーが完了するまで待ってから操作してください。
PFM - Agentのフェールオーバー後にPFM - Web Consoleの画面で操作すると,フェールオーバー先のノードで起動したPFM - Agentに接続されて,操作できます。
All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.