Hitachi

JP1 Version 12 JP1/Performance Management 運用ガイド


10.6.8 クラスタシステムでフェールオーバーが発生したときの運用

実行系ノードで障害が発生すると,フェールオーバーが実行され,処理が待機系ノードに移ります。

〈この項の構成〉

(1) PFM - Managerで障害が発生した場合のフェールオーバーの流れ

図10‒31 PFM - Managerホストにフェールオーバーが発生した場合の処理の流れ

[図データ]

  1. クラスタソフトがフェールオーバー発生時に,PFM - Managerを強制終了する。

  2. クラスタソフトがPFM - Managerの処理を実行系ノードから待機系ノードに引き継ぐ。

  3. クラスタソフトが待機系ノードのPFM - Managerを起動する。

(a) PFM - Web Consoleでの操作

PFM - Managerにフェールオーバーが発生した場合,PFM - Web Consoleの画面で操作を実施すると,KAVJS0012-Eメッセージが表示されます。この場合は,次の手順でフェールオーバー先のPFM - Managerに接続してください。

  1. PFM - Web Consoleの画面で,ログアウトする。

    [メイン]画面の[ログアウト]メニューをクリックします。

  2. PFM - Web Consoleの画面で,ログインする。

    フェールオーバー先のPFM - Managerが起動したあとに,PFM - Web Consoleの画面で再度ログインします。

    重要

    ブックマークの操作中にフェールオーバーが発生した場合,正しくブックマークの定義情報に書き込まれなかった情報は,失われます。ブックマークが正しく操作されていなかったときは,操作し直してください。

(b) PFM - AgentまたはPFM - RMでの操作

運用中にPFM - Managerにフェールオーバーが発生した場合,PFM - AgentまたはPFM - RMでは特に操作は必要ありません。PFM - Managerのフェールオーバー中でも,PFM - AgentまたはPFM - RMではパフォーマンスデータが継続して収集されています。

(2) PFM - Managerが停止したときの影響

PFM - Managerが停止すると,Performance Managementシステム全体に影響があります。

PFM - Managerは,各ノードで動作しているPFM - AgentまたはPFM - RMのエージェント情報を一括管理しています。また,PFM - AgentまたはPFM - RMがパフォーマンス監視中にしきい値を超えた場合のアラームイベントの通知や,アラームイベントを契機としたアクションの実行を制御しています。このため,PFM - Managerが停止すると,Performance Managementシステムに次の表のような影響があります。

表10‒15 PFM - Managerが停止した場合のPFM - Web Consoleへの影響

影響

対処

  • PFM - Web Consoleの画面で赤色点滅していたアラームは,PFM - Managerを再起動したり,フェールオーバーしたりした直後は緑色に戻り,そのあと赤色点滅した状態に戻る。

    PFM - Managerが停止するとKAVJS0012-Eメッセージなどが発生し,以降の操作はできなくなる。

PFM - Managerを起動してから再度ログインしてください。

  • PFM - Web Consoleの画面からログインしようとするとき,PFM - Managerが停止していると,Performance Managementにログインできない。

PFM - Managerを起動してから再度ログインしてください。

表10‒16 PFM - Managerが停止した場合のPFM - AgentまたはPFM - RMへの影響

影響

対処

  • パフォーマンスデータは継続して収集される。

  • 発生したアラームイベントをPFM - Managerに通知できないため,アラーム定義ごとにアラームイベントが保持され,PFM - Managerが起動するまで通知をリトライする。保持しているアラームイベントが3つを超えると,古いアラームイベントは上書きされる。また,PFM - AgentまたはPFM - RMを停止すると,保持しているアラームイベントは削除される。

  • PFM - Managerに通知済みのアラームステータスは,PFM - Managerが再起動したときに一度リセットされる。そのあと,PFM - ManagerがPFM - AgentまたはPFM - RMの状態を確認したあと,アラームステータスは最新の状態となる。

  • PFM - AgentまたはPFM - RMを停止しようとした場合,PFM - Managerに停止することを通知できないため,停止に時間が掛かる。

PFM - Managerを起動してください。

動作中のPFM - AgentまたはPFM - RMはそのまま運用できます。ただし,アラームが期待したとおり通知されない場合があるため,PFM - Manager復旧後に,PFM - AgentまたはPFM - RMの共通メッセージログに出力されているKAVE00024-Iメッセージを確認してください。

(3) PFM - AgentまたはPFM - RMで障害が発生した場合のフェールオーバーの流れ

図10‒32 PFM - AgentまたはPFM - RMでフェールオーバーが発生した場合の処理

[図データ]

  1. クラスタソフトがフェールオーバー発生時に,PFM - AgentまたはPFM - RMを強制終了する。

  2. クラスタソフトがPFM - AgentまたはPFM - RMの処理を実行系ノードから待機系ノードに引き継ぐ。

  3. クラスタソフトが待機系ノードのPFM - AgentまたはPFM - RMを起動する。

(a) PFM - Web Consoleの画面での運用

PFM - AgentまたはPFM - RMのフェールオーバー中に,PFM - Web Consoleの画面で操作すると,状況に応じてメッセージが表示されます。この場合は,フェールオーバーが完了するまで待ってから操作してください。

PFM - AgentまたはPFM - RMのフェールオーバー後にPFM - Web Consoleの画面で操作すると,フェールオーバー先のノードで起動したPFM - AgentまたはPFM - RMに接続されて,操作できます。