Hitachi

JP1 Version 12 JP1/Performance Management 運用ガイド


16.2.1 ヘルスチェック機能の設定

〈この項の構成〉

(1) ヘルスチェック機能のセットアップ

ヘルスチェック機能を利用するには,次に示す前提条件があります。この条件が満たされない場合,ヘルスチェック機能は利用できません。

名前解決

PFM - Managerホストのjpchostsファイル,hostsファイルまたはDNSでPFM - Agentホストの監視ホスト名(Windowsの場合はhostname,UNIXの場合はuname -n,監視ホスト名機能を使用している場合はエイリアス名)と通信可能なIPで名前解決ができている必要があります。

監視エージェントが稼働するホスト稼働状態監視
  • PFM - ManagerとPFM - Web Consoleは08-11以降

  • PFM - AgentまたはPFM - RMのバージョンに制限なし

なお,PFM - RMの監視対象ホストを監視する場合,PFM - RMホストでステータス管理機能を有効にしておく必要があります。ステータス管理機能が有効でない場合,リモートエージェントの状態が正しく認識されません。

監視エージェントのサービス稼働状態監視

サービスの稼働状態監視はステータス管理機能を利用します。このため,対象エージェントがステータス管理機能に対応している必要があります。利用するための前提条件は次のとおりです。なお,PFM - RMのバージョンに制限はありません。

  • PFM - ManagerとPFM - Web Consoleは08-11以降

  • PFM - Agentの場合,ステータス管理機能に対応したバージョン

  • PFM - AgentまたはPFM - RMホストのステータス管理機能が有効

2,3番目の条件が満たされない場合,PFM - AgentまたはPFM - RMの状態が正しく認識されません。なお,ステータス管理機能に対応しているPFM - Agentのバージョンについては,「16.3 ステータス管理機能によるサービスの状態確認」を参照してください。PFM - Agentのバージョンとサービス稼働状態監視の利用可否を次に示します。

表16‒1 PFM - Agentのバージョンとサービス稼働状態監視の利用可否

対象エージェントホストのステータス管理機能

対象エージェントのバージョン

サービス稼働状態監視

有効

07-50-01以降

利用可能

有効

07-50以前※1

利用不可※2

無効

利用不可※3

(凡例)−:該当しない

注※1

同一ホスト上に,PFM - Agent 07-50以前と,PFM - Agent 07-50-01以降またはPFM - Base 08-00以降が混在していて,対象PFM - Agentホスト上ではステータス管理機能が有効になっている場合

注※2

監視エージェントのサービス稼働状態監視は「非対応」と判定されます

注※3

監視エージェントのサービス稼働状態監視は「状態不明」と判定されます

ステータス管理機能の設定方法については,「16.3.1 ステータス管理機能の設定」を参照してください。

また,PFM - RMの監視対象ホストの状態を監視する場合,PFM - RMのプロパティでポーリングを有効に設定する必要があります。PFM - RMのポーリングの設定については,「16.2.1(1)(d) PFM - RMのポーリングの設定」を参照してください。

(a) ヘルスチェック機能を有効にする

ヘルスチェック機能は,PFM - Managerホストで有効に設定します。

  1. Performance Managementのサービスを停止する。

    物理ホスト上でPerformance Managementのサービスが起動している場合は,次のコマンドでサービスを停止します。

    jpcspm stop -key jp1pc

    論理ホスト上でPerformance Managementのサービスを停止する場合は,クラスタソフトから,サービスを停止します。

  2. jpcconf hc enableコマンドを実行する。

    ヘルスチェック機能を有効にするためのコマンドを次のように実行します。

    jpcconf hc enable
  3. ヘルスチェック機能の状態を確認する。

    次のコマンドで,ヘルスチェック機能の状態がavailableになっているか確認します。

    jpcconf hc display
  4. Performance Managementのサービスを起動する。

    次のコマンドで,物理ホスト上のPerformance Managementのサービスをすべて起動します。

    jpcspm start -key jp1pc

    論理ホスト上でPerformance Managementのサービスをすべて起動する場合は,クラスタソフトから,サービスを起動します。

    なお,サービスIDは「0A1ホスト名」,「0S1ホスト名」です。

注意

起動対象のサービスにPFM - Managerが含まれ,対象PFM - Managerホストでヘルスチェック機能が有効に設定されている場合,jpcspm startコマンド実行時にPFM - Managerのサービスの一部としてヘルスチェックエージェントも起動します。また,jpcspm stopコマンド実行時にPFM - Managerのサービスの一部としてヘルスチェックエージェントも停止します。

jpcspm start,jpcspm stopコマンドではサービスキーとしてagt0は指定できません。

ヒント

ヘルスチェック機能には,サービスの稼働状態を監視できる「Service」と,エージェントホストの稼働状態を監視できる「Host」の2種類の監視レベルがあります。デフォルトでは「Host」に設定されています。

監視レベルの設定方法については,「16.2.1(2) ヘルスチェックエージェントのプロパティの設定」を参照してください。

(b) ヘルスチェック機能を無効にする

ヘルスチェック機能は,PFM - Managerホストで無効に設定します。

  1. Performance Managementのサービスを停止する。

    物理ホスト上でPerformance Managementのサービスが起動している場合は,次のコマンドでサービスを停止します。

    jpcspm stop -key jp1pc

    論理ホスト上でPerformance Managementのサービスを停止する場合は,クラスタソフトから,サービスを停止します。

  2. jpcconf hc disableコマンドを実行する。

    ヘルスチェック機能を無効にするためのコマンドを次のように実行します。

    jpcconf hc disable
  3. ヘルスチェック機能の状態を確認する。

    次のコマンドで,ヘルスチェック機能の状態がunavailableになっているか確認します。

    jpcconf hc display

    PFM - Managerが論理ホスト上にある場合は,実行系または待機系のPFM - Managerホスト上でjpcconf hc displayコマンドを実行します。

  4. Performance Managementのサービスを起動する。

    次のコマンドで,物理ホスト上のPerformance Managementのサービスをすべて起動します。

    jpcspm start -key jp1pc

    論理ホスト上でPerformance Managementのサービスをすべて起動する場合は,クラスタソフトから,サービスを起動します。

各コマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」を参照してください。

(c) ヘルスチェックエージェントの状態を確認する

jpctool service listコマンドで確認できます。また,ヘルスチェック機能によって,ヘルスチェックエージェント自身の稼働状態も確認できます。ただし,ヘルスチェックエージェントのAgent CollectorまたはRemote Monitor Collectorサービスが異常停止した場合,以降,ヘルスチェック結果が正しく表示されないことがあります。

(d) PFM - RMのポーリングの設定

PFM - RMの監視対象ホストの稼働状態を監視する場合,監視対象ホストへのポーリングをPFM - RMのプロパティで有効に設定する必要があります。設定するプロパティを次に示します。

表16‒2 ポーリングのプロパティ設定

フォルダ名

プロパティ名

説明

Health Check Configurations

Health Check for Target Hosts

監視対象ホストへのポーリングを実施するかどうかを指定する。デフォルト値はNo。

 Yes:ポーリングする。

 No:ポーリングしない。

ポーリングを無効に設定している場合,監視対象ホストの稼働状態は「Not Supported(非対応)」になります。

(2) ヘルスチェックエージェントのプロパティの設定

ヘルスチェック機能有効時に,PFM - Web Consoleのサービス階層からヘルスチェックエージェントのプロパティを設定することで,稼働監視データの収集間隔や監視レベルなどヘルスチェック機能に関する設定ができます。設定できるヘルスチェックエージェントのプロパティ一覧を次に示します。

表16‒3 ヘルスチェックエージェントのプロパティ一覧

フォルダ名

プロパティ名

説明

Detail Records - HC

Description

レコードの説明としてHealth Check Detailが表示される。

Log

監視結果のデータを採取するかどうかを指定する。デフォルト値はNo。

 Yes:パフォーマンスデータを採取する。

 No:パフォーマンスデータを採取しない。

Collection Interval

収集間隔を0〜2,147,483,647の範囲で指定する。単位は秒。デフォルト値は300。なお,ここで指定した値がヘルスチェック機能のポーリング周期となる。※4

Collection Offset

収集開始時刻オフセットを0〜32,767の範囲で指定する。単位は秒。デフォルト値は0。

LOGIF

ログ収集条件を指定する。

Health Check Configurations※1

Monitoring Level※2

監視レベルを指定する。サービスの稼働状態を監視したい場合は「Service」を,エージェントホストの稼働状態を監視したい場合は「Host」を指定する。デフォルト値はHost。

監視を一時停止しているホストやエージェントがある場合は指定できない。

Polling Interval

ポーリング周期が表示される。なお,この値はPD_HCレコードのCollection Intervalに同期する。

Incl. Action Handler

サービスの稼働を監視する場合に,Action Handlerサービスを監視対象に含めるかどうかを指定する。デフォルト値はNo。

 Yes:監視対象に含める。

 No:監視対象に含めない。

Busy as Inactive

エージェントのサービス状態が長時間Busyのとき,停止として扱うかどうかを指定する。デフォルト値はNo。なお,Yesを指定したときだけTime to Busy as Inactiveの設定が有効になる。

 Yes:停止として扱う。※3

 No:停止として扱わない。

なお,エージェントのサービス状態はjpctool service listコマンドで表示される「Status」として確認できる。

Time to Busy as Inactive Collector

Agent CollectorおよびRemote Monitor CollectorサービスのBusyを停止と同等扱いするまでの時間※3を秒単位で指定する。デフォルト値は300(秒)。

Time to Busy as Inactive Store

Agent StoreおよびRemote Monitor StoreサービスのBusyを停止と同等扱いするまでの時間※3を秒単位で指定する。デフォルト値は300(秒)。

Time to Busy as Inactive AH

Action HandlerサービスのBusyを停止と同等扱いするまでの時間※3を秒単位で指定する。デフォルト値は300(秒)。

JP1 Event

-

ヘルスチェックイベントをJP1イベントとして発行するかどうかを指定する。デフォルト値はNo。

 Yes:JP1イベントとして発行する。

 No:JP1イベントとして発行しない。

Not supported

非対応。デフォルト値はNone。

 None:JP1イベントを発行しない。

 Information:SEVERITYを「Information」で発行する。

 Warning:SEVERITYを「Warning」で発行する。

 Error:SEVERITYを「Error」で発行する。

Running

動作中。デフォルト値はInformation。

 None:JP1イベントを発行しない。

 Information:SEVERITYを「Information」で発行する。

 Warning:SEVERITYを「Warning」で発行する。

 Error:SEVERITYを「Error」で発行する。

Incomplete

縮退稼働。デフォルト値はWarning。

 None:JP1イベントを発行しない。

 Information:SEVERITYを「Information」で発行する。

 Warning:SEVERITYを「Warning」で発行する。

 Error:SEVERITYを「Error」で発行する。

Stopped

サービス停止。デフォルト値はError。

 None:JP1イベントを発行しない。

 Information:SEVERITYを「Information」で発行する。

 Warning:SEVERITYを「Warning」で発行する。

 Error:SEVERITYを「Error」で発行する。

Unconfirmed

状態不明。デフォルト値はError。

 None:JP1イベントを発行しない。

 Information:SEVERITYを「Information」で発行する。

 Warning:SEVERITYを「Warning」で発行する。

 Error:SEVERITYを「Error」で発行する。

Host Not Available

ホスト停止。デフォルト値はError。

 None:JP1イベントを発行しない。

 Information:SEVERITYを「Information」で発行する。

 Warning:SEVERITYを「Warning」で発行する。

 Error:SEVERITYを「Error」で発行する。

注※1

Health Check Configurationsの設定を変更した場合,次のポーリング周期から設定が反映されます。

注※2

Monitoring Levelの設定を変更した場合,ヘルスチェックエージェントのリアルタイムレポートでは,レポートの表示時点で変更後のポーリングが完了しているかどうかによって,表示されるヘルスチェック結果が異なります。

監視エージェント

表示されるヘルスチェック結果

変更後の設定によるポーリングが完了している監視エージェント

変更後の設定で最新のヘルスチェック結果

変更後の設定によるポーリングが行われていない監視エージェント

変更前の設定で最新のヘルスチェック結果

このため,一時的に,変更前と変更後の設定が混在して表示されることがあります。

注※3

Busyの状態が継続している時間は,ポーリングを実施した時刻(PFM - Managerの稼働するホストの時刻)と,サービスがBusyの状態に遷移した時刻(PFM - AgentまたはPFM - RMの稼働するホストの時刻)の差から計算されます。そのため,Performance Managementを運用する各ホストで時刻が一致している必要があります。

注※4

デフォルト値または60秒以上の値でかつ,3,600の約数を指定してください。3,600秒(1時間)を超えるレコード収集間隔を指定する場合は,3,600の倍数でかつ86,400(24時間)の約数を指定してください。レコードの収集間隔をデフォルト値より小さい値に設定した場合,または60秒より小さい値に設定した場合,ヘルスチェックエージェントホストのAgent CollectorサービスやAgent Storeサービスが過負荷となり,収集したパフォーマンスデータを保存できなくなることがあります。