Hitachi

JP1 Version 12 JP1/Performance Management 運用ガイド


3.4.5 サマリ表示で稼働状況を確認する

サーバの稼働状況,エージェントの稼働状況,およびエージェントのアラームの状況について,稼働数,停止数,正常数,異常数などの集計結果を確認できます。また,異常状態および警告状態のアラームイベントおよびエージェントイベントを確認できます。集計結果ならびに,異常状態および警告状態のイベントの表示をサマリ表示と呼びます。

〈この項の構成〉

(1) 前提条件

サーバの稼働状況を監視する場合

接続先のPFM - Managerのバージョンが08-11以降で,PFM - Web Consoleが09-00以降かつヘルスチェック機能を有効にする必要があります。

エージェントの稼働状況を監視する場合

接続先のPFM - Managerのバージョンが08-11以降で,PFM - Web Consoleが09-00以降かつヘルスチェック機能を有効にする必要があります。また,PFM - Web Consoleの[サービス階層]画面の[サービスのプロパティ]画面で,ヘルスチェックエージェントのプロパティを次のように設定しておく必要があります。

[Health Check Configurations][Monitoring Level]:Service

ヘルスチェック機能の詳細については,「16.2 ヘルスチェック機能による監視エージェントや監視エージェントが稼働するホストの稼働状態の確認」を参照してください。

(2) サマリ表示の集計対象となるエージェント

表3‒4 サマリ表示の集計対象となるエージェント

エージェント種別

[システム稼働状況サマリ監視]画面のエリア

[サーバの稼働状況]

[エージェントの稼働状況]

[エージェントのアラーム監視状況]

PFM - Agent

リモートエージェント

グループエージェント

×

×

Remote Monitor Collectorサービス

×

(凡例)

○:集計対象

×:集計対象外

また,次に示すエージェントについてはサマリ表示の集計対象外です。

jpctool service deleteコマンドの結果を,エージェント階層の表示形式の「Products」で表示されるツリーに反映させるには,jpctool service deleteコマンド実行後,jpctool service syncコマンドを実行してください。また,「User Agents」で表示されるツリーに反映させる場合は,メソッドフレームの[エージェント階層の編集]メソッドを使用して手動で削除してください。

(3) サマリ表示の手順

  1. 監視コンソールのWebブラウザからPFM - Web Consoleにログインする。

  2. [メイン]画面のナビゲーションフレームで[エージェント階層]タブを選択する。

  3. [エージェント階層]画面でナビゲーションフレームの[表示形式]プルダウンメニューから,エージェント階層の表示形式を選択する。

    • 「User Agents」選択時

      「User Agents(ログインユーザー名)」をルートとするエージェント階層が表示されます。

    • 「Products」選択時

      「Products」をルートとするエージェント階層が表示されます。

  4. ナビゲーションフレームでサマリ表示の集計対象としたいフォルダを選択する。

    エージェント階層のルートを選択するか,またはルート以外の任意のフォルダを選択するかによって,サマリ表示の集計単位および集計範囲が異なります。サマリ表示の集計単位および集計範囲については,「3.4.5(5) サマリ表示の集計単位および集計範囲」を参照してください。

  5. メソッドフレームで[サマリの表示]ボタンを選択する。

    インフォメーションフレームに[システム稼働状況サマリ監視]画面が表示されます。

[システム稼働状況サマリ監視]画面の[サーバの稼働状況],[エージェントの稼働状況],および[エージェントのアラーム監視状況]エリアの表示項目について説明します。

表3‒5 [システム稼働状況サマリ監視]画面の[サーバの稼働状況]および[エージェントの稼働状況]エリアの表示項目

表示項目

意味

円グラフ

ナビゲーションフレームで選択したフォルダ以下のサーバまたはエージェントについて,稼働状況が円グラフで表示されます。円グラフの色の意味は次のとおりです。

  • 緑色:サーバまたはエージェントの稼働状態の割合

  • 赤色:サーバまたはエージェントの停止状態の割合

  • 青色:状態不明※1なサーバまたはエージェントの割合

  • 灰色:監視一時停止中のサーバまたはエージェントの割合

稼働状況の詳細については,「3.4.5(4) 稼働状況の分類」を参照してください。

ナビゲーションフレームで選択したフォルダ以下のサーバまたはエージェントについて,フォルダ単位で稼働状況が表で表示されます。表の項目の意味は次のとおりです。

  • 稼働数:正常に稼働しているサーバまたはエージェントの数

  • 停止数※2:停止しているサーバまたはエージェントの数(停止数が1以上の場合,赤色のセルになる)

  • 総数:サーバまたはエージェントの総数(状態不明なサーバまたはエージェントを含む)

  • 稼働率:サーバまたはエージェントの稼働率(緑色は稼働数の割合,赤色は停止数の割合,青色は不明数※1の割合,灰色は監視一時停止中の割合)

この表はサーバまたはエージェントの停止数の降順で上位5番目まで表示されます。また,6番目以降は「その他」としてまとめて表示されます。

表示する数は初期設定ファイル(config.xml)で指定できます。config.xmlの説明については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。

[ユーザツリーの視点]チェックボックス

エージェント階層で「User Agents」を選択した場合に,[エージェントの稼働状況]エリアに表示されます。この項目をチェックすると,ログインユーザーがエージェント階層に任意で作成したフォルダ単位で稼働状況が表示されます。

[プロダクト種別の視点]チェックボックス

エージェント階層で「User Agents」を選択した場合に,[エージェントの稼働状況]エリアに表示されます。この項目をチェックすると,PFM - AgentまたはPFM - RMの製品ごとにグルーピングされたフォルダ単位で稼働状況が表示されます。

注※1

稼働状況が状態不明になった場合の対処方法については,「17.2.6(2) サーバやエージェントの稼働状況が状態不明または非対応になる」を参照してください。

注※2

[サーバの稼働状況]エリアの場合,停止数が1以上のとき,数字をクリックすることで[停止ホスト一覧]画面が表示されます。これによって,停止しているサーバのホスト名を確認できます。

表3‒6 [システム稼働状況サマリ監視]画面の[エージェントのアラーム監視状況]エリアの表示項目

表示項目

意味

円グラフ

ナビゲーションフレームで選択したフォルダ以下のエージェントについて,アラームの監視状況が円グラフで表示されます。円グラフの色は,アラームの状態を示します。色の意味は次のとおりです。

  • 緑色:アラームの状態が正常のエージェントの割合

  • 黄色:アラームの状態が警告のエージェントの割合

  • 赤色:アラームの状態が異常のエージェントの割合

  • 灰色:監視一時停止中のエージェントの割合

円グラフに示される値は,各アラームの状態によって分類されるエージェントの数です。バインドしているアラームの数ではありません。

ナビゲーションフレームで選択したフォルダ以下のエージェントについて,フォルダ単位でアラームの監視状況が表で表示されます。表の項目の意味は次のとおりです。

  • 正常数:アラームの状態が正常のエージェントの数

  • 警告数:アラームの状態が警告のエージェントの数

  • 異常数:アラームの状態が異常のエージェントの数(異常数が1つ以上の場合,赤色のセルになる)

  • 状態の比率:アラームイベントの状態の比率(緑色は正常数の割合,黄色は警告数の割合,赤色は異常数の割合,灰色は監視一時停止中の割合)

この表はアラームの監視状況で表示される異常数の降順で上位5番目まで表示されます。また,6番目以降は「その他」としてまとめて表示されます。

表示する数は初期設定ファイル(config.xml)のmaxDisplayAlarmで指定できます。config.xmlの説明については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。

注※

アラームの状態は,次のように決定します。

  • 正常

    バインドしているアラームがすべて正常,またはアラームをバインドしていない

  • 警告

    バインドしているアラームで異常状態のものがなく,警告状態のものが1つ以上ある

  • 異常

    バインドしているアラームで異常状態のものが1つ以上ある

  • 監視一時停止

    バインドしているアラームで異常状態および警告状態のものがなく,監視一時停止中のエージェントが1つ以上ある

なお,[常にアラーム通知する]をチェックしたアラームは,評価対象外であるため正常(緑色)となります。また,リモートエージェントおよびグループエージェントは評価対象になります。Remote Monitor Collectorサービスにはアラームをバインドできないため,評価対象外として扱われ,円グラフの母数には数えられません。

同一のエージェントに対して複数のアラームをバインドしている場合,発生しているアラームを優先度で評価します。優先度は,高い順から異常,警告,正常です。

参考

エージェントの数は,次のように数えます。

(例1)エージェント1つに対してアラームを6つバインドし,正常,警告および異常状態が2つずつ発生した場合

エージェントは,優先度が最も高い異常状態に分類されます。エージェントの数は,異常が1と数えられます。

(例2)[常にアラーム通知する]をチェックしたアラームをバインドし,そのアラームが異常状態になった場合

[常にアラーム通知する]をチェックしたアラームは,正常状態に分類されます。エージェントの数は,正常が1と数えられます。

[システム稼働状況サマリ監視]画面の[イベント]エリアでは,異常状態および警告状態のアラームイベントおよびエージェントイベントを確認できます。発行されたアラームイベントおよびエージェントイベントを表示する[イベントモニター]画面とは異なり,すでに発行されているアラームイベントおよびエージェントイベントのうち,現在未解決の異常状態または警告状態になっているものが表示されます。また,正常状態に戻る場合のアラームイベントは表示されません。それぞれのイベントの表示内容の詳細については,「7. イベントの表示」またはマニュアル「JP1/Performance Management リファレンス」の,[イベントモニター]画面について説明している章を参照してください。

エージェントのアラーム監視状況の対象となるのは,[常にアラーム通知する]にチェックがないアラームです。詳細については,「6.9.3 アラームの評価に関する注意事項」を参照してください。

(4) 稼働状況の分類

(a) [システム稼働状況サマリ監視]画面の[サーバの稼働状況]エリアに表示される稼働状況

[サーバの稼働状況]エリアで表示される稼働状況は,そのサーバを監視するエージェントに対するヘルスチェック結果を基に判定されます。ヘルスチェック結果は,「稼働」,「停止」,「不明」および「監視一時停止」の稼働状況に分類されます。

また,[サーバの稼働状況]エリアでは,1つのサーバに対して1つの稼働状況が表示されます。1つのサーバを複数のエージェントで監視している場合,各エージェントに対するヘルスチェック結果が異なることがあります。このようなときは,各エージェントのヘルスチェック結果のうち,「3.4.5(5) サマリ表示の集計単位および集計範囲」に基づく範囲の中で,判定優先順位が最も高いものが,そのサーバの稼働状況として[サーバの稼働状況]エリアに表示されます。

表3‒7 ヘルスチェック結果と稼働状態の判定および判定優先順位の対応

エージェント種別

ヘルスチェック結果

稼働状況の判定

判定優先順位

  • PFM - Agent

  • Remote Monitor Collectorサービス

Host Not Available(ホスト停止)

停止

1

Not Supported(非対応)

稼働

2

Running(動作中)

3

Incomplete(縮退稼働)

4

Stopped(サービス停止)

5

Unconfirmed(状態不明)

6

リモートエージェント

Host Not Available(ホスト停止)

停止

7

Running(動作中)

稼働

8

Incomplete(縮退稼働)

9

  • PFM - Agent

  • Remote Monitor Collectorサービス

  • リモートエージェント

Suspended(監視一時停止中)

監視一時停止

10

リモートエージェント

Unconfirmed(状態不明)

不明

11

Not Supported(非対応)

12

次に,1つのサーバを監視するPFM - Agentとリモートエージェントのヘルスチェック結果が異なる場合の例を示します。

それぞれのヘルスチェック結果として,以下の状態を仮定します。

  • PFM - Agentのヘルスチェック結果が「Host Not Available(ホスト停止)」

    このヘルスチェック結果の判定優先順位は1です。

  • リモートエージェントのヘルスチェック結果が「Not Supported(非対応)」

    このヘルスチェック結果の判定優先順位は12です。

この場合,稼働状況の判定は次のようになります。

  • PFM - Agentとリモートエージェントが同一フォルダに格納されている場合の判定

    円グラフと一覧表ともに,より判定優先順位が高い「Host Not Available(ホスト停止)」が選択されます。したがって,サーバの稼働状態は「停止」になります。

  • PFM - Agentとリモートエージェントが異なるフォルダに格納されている場合の判定

    円グラフでは,より判定優先順位が高い「Host Not Available(ホスト停止)」が選択されます。したがって,サーバの稼働状態は「停止」になります。

    一覧表では,エージェントが格納されているフォルダごとに判定結果が異なります。PFM - Agentが格納されているフォルダでは,「Host Not Available(ホスト停止)」が選択されます。したがって,サーバの稼働状態は「停止」になります。リモートエージェントが格納されているフォルダでは,「Not Supported(非対応)」が選択されます。したがって,サーバの稼働状態は「不明」になります。

(b) [システム稼働状況サマリ監視]画面の[エージェントの稼働状況]エリアに表示される稼働状況

[エージェントの稼働状況]エリアで表示される稼働状況は,エージェントに対するヘルスチェック結果を基に判定されます。ヘルスチェック結果は,「稼働」,「停止」,「不明」および「監視一時停止」の稼働状況に分類されます。

表3‒8 ヘルスチェック結果と稼働状況の判定の分類

エージェント種別

ヘルスチェック結果

稼働状況の判定

  • PFM - Agent

  • リモートエージェント

  • Remote Monitor Collectorサービス

Running(動作中)

稼働

Incomplete(縮退稼働)

停止

Stopped(サービス停止)

Host Not Available(ホスト停止)

Not Supported(非対応)

不明

Unconfirmed(状態不明)

Suspended(監視一時停止中)

監視一時停止

(5) サマリ表示の集計単位および集計範囲

表3‒9 サマリ表示の集計単位および集計範囲

エージェント階層のフォルダの選択個所

円グラフ/表

集計単位

集計範囲

任意のフォルダ

円グラフ

選択したフォルダ

選択したフォルダ配下のすべてのエージェント

選択したフォルダの直下のフォルダ

(選択したフォルダ自身は「その他」として集計されます)

選択したフォルダ直下のフォルダ配下のすべてのエージェント

(選択したフォルダ直下のエージェントは「その他」として集計されます)

サマリ表示の集計単位および集計範囲の例を次の図に示します。

図3‒4 サマリ表示の集計単位および集計範囲の例(ルートを選択した場合)

[図データ]

図3‒5 サマリ表示の集計単位および集計範囲の例(任意のフォルダを選択した場合)

[図データ]

(6) サマリ表示の印刷手順

サマリ表示を印刷する場合は,[システム稼働状況サマリ監視]画面で[停止]をクリックしたあとに表示される[印刷画面]をクリックします。