Hitachi

JP1 Version 11 JP1/Service Level Management


4.4.1 エラーまたは警告の原因となった事象の発生時期を確認する

監視対象サービスにエラーまたは警告が表示された場合,エラーまたは警告の原因となった事象の発生時期を監視対象サービスの監視対象の性能グラフから確認します。

確認には,[ホーム]画面,[リアルタイム監視]画面および[問題調査]画面を使用します。

サービスグループ全体の状況を把握した上で,対象とする監視対象サービスを特定してイベントの原因を調査したい場合は,[ホーム]画面を使用します。また,特定の監視対象サービスに注目している場合に,その監視対象サービスで発生したイベントの原因を調査したいときは,[リアルタイム監視]画面を使用します。

〈この項の構成〉

(1) 作業の前に

(2) 作業手順

この作業で使用する[ホーム]画面,および[問題調査]画面を次に示します。

  1. [ホーム]画面が表示されていない場合は,[ホーム]ボタンをクリックする。

    [現在のサービスグループ状況サマリー]エリア,[要注意サービス]エリア,および[過去7日間の発生イベント一覧]エリアが表示されます。

    どの監視対象サービスを調査対象とするかをイベントの発行状況から判断したい場合は,手順2.に進んでください。

    調査したい監視対象サービスが明確になっている場合は,手順3.に進んでください。

  2. [ホーム]画面の[過去7日間の発生イベント一覧]エリアから,確認したいエラーまたは警告を選択し,該当する行の[詳細]列をクリックする。

    選択したエラーまたは警告について,[問題調査]画面の[性能グラフ]タブが表示されます。なお,[性能グラフ]タブが表示されるのは,サービス性能に関するイベントを選択したときだけです。

  3. [問題調査]画面の[イベント/性能グラフ]エリアの[性能グラフ]タブの性能グラフで,原因となった事象の発生時期を確認する。

    性能グラフを確認して,サービス性能の平均値がベースラインから大きく離れ始めた時間帯を探します。性能グラフでは,サービス性能の変化の大きい個所が色付きの帯で表示されます。そのため,色付きの帯で示された部分は,エラーまたは警告の原因となった事象が発生した時期である可能性があります。

    エラー原因となった事象が発生した時期は,[ノード状態表示]プルダウンメニューで「ノードの状態表示」を選択しても調査できます。[ノード状態表示]プルダウンメニューで「イベント」を選択している場合,イベントが発生した時刻の上部に発生したイベントを示すアイコンが表示されます。イベントが発生した時点に絞って状態を表示するため,調査する上での基点を探すのに有効です。[ノード状態表示]プルダウンメニューで「監視項目状況」を選択すると,発生しているイベントを示す帯がグラフ上部に表示されます。帯の表示をたどることで,イベントの発生経過を調査できます。

    なお,性能グラフに表示する項目は変更できます。表示項目をクリックして[表示項目選択]ダイアログを表示し,表示したい項目を選択してください。表示項目の詳細については,「10.4.4 [イベント/性能グラフ]エリア([性能グラフ]タブを選択した状態)」を参照してください。

  4. [図データ]をクリックして,構成情報を表示する。

    構成情報では,監視対象サービスのどの監視項目がエラーになったのか確認できます。必要に応じて,監視項目の[図データ]ボタンをクリックして性能情報をグラフに表示できます。また,問題が発生しているのがホストやミドルウェアなどのシステムなのかどうかも確認できます。システムに問題が発生している場合は,必要に応じて,[図データ]ボタンをクリックしてJP1/PFMへ接続し,確認してください。

特定した時間帯の情報を基に,同時間帯でのCPU利用率,メモリ使用量またはディスク使用量などを確認して,エラーや警告の要因を検討してください。

なお,性能グラフでは,過去のサービス性能も確認できます。確認する方法については,「4.4.2 過去データを確認する」を参照してください。

メモ

[問題調査]画面は,[リアルタイム監視]画面からも表示できます。[リアルタイム監視]画面からエラーまたは警告の原因となった事象の発生時期を確認する手順および手順中で使用する[リアルタイム監視]画面を次に示します。

  • [リアルタイム監視]画面

    [図データ]

  1. [リアルタイム監視]ボタンをクリックする。

    [サービス一覧]エリア,[サービス性能情報]エリア,[システム性能情報]エリア,および[イベント/性能グラフ]エリアが画面に表示されます。

  2. [リアルタイム監視]画面の[サービス一覧]エリアで,調査の対象とするサービスグループ,監視対象サービスまたは監視対象サービスの監視対象を選択する。

    なお,監視対象サービスの監視対象を選択した場合は,手順4.に進んでください。手順3.の作業は不要です。

  3. [リアルタイム監視]画面の[サービス性能情報]エリアで,調査の対象とする監視対象サービスの監視対象を選択する。

    しきい値監視,傾向監視または外れ値検知でエラーや警告が発生している場合は,[サービス性能情報]エリアに表示されたアイコンの情報などを基に,調査対象とする監視対象サービスの監視対象を選択してください。また,JP1/PFMと連携してシステムの稼働情報を監視している場合は,[サービス性能情報]エリアの「稼働状況」列に稼働状況が表示されます。アイコンの情報を確認し,調査対象とする場合は監視対象サービスの監視対象を選択してください。

    なお,ここで監視対象サービスの監視対象を選択しないで手順4.に進み,[イベント]タブで監視対象サービスの監視対象を選択してもかまいません。

  4. [リアルタイム監視]画面の[イベント/性能グラフ]エリアの[イベント]タブで発生したイベントの情報を確認し,確認したいエラーまたは警告の[詳細]列をクリックする。

    [イベント]タブの表示内容を基に,しきい値監視,傾向監視または外れ値検知で発生したイベントの情報を確認できます。[詳細]列をクリックすると,エラーまたは警告が発生したサービス性能のメッセージおよび性能グラフが,[問題調査]画面の[イベント/性能グラフ]エリアに表示されます。

  5. [問題調査]画面の[イベント/性能グラフ]エリアの[性能グラフ]タブの性能グラフで,原因となった事象の発生時期を確認する。

    性能グラフを確認して,サービス性能の平均値がベースラインから大きく離れ始めた時間帯を探します。性能グラフでは,サービス性能の変化の大きい個所が色付きの帯で表示されます。そのため,色付きの帯で示された部分は,エラーまたは警告の原因となった事象が発生した時期である可能性があります。

    なお,性能グラフに表示する項目は変更できます。表示項目をクリックして[表示項目選択]ダイアログを表示し,表示したい項目を選択してください。表示項目の詳細については,「10.4.4 [イベント/性能グラフ]エリア([性能グラフ]タブを選択した状態)」を参照してください。

  6. [図データ]をクリックして,構成情報を表示する。

    構成情報では,監視対象サービスのどの監視項目がエラーになったのか確認できます。必要に応じて,監視項目の[図データ]ボタンをクリックして性能情報をグラフに表示できます。また,問題が発生しているのがホストやミドルウェアなどのシステムなのかどうかも確認できます。システムに問題が発生している場合は,必要に応じて,[図データ]ボタンをクリックしてJP1/PFMへ接続し,確認してください。

(3) 関連項目