JP1/IT Service Level Management

[目次][用語][索引][前へ][次へ]

4.4.1 エラーまたは警告の原因となった事象の発生時期を確認する

監視対象サービスにエラーまたは警告が表示された場合,エラーまたは警告の原因となった事象の発生時期を監視対象サービスの監視対象の性能グラフから確認します。

確認には,[ホーム]画面[リアルタイム監視]画面および[問題調査]画面を使用します。

サービスグループ全体の状況を把握した上で,対象とする監視対象サービスを特定してイベントの原因を調査したい場合は,[ホーム]画面を使用します。また,特定の監視対象サービスに注目している場合にその監視対象サービスで発生したイベントの原因を調査したいときは,[リアルタイム監視]画面を使用します。

<この項の構成>
(1) 作業の前に
(2) 作業手順
(3) 画面の見方
(4) 補足事項
(5) 関連項目

(1) 作業の前に

(2) 作業手順

この作業で使用する[ホーム]画面,[リアルタイム監視]画面および[問題調査]画面を次に示します。

  1. [ホーム]画面が表示されていない場合は,[ホーム]ボタンをクリックする。
    [現在のサービスグループ状態サマリー]エリア,[要注意サービス]エリア,および[過去7日間の発行イベント一覧]エリアが表示されます。
    どの監視対象サービスを調査対象とするかをイベントの発行状況から判断したい場合は,手順2.に進んでください。
    調査したい監視対象サービスが明確になっている場合は,手順3.に進んでください。
    また,[ホーム]画面上部の[問題調査]ボタンをクリックして[問題調査]画面を直接表示することもできます。その場合は,表示した[問題調査]画面で調査対象とする監視対象サービスを選択してから,手順7.に進んでください。この場合,手順2.から手順6.の作業は不要です。
  2. [ホーム]画面の[過去7日間の発行イベント一覧]エリアから,確認したいエラーまたは警告を選択し,該当する行の[詳細]列をクリックする。
    選択したエラーまたは警告について,[問題調査]画面の[性能グラフ]タブが表示されます。
    [性能グラフ]タブの表示内容を確認するため,手順7.に進んでください。手順3.から手順6.の作業は不要です。
  3. [リアルタイム監視]ボタンをクリックする。
    [サービス一覧]エリア,[サービス性能情報]エリア,および[イベント/性能グラフ]エリアが画面に表示されます。
  4. [リアルタイム監視]画面の[サービス一覧]エリアで,調査の対象とするサービスグループ,監視対象サービスまたは監視対象サービスの監視対象を選択する。
    なお,監視対象サービスの監視対象を選択した場合は,手順6.に進んでください。手順5.の作業は不要です。
  5. [リアルタイム監視]画面の[サービス性能情報]エリアで,調査の対象とする監視対象サービスの監視対象を選択する。
    しきい値監視,傾向監視または外れ値検知でエラーや警告が発生している場合は,[サービス性能情報]エリアに表示されたアイコンの情報などを基に,調査対象とする監視対象サービスの監視対象を選択してください。
    なお,ここで監視対象サービスの監視対象を選択しないで手順6.に進み,[イベント]タブで監視対象サービスの監視対象を選択してもかまいません。
  6. [リアルタイム監視]画面の[イベント/性能グラフ]エリアの[イベント]タブで発生したイベントの情報を確認し,確認したいエラーまたは警告の[詳細]列をクリックする。
    [イベント]タブの表示内容を基に,しきい値監視,傾向監視または外れ値検知で発生したイベントの情報を確認できます。[詳細]列をクリックすると,エラーまたは警告が発生したサービス性能のメッセージおよび性能グラフが,[問題調査]画面の[イベント/性能グラフ]エリアに表示されます。
  7. [問題調査]画面の[イベント/性能グラフ]エリアの[性能グラフ]タブの性能グラフで,原因となった事象の発生時期を確認する。
    性能グラフを確認して,サービス性能の平均値がベースラインから大きく離れ始めた時間帯を探します。性能グラフでは,サービス性能の変化の大きい個所が色付きの帯で表示されます。そのため,色付きの帯で示された部分は,エラーまたは警告の原因となった事象が発生した時期である可能性があります。

特定した時間帯の情報を基に,同時間帯でのCPU利用率,メモリ使用量またはディスク使用量などを確認して,エラーや警告の要因を検討してください。また,ほかのイベントについても確認したい場合は,手順6.と手順7.を繰り返してください。

なお,性能グラフでは,過去のサービス性能も確認できます。確認する方法については,「4.4.2 過去データを確認する」を参照してください。

(3) 画面の見方

ここでは,[問題調査]画面の見方について説明します。[ホーム]画面については,「4.3.1 すべてのサービスグループの監視対象サービスの状況を確認する」を参照してください。[リアルタイム監視]画面については,「4.3.2 特定のサービスグループの監視対象サービスの状況を確認する」を参照してください。

[サービス一覧]エリア
[サービス一覧]エリアについては,「4.1.2 監視で使用する画面」を参照してください。
なお,[リアルタイム監視]画面の[イベント/性能グラフ]エリアの[イベント]タブで[詳細]列をクリックして[問題調査]画面を表示した場合,または[性能グラフ]タブで[問題調査]ボタンをクリックして[問題調査]画面を表示した場合は,監視対象サービスが選択された状態で表示されます。
[イベント性能グラフ]エリア([イベント]タブを選択した状態)
表示内容は,[リアルタイム監視]画面と同じです。「4.3.2 特定のサービスグループの監視対象サービスの状況を確認する」の「(3) 画面の見方」の説明を参照してください。
ただし,[問題調査]画面では,1ページ当たりのイベントの表示件数は40件です。
[イベント性能グラフ]エリア([性能グラフ]タブを選択した状態)
[図データ]
監視対象サービスの監視対象の性能グラフが表示されます。
表示項目を次の表に示します。
項番 項目 説明
1 X-Y-Z 性能グラフを表示する対象となるサービスグループの名称,監視対象サービスの名称,監視対象サービスの監視対象の名称が表示されます。
Xは,サービスグループの名称です。Yは監視対象サービスの名称です。Zは監視対象サービスの監視対象の名称です。
2 [表示期間]プルダウンメニュー 性能グラフの表示期間を次の値から選択します。デフォルトは1時間です。
  • 1分
  • 10分
  • 30分
  • 1時間
  • 6時間
  • 1日
なお,どの値を選択した場合も,性能グラフにプロットされるデータの数は60個です。表示期間を等間隔に60個に分けた期間の開始時刻の位置に,その期間の最大値がプロットされます。ただし,表示期間に現在時刻を含んでいる場合,プロットされるデータは59個になります。
3 [日時指定]ボタン 性能グラフに表示する対象となる日付と開始時刻を選択します。[日時指定]ボタンをクリックすると表示される[日時指定]ダイアログボックスで指定してください。指定できるのは,60日前までの日時です。
4 [図データ]メッセージ[図データ] イベントを選択した状態で[問題調査]画面の[性能グラフ]タブを表示した場合に表示されます。
メッセージには,イベントの種類を示すアイコン,イベントの種別,詳細,監視項目,およびイベントが発生した日時が次の形式で表示されます。
アイコン 種別詳細監視項目
YYYY-MM-DDhh:mm:ss
YYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)
メッセージの前後の[図データ]または[図データ]をクリックすると,1つ前に発生したイベント,または1つあとに発生したイベントのメッセージが表示されます。なお,前後に発生したイベントがない場合はクリックできません。
5 性能グラフ 選択したイベントの性能グラフが表示されます。
次の性能グラフが日付(YYYY-MM-DD YYYY:年,MM:月,DD:日)と時刻とともに表示されます。
  • 平均応答時間(単位:ミリ秒)
  • スループット(単位:件/秒)
  • エラー率(単位:%)
それぞれの性能グラフには,次の項目が折れ線グラフとして表示されます。
  • 監視項目ごとのサービス性能の測定値
  • しきい値([設定]画面で[SLO監視設定]を設定している場合)
  • ベースライン([設定]画面で[予兆検知設定]を設定している場合)
各項目は,[表示期間]プルダウンメニューで設定した間隔に応じて集計された値を基に表示されます。ただし,変化点を示す帯の幅は,表示期間に関係なく一定です。
性能グラフの右側には,それぞれの折れ線グラフの意味を示す凡例が表示されます。しきい値として設定した値は,[SLOしきい値]として表示されます。
なお,ベースラインは,[設定]画面の[予兆検知設定]で設定した開始日数まで監視の開始から日数が経過していない場合は,表示されません。[設定]画面での開始日数の設定については,「3.2.5 監視項目を設定する」を参照してください。
また,ある時刻の情報がない場合(該当する監視対象サービスの監視が停止されているなどの要因でデータが蓄積されていない期間がある場合),その時刻の性能グラフの線は表示されません。また,グラフの変化点を算出する前に監視対象サービスの監視を停止した場合,停止する直前は変化点を示す帯が表示されません。
サマータイムの終了時刻の1時間前からサマータイムの終了時刻までは横軸の目盛りに時刻が表示されません。この場合は,各性能グラフの折れ線グラフ上にカーソルを合わせることで,時刻を確認してください。
6 性能グラフの詳細 各性能グラフの折れ線グラフ上にカーソルを合わせると表示されます。次の項目が表示されます。
  • 折れ線グラフの種類
  • 日付
    YYYY-MM-DDhh:mm:ssYYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)
性能グラフに表示される期間
  • イベントを選択した状態で[問題調査]画面の[性能グラフ]タブを表示した場合,イベント発生時刻を中心に,[表示期間]で選択した表示期間分の性能グラフが表示されます。
  • イベントを選択しない状態で[問題調査]画面の[性能グラフ]タブを表示した場合,グラフの右端を現在時刻として,[表示期間]で選択した表示期間分の性能グラフが表示されます。
  • [日時指定]ダイアログボックスで日時を指定した場合,指定した時刻を中心に,[表示期間]で選択した表示期間分の性能グラフが表示されます。
性能グラフの操作
性能グラフは,左右にドラッグすることで,事象の発生時期の前後の時間での監視対象サービスの状況を確認できます。1回のドラッグでは,現在の表示期間と同じ期間だけ表示できます。例えば,表示期間が10分であった場合,1回のドラッグで合計20分の期間を確認できます。
[図データ]

(4) 補足事項

(5) 関連項目