JP1/IT Service Level Management

[目次][用語][索引][前へ][次へ]

4.3.2 特定のサービスグループの監視対象サービスの状況を確認する

ここでは,特定のサービスグループの監視対象サービスの状況を確認する方法について説明します。

新たに監視を開始したり,過去に問題があったりした監視対象サービスなど,特に注目して監視する必要がある監視対象サービスがわかっている場合には,[リアルタイム監視]画面を使用して状況を確認します。[リアルタイム監視]画面では,次の項目を確認できます。

なお,[リアルタイム監視]画面の表示は,3秒ごとに最新の状態に更新されます。

<この項の構成>
(1) 作業の前に
(2) 作業手順
(3) 画面の見方
(4) 補足事項
(5) 関連項目

(1) 作業の前に

(2) 作業手順

この作業で使用する[リアルタイム監視]画面を次に示します。

[図データ]

  1. [リアルタイム監視]ボタンをクリックする。
    [サービス一覧]エリア,[サービス性能情報]エリア,および[イベント/性能グラフ]エリアが表示されます。[イベント/性能グラフ]エリアは[イベント]タブが選択された状態で表示されます。
  2. [サービス一覧]エリアでサービスグループ,監視対象サービス,または監視対象サービスの監視対象を選択する。
    [サービス性能情報]エリアおよび[イベント/性能グラフ]エリアに,選択したサービスグループ,監視対象サービス,または監視対象サービスの監視対象についてのサービス性能が表示されます。表示内容を確認してください。
    監視対象サービスの監視対象を選択した場合は,手順4.に進んでください。
  3. [サービス性能情報]エリアで監視対象サービスまたは監視対象サービスの監視対象を選択する。
  4. [性能グラフ]タブをクリックして,現在の監視対象サービスの監視対象の状況をグラフで確認する。
    選択した監視対象サービスの監視対象について,現在の状況を示す性能グラフが表示されます。

[サービス性能情報]エリアの表示がすべて正常の場合,確認は完了です。

[サービス性能情報]エリアや[イベント/性能グラフ]エリアにエラーや警告が表示されている場合や,気になる状況が表示されている場合は,原因を調査してください。[イベント/性能グラフ]エリアの[性能グラフ]タブを選択して,[イベント/性能グラフ]エリア内の[問題調査]ボタンをクリックすると,[問題調査]画面に遷移します。[問題調査]画面では,イベントの原因となった事象の発生時期を確認できます。原因となった事象の発生時期の確認方法については,「4.4.1 エラーまたは警告の原因となった事象の発生時期を確認する」を参照してください。

(3) 画面の見方

[サービス一覧]エリア
[サービス一覧]エリアについては,「4.1.2 監視で使用する画面」を参照してください。
[サービス性能情報]エリア
[図データ]
[サービス一覧]エリアでの選択に応じて,サービス性能が次のように表示されます。
  • [サービス一覧]エリアでサービスグループを選択した場合,サービスグループ内のすべての監視対象サービスのサービス性能が表示されます。監視対象サービスの左にあるアイコン[[図データ]]をクリックするとアイコンが[[図データ]]に変わって監視対象のサービス性能が表示されます。ただし,[サービス一覧]エリアで検索を実行して,表示する監視対象サービスを絞り込んでいた場合は,検索結果として表示されている監視対象サービスのサービス性能だけが表示されます。
  • [サービス一覧]エリアで監視対象サービスまたは監視対象サービスの監視対象を選択した場合,選択した監視対象サービスと監視対象の情報が表示されます。
  • [サービス一覧]エリアで何も選択していない場合,ログインしているユーザーが監視を担当しているすべての監視対象サービスのサービス性能が表示されます。
表示は,3秒ごとに更新されます。
表示項目を次の表に示します。
項番 項目 説明
1 累計件数 過去7日間で発生したイベントの種類(エラー,警告または正常)ごとの累計件数が表示されます。
2 総件数 監視対象の総件数が表示されます。
3 [監視対象] 監視対象サービスと監視対象の名称が表示されます。
4 [サービスグループ] 監視対象サービスが属するサービスグループの名称が表示されます。
5 [総合] [監視対象]に表示された監視対象サービスの状況を総合的に判定した監視結果が,次に示すアイコンで表示されます。
[図データ](エラー)
しきい値監視でエラーが発生している項目があります。
[図データ](警告)
傾向監視または外れ値検知で警告が発生している項目があります。
[図データ](正常)
各項目の状況は正常です。
[図データ](監視停止中)※1
該当の監視対象サービスは,現在監視停止中です。この場合,[平均応答時間(msec)],[スループット(件/sec)],[エラー率(%)]および[平均応答時間+スループット]にも[図データ]が表示されます。
なお,1つの監視対象サービスの監視結果に複数の状況が発生している場合,または1つの監視対象サービスに含まれる監視対象に複数の状況が発生している場合,アイコンは「エラー > 警告 > 正常」の優先順位で表示されます(監視停止中の監視対象サービスにほかの状態が発生することはありません)。
6 [平均応答時間(msec)] 監視項目ごとに,現在の状況を示す[図データ](エラー),[図データ](警告),[図データ](正常)※2または[図データ](監視停止中)※1のアイコンと,測定値(小数点以下3桁まで)が表示されます。
なお,監視対象サービスの監視項目の状況については,1つの監視対象サービスの中で複数の監視対象に異なる状態が発生している場合,「エラー > 警告 > 正常」の優先順位で,最も優先順位の高い監視対象の状態のアイコンが表示されます(監視停止中の監視対象サービスにほかの状態が発生することはありません)。
例を示します。
  • All Web Access:[図データ](正常)
  • Webトランザクション1:[図データ](正常)
  • Webトランザクション2:[図データ](警告)
このような状態の場合,監視対象サービスの状況は[図データ](警告)となります。
なお,監視対象サービスの測定値は,常に「-」(ハイフン)になります。
7 [スループット(件/sec)]
8 [エラー率(%)]
9 [平均応答時間+スループット] 平均応答時間とスループットを組み合わせた外れ値検知の状況が,[図データ](警告),[図データ](正常)※2または[図データ](監視停止中)※1のアイコンで表示されます。
なお,監視対象サービスの監視項目の状況については,1つの監視対象サービスの中で複数の監視対象に異なる状態が発生している場合,「エラー > 警告 > 正常」の優先順位で,最も優先順位の高い監視対象の状態のアイコンが表示されます(監視停止中の監視対象サービスにほかの状態が発生することはありません)。
注※1
監視の開始後,監視対象サービスの監視対象の性能分析を実行するプロセスで,メモリ不足やスレッドの異常終了が発生した監視対象サービスも,[総合]の表示は監視停止中となります。この場合は,該当の監視対象サービスの監視を停止して,メッセージログに出力されるKNAS32021-Eメッセージを基に原因に対処したあと,再度監視を開始してください。
メッセージログの詳細については「8.2.3 メッセージログ」を参照してください。
注※2
しきい値監視および外れ値検知のための設定をしていない場合,監視対象サービスの監視が開始されているときには必ず[図データ](正常)が表示されます。この場合,サービス性能は取得できますが,アイコンでの正常,警告,エラーの判定はできません。

 
また,このエリアで[監視対象]の監視対象サービスを選択すると,[イベント/性能グラフ]エリアの表示内容が切り替わります。
[イベント/性能グラフ]エリア([イベント]タブを選択した状態)
[図データ]
[サービス一覧]エリアおよび[サービス性能情報]エリアの選択に応じて,イベントの一覧が次のように表示されます。
[サービス一覧]エリアでの選択 [サービス性能情報]エリアでの選択 [イベント/性能グラフ]エリアの[イベント]タブに表示されるイベント
すべてのサービスグループの監視対象サービスの監視対象のイベントが表示されます。
サービスグループ [サービス一覧]エリアで選択したサービスグループのすべての監視対象サービスの監視対象のイベントが表示されます。
監視対象サービス [サービス性能情報]エリアで選択した監視対象サービスのすべての監視対象のイベントが表示されます。
監視対象 [サービス性能情報]エリアで選択した監視対象のイベントが表示されます。
監視対象サービス [サービス一覧]エリアで選択した監視対象サービスのすべての監視対象のイベントが表示されます。
監視対象サービス [サービス性能情報]エリアで選択した監視対象サービスのすべての監視対象のイベントが表示されます。
監視対象 [サービス性能情報]エリアで選択した監視対象のイベントが表示されます。
監視対象 [サービス一覧]エリアで選択した監視対象のイベントが表示されます。
監視対象サービス [サービス性能情報]エリアで選択した監視対象サービスのすべての監視対象のイベントが表示されます。
監視対象 [サービス性能情報]エリアで選択した監視対象のイベントが表示されます。
(凡例)
-:選択していません。

イベントは最新のものから表示されます。[サービス一覧]エリアで検索を実行して表示する監視対象を絞り込んでいた場合は,サービスグループや監視対象サービスを選択しても,検索結果として表示されている監視対象の情報だけが表示されます。
イベントは,一度表示されたら7日間経過するまで表示され続けます。表示は,3秒ごとに更新されます。
表示項目を次の表に示します。
項番 項目 説明
1 X-Y-Z イベントを表示する対象となるサービスグループの名称,監視対象サービスの名称,監視対象の名称が表示されます。
Xは,サービスグループの名称です。Yは監視対象サービスの名称です。Zは監視対象の名称です。
次のように表示されます。
  • [サービス一覧]エリアでサービスグループを選択した場合は,Xだけが表示されます。
  • [サービス一覧]エリアまたは[サービス性能情報]エリアで監視対象サービスを選択した場合は,X-Yだけが表示されます。
  • [サービス一覧]エリアまたは[サービス性能情報]エリアで監視対象を選択した場合はX-Y-Zが表示されます。
  • [サービス一覧]エリアおよび[サービス性能情報]エリアで何も選択していない場合は,何も表示されません。
2 累計件数 過去60日間で発生したイベントの種類(エラー,警告または正常)ごとの累計件数が表示されます。
3 [図データ]X件中Y-Z件表示[図データ] イベントの件数が20件を超える場合に,ページを切り替えます。
[図データ]または[図データ]をクリックすると,前後のページが表示されます。前のページまたは次のページがない場合はクリックできません。
Xは,表示対象となるイベントの総数です。YおよびZには,現在のページに何件目から何件目までが表示されているかが表示されます。
4 [状態] 該当のイベントが確認済みであるかどうかの状態が表示されます。
未読
[状態]列をクリックしていないデフォルトの状態です。この行の項目は太字で表示されます。
既読
[状態]列をクリックした状態です。
該当する行の内容を確認したら,この列をクリックして[未読]を[既読]に変更してください。なお,一度[既読]に変更したイベントを[未読]に戻すことはできません。
5 [重要度] イベント発生時の平均応答時間,スループット,およびエラー率の監視結果が,次に示すアイコンで表示されます。
[図データ](エラー)
しきい値監視でエラーが発生したことを示します。
[図データ](警告)
傾向監視または外れ値検知で警告が発生したことを示します。
[図データ](正常)が表示されることはありません。
なお,同一時刻のサービス性能に複数の状況が発生している場合,アイコンは「エラー > 警告」の優先順位で表示されます(監視停止中の監視対象サービスにほかの状態が発生することはありません)。
6 [検出日時] イベントが発生した日時が「YYYY-MM-DDhh:mm:ss」の形式で表示されます。
YYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)
7 [種別] エラーまたは警告の種別が,次の文字列で表示されます。
THRESHOLD
しきい値超過を検知したことを示します(エラー)。
OUTLIER
ふだんの監視対象サービスの状況と大きく異なる外れ値を検知したことを示します(警告)。
TREND
しきい値を超過しそうな傾向を検知したことを示します(警告)。
8 [詳細] [種別]で表示されたエラーまたは警告の詳細が,次の文字列で表示されます。表示される内容は,[種別]と対応しています。
UPPER△LIMIT
[種別]が[THRESHOLD]または[OUTLIER]の場合に表示されます。
[種別]が[THRESHOLD]の場合は,[監視項目]のサービス性能がしきい値を超過したことを示します。
[種別]が[OUTLIER]の場合は,[監視項目]のサービス性能が上限値を上回ったことを示します。
LOWER△LIMIT
[種別]が[OUTLIER]の場合に表示されます。[監視項目]のサービス性能が下限値を下回ったことを示します。
YYYY-MM-DDhh:mm:ss
[種別]が[TREND]の場合に表示されます。[監視項目]のサービス性能がしきい値を超過すると見込まれる時刻が表示されます。(YYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)
また,この列をクリックすることで,[問題調査]画面の性能グラフを表示できます。表示方法については,「4.4 監視対象サービスにエラーまたは警告が表示された場合の原因調査の支援」を参照してください。
9 [サービスグループ] イベントが発生したサービスグループの名称が表示されます。
10 [サービス] イベントが発生した監視対象サービスの名称が表示されます。
11 [監視対象] イベントが発生した監視対象の名称が表示されます。
12 [監視項目] イベントが発生した監視項目が表示されます。
[イベント/性能グラフ]エリア([性能グラフ]タブを選択した状態)
[図データ]
[性能グラフ]タブは,[サービス一覧]エリアまたは[サービス性能情報]エリアで監視対象サービスの監視対象を選択した場合だけ選択できるタブです。
選択した監視対象サービスの監視対象のサービス性能が監視項目ごとに折れ線グラフで表示されます。表示は,3秒ごとに更新されます。
表示項目を次の表に示します。
項番 項目 説明
1 X-Y-Z 性能グラフを表示する対象となるサービスグループの名称,監視対象サービスの名称,監視対象の名称が表示されます。
Xは,サービスグループの名称です。Yは監視対象サービスの名称です。Zは監視対象の名称です。
次のように表示されます。
  • [サービス一覧]エリアまたは[サービス性能情報]エリアで監視対象を選択した場合はXYZが表示されます。
2 [表示期間]プルダウンメニュー 性能グラフの表示期間を「1分」「3分」「5分」から選択します。
デフォルトでは,「1分」が選択されています。
3 [問題調査]ボタン 監視対象サービスの監視対象についての[問題調査]画面を表示するためのボタンです。選択している監視対象サービスの監視対象の過去の状況を確認できます。過去の状況の確認方法については,「4.4.2 過去データを確認する」を参照してください。
4 性能グラフ 選択した監視対象サービスの監視対象の性能グラフが表示されます。
次の性能グラフが表示されます。
  • 平均応答時間(単位:ミリ秒)
  • スループット(単位:件/秒)
  • エラー率(単位:%)
それぞれの性能グラフには,次の項目が折れ線グラフとして表示されます。
  • 監視項目ごとのサービス性能の測定値
  • しきい値([設定]画面で[SLO監視設定]を設定している場合)
  • ベースライン([設定]画面で[予兆検知設定]を設定している場合)
各項目は,[表示期間]プルダウンメニューで設定した期間に応じて集計された値を基に表示されます。
性能グラフの右側には,それぞれの折れ線グラフの意味を示す凡例が表示されます。しきい値として設定した値は,[SLOしきい値]として表示されます。
なお,ベースラインは,[設定]画面の[予兆検知設定]で設定した開始日数まで監視の開始から日数が経過していない場合は,表示されません。[設定]画面での開始日数の設定については,「3.2.5 監視項目を設定する」を参照してください。
また,ある時刻の情報がない場合(該当する監視対象サービスの監視が停止されているなどの要因でデータが蓄積されていない期間がある場合),その時刻の性能グラフの線は表示されません。
サマータイムの終了時刻の1時間前からサマータイムの終了時刻までは横軸の目盛りに時刻が表示されません。この場合は,各性能グラフの折れ線グラフ上にカーソルを合わせることで,時刻を確認してください。
5 性能グラフの詳細 各性能グラフの折れ線グラフ上にカーソルを合わせると表示されます。次の項目が表示されます。
  • 折れ線グラフの種類
  • 日付
    YYYY-MM-DDhh:mm:ssYYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)

(4) 補足事項

(5) 関連項目