JP1/IT Service Level Management

[目次][用語][索引][前へ][次へ]

4.3.1 すべてのサービスグループの監視対象サービスの状況を確認する

ここでは,すべてのサービスグループの監視対象サービスの状況をまとめて確認する方法について説明します。サービスグループ全体の監視対象サービスの状況を把握した上で,特に注意が必要な監視対象サービスを調べ,該当する監視対象サービスのエラーや警告の発生状況を確認できます。

確認には,[ホーム]画面を使用します。[ホーム]画面では,次の項目を確認できます。

なお,[ホーム]画面の表示は,3秒ごとに最新の状態に更新されます。

<この項の構成>
(1) 作業の前に
(2) 作業手順
(3) 画面の見方
(4) 補足事項
(5) 関連項目

(1) 作業の前に

(2) 作業手順

この作業で使用する[ホーム]画面を次に示します。

[図データ]

  1. [ホーム]画面が表示されていない場合は,[ホーム]ボタンをクリックする。
    [現在のサービスグループ状況サマリー]エリア,[要注意サービス]エリア,および[過去7日間の発行イベント一覧]エリアが表示されます。各エリアの情報を基に,監視している監視対象サービス全体の状況,および特定の監視対象サービスの状況を確認してください。
    なお,手順2.以降の確認の流れは一例です。
  2. [現在のサービスグループ状況サマリー]エリアを確認して,監視対象のサービスグループ全体の監視対象サービスの状況を把握する。
  3. [要注意サービス]エリアを確認して,注意が必要な監視対象サービスを特定する。
  4. [過去7日間の発行イベント一覧]エリアを確認して,手順3.で特定した監視対象サービスのエラーや警告の発生状況を調べる。
    確認済みのイベントについては,[状態]列をクリックして,[未読]を[既読]に変更してください。

監視対象サービスの状況がすべて正常の場合,確認は完了です。

各エリアにエラーや警告が表示されている場合や,気になる状況が表示されている場合は,原因を調査してください。[過去7日間の発行イベント一覧]エリアの[詳細]列をクリックすると,[問題調査]画面に遷移します。[問題調査]画面では,イベントの原因となった事象の発生時期を確認できます。原因となった事象の発生時期の確認方法については,「4.4.1 エラーまたは警告の原因となった事象の発生時期を確認する」を参照してください。

(3) 画面の見方

[現在のサービスグループ状況サマリー]エリア
[図データ]
ログインしているユーザーが監視を担当しているサービスグループの状態が,一覧で表示されます。表示は,3秒ごとに更新されます。
表示項目を次の表に示します。
項番 項目 説明
1 [サービスグループ] ログインしているユーザーが監視を担当しているサービスグループの名称が表示されます。
2 [サービスグループ状況(%)] サービスグループに属している監視対象サービスの現在の状況が表示されます。
1つのサービスグループに属しているすべての監視対象サービスの数を100%とした場合の割合に応じて,エラー,警告,正常,監視停止中の監視対象サービスの割合が,帯グラフで表示されます。
帯グラフの色の意味は次のとおりです。
赤(エラー)
しきい値監視でエラーが発生している監視対象サービスの割合です。
黄(警告)
傾向監視または外れ値検知で警告が発生している監視対象サービスの割合です。
緑(正常)
正常な監視対象サービスの割合です。
灰(監視停止中)
監視を停止している監視対象サービスの割合です。
なお,1つの監視対象サービスの中で複数の監視対象に異なる状態が発生している場合,「赤(エラー) > 黄(警告) > 緑(正常)」の優先順位で,最も優先順位の高い監視対象の状態の色が表示されます(監視停止中の監視対象サービスにほかの状態が発生することはありません)。
例を示します。
  • All Web Access:緑(正常)
  • Webトランザクション1:緑(正常)
  • Webトランザクション2:黄(警告)
このような状態の場合,監視対象サービスの状況は黄(警告)となります。
3 [サービス数] サービスグループに属している監視対象サービスの数が表示されます。
注※
監視の開始後,監視対象サービスの監視対象の性能分析を実行するプロセスで,メモリ不足やスレッドの異常終了が発生した監視対象サービスも監視停止中となります。この場合は,該当の監視対象サービスの監視を停止して,メッセージログに出力されるKNAS32021-Eメッセージを基に原因に対処したあと,再度監視を開始してください。
メッセージログの詳細については「8.2.3 メッセージログ」を参照してください。

[要注意サービス]エリア
[図データ]
過去7日間に発生したエラーまたは警告の件数を基に,監視対象サービスがランキング表示されます。表示は,3秒ごとに更新されます。表示の優先順位は次のとおりです。
  1. エラー件数の多い監視対象サービスから順番に表示されます。
  2. エラー件数が等しい場合,警告件数が多い監視対象サービスが上に表示されます。
  3. 警告件数が等しい場合,サービスグループの名称および監視対象サービスの名称のUnicode順で表示されます。
表示項目を次の表に示します。
項番 項目 説明
1 [サービス] ログインしているユーザーが監視を担当している監視対象サービスの名称が表示されます。
2 [サービスグループ] [サービス]に表示された監視対象サービスが属するサービスグループの名称が表示されます。
3 [現在] [サービス]に表示された監視対象サービスの現在の平均応答時間,スループット,およびエラー率の監視結果が,次に示すアイコンで表示されます。
[図データ](エラー)
しきい値監視でエラーが発生している項目があります。
[図データ](警告)
傾向監視または外れ値検知で警告が発生している項目があります。
[図データ](正常)
各項目の状況は正常です。
[図データ](監視停止中)
該当の監視対象サービスは,現在監視停止中です。
なお,1つの監視対象サービスの中で複数の監視対象に異なる状態が発生している場合,「エラー > 警告 > 正常」の優先順位で,最も優先順位の高い監視対象の状態のアイコンが表示されます(監視停止中の監視対象サービスにほかの状態が発生することはありません)。
例を示します。
  • All Web Access:[図データ](正常)
  • Webトランザクション1:[図データ](正常)
  • Webトランザクション2:[図データ](警告)
このような状態の場合,監視対象サービスの状況は[図データ](警告)となります。
4 [エラー][警告] [サービス]に表示された監視対象サービスで過去7日間に発生したエラーおよび警告の累計件数が表示されます。
注※
監視の開始後,監視対象サービスの監視対象の性能分析を実行するプロセスで,メモリ不足やスレッドの異常終了が発生した監視対象サービスも,[現在]の表示は監視停止中となります。この場合は,該当の監視対象サービスの監視を停止して,メッセージログに出力されるKNAS32021-Eメッセージを基に原因に対処したあと,再度監視を開始してください。
メッセージログの詳細については「8.2.3 メッセージログ」を参照してください。

[過去7日間の発行イベント一覧]エリア
[図データ]
該当する監視対象サービスで過去7日間に発生したイベントの詳細が最新のものから順に,20件ずつ表示されます。イベントは,一度表示されたら7日間経過するまで表示され続けます。表示は,3秒ごとに更新されます。
表示項目を次の表に示します。
項番 項目 説明
1 累計件数 過去7日間で発生したイベントの種類(エラー,警告または正常)ごとの累計件数が表示されます。
2 [図データ]X件中Y-Z件表示[図データ] 監視対象サービスに発生したイベントが20件を超える場合に,ページを切り替えます。
[図データ]または[図データ]をクリックすると,前後のページが表示されます。前のページまたは次のページがない場合はクリックできません。
Xは,過去7日間に発行されたイベントの総数です。YおよびZには,現在のページに何件目から何件目までが表示されているかが表示されます。
3 [状態] 該当のイベントが確認済みであるかどうかの状態が表示されます。
未読
[状態]列をクリックしていないデフォルトの状態です。この行の項目は太字で表示されます。
既読
[状態]列をクリックした状態です。
該当する行の内容を確認したら,この列をクリックして[未読]を[既読]に変更してください。[未読]が[既読]に変更されるまでの間,画面は操作できません。なお,一度[既読]に変更したイベントを[未読]に戻すことはできません。
4 [重要度] イベント発生時の平均応答時間,スループット,およびエラー率の状況が,次に示すアイコンで表示されます。
[図データ](エラー)
しきい値監視でエラーが発生したことを示します。
[図データ](警告)
傾向監視または外れ値検知で警告が発生したことを示します。
[図データ](正常)が表示されることはありません。
なお,同一時刻のサービス性能に複数の状況が発生している場合,アイコンは「エラー > 警告」の優先順位で表示されます。
5 [検出日時] イベントが発生した日時が「YYYY-MM-DDhh:mm:ss」の形式で表示されます。
YYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)
6 [種別] エラーまたは警告の種別が,次の文字列で表示されます。
THRESHOLD
しきい値超過を検知したことを示します(エラー)。
OUTLIER
ふだんの監視対象サービスの状況と大きく異なる外れ値を検知したことを示します(警告)。
TREND
しきい値を超過しそうな傾向を検知したことを示します(警告)。
7 [詳細] [種別]で表示されたエラーまたは警告の詳細が,次の文字列で表示されます。表示される内容は,[種別]と対応しています。
UPPER△LIMIT
[種別]が[THRESHOLD]または[OUTLIER]の場合に表示されます。
[種別]が[THRESHOLD]の場合は,[監視項目]のサービス性能がしきい値を超過したことを示します。
[種別]が[OUTLIER]の場合は,[監視項目]のサービス性能が上限値を上回ったことを示します。
LOWER△LIMIT
[種別]が[OUTLIER]の場合に表示されます。[監視項目]のサービス性能が下限値を下回ったことを示します。
YYYY-MM-DDhh:mm:ss
[種別]が[TREND]の場合に表示されます。[監視項目]のサービス性能がしきい値を超過すると見込まれる時刻が表示されます。(YYYY:年,MM:月,DD:日,hh:時間,mm:分,ss:秒)
また,この列をクリックすることで,[問題調査]画面の性能グラフを表示できます。表示方法については,「4.4 監視対象サービスにエラーまたは警告が表示された場合の原因調査の支援」を参照してください。
8 [サービスグループ] イベントが発生したサービスグループの名称が表示されます。
9 [サービス] イベントが発生した監視対象サービスの名称が表示されます。
10 [監視対象] イベントが発生した監視対象の名称が表示されます。
11 [監視項目] イベントが発生した監視項目が表示されます。

(4) 補足事項

(5) 関連項目