JP1/IT Service Level Management

[目次][用語][索引][前へ][次へ]

4.6.2 監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援(実行例)

ここでは,JP1/ITSLMを使用した監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援について,ある条件に基づいて具体的にどのように実行するとよいかを,例を用いて説明します。

<この項の構成>
(1) 前提条件
(2) 監視対象サービスの処理ごとのサービス性能の異常の予兆検知
(3) 監視対象サービスの処理ごとのサービス性能の異常の予兆を検知したあとの対処
(4) 対処後のサービス性能の確認

(1) 前提条件

この実行例の条件は,次のとおりです。

(2) 監視対象サービスの処理ごとのサービス性能の異常の予兆検知

JP1/ITSLMでの作業
すべてのサービスの監視者が[ホーム]画面を表示して監視対象サービスおよび監視対象サービスの処理ごとの状況を監視していたところ,処理に対応するWebトランザクションで,サービス性能の異常の予兆である警告が表示されました。
監視対象サービスのWebトランザクションに警告が表示されたときの[ホーム]画面での表示例を次の図に示します。

図4-9 監視対象サービスのWebトランザクションに警告が表示されたときの[ホーム]画面での表示例

[図データ]
この図で表示されている警告の内容は次のとおりです。
  • 検出日時:2011-04-05 15:32:09
  • 種別:OUTLIER
  • 現象:UPPER LIMIT
  • サービスグループ:Group01
  • 監視対象サービス:Service01
  • 監視対象:Transaction1
  • 監視項目:平均応答時間
この警告は,2011年4月5日の15時32分09秒に,Group01に属するService01のTransaction1の平均応答時間について,ふだんの監視対象サービスの状況と大きく異なる外れ値(上限値を上回った)を検知したことを示しています。
作業の結果
警告を放置すると,エラーにつながるおそれがあるため,すべてのサービスの監視者は,早速対処することにしました。

(3) 監視対象サービスの処理ごとのサービス性能の異常の予兆を検知したあとの対処

JP1/ITSLMでの作業
すべてのサービスの監視者は,[ホーム]画面に警告が表示されたことを受け,警告として検知された事象の発生時期を[問題調査]画面を利用して調査し,対処することにしました。
監視対象サービスのWebトランザクションに警告が表示されたときの[問題調査]画面での表示例を次の図に示します。

図4-10 監視対象サービスのWebトランザクションに警告が表示されたときの[問題調査]画面での表示例

[図データ]
この図では,平均応答時間の性能グラフから,警告の原因となった事象が15:12:23〜15:16:23の間に発生したと考えられることがわかります。
作業の結果
[問題調査]画面で,警告として表示された内容,およびその原因となった事象が発生したと考えられる時期が明らかになったため,すべてのサービスの監視者はそれらの情報をシステム運用者に連絡し,根本的な原因の調査・対処を依頼しました。

(4) 対処後のサービス性能の確認

JP1/ITSLMでの作業
システム運用者による根本的な原因の対処後,すべてのサービスの監視者は,Webトランザクションのサービス性能が正常な状態に回復しているかを[リアルタイム監視]画面で確認することにしました。
対処が完了し,Webトランザクションのサービス性能が正常な状態に回復したときの[リアルタイム監視]画面での表示例を次の図に示します。

図4-11 Webトランザクションのサービス性能が正常な状態に回復したときの[リアルタイム監視]画面での表示例

[図データ]
この図のように,Webトランザクションのサービス性能が正常な状態に回復したときは,[サービス性能情報]エリアに[図データ](正常)アイコンが表示されます。
作業の結果
すべてのサービスの監視者は,Webトランザクションのサービス性能が正常な状態に回復したことを確認できました。これによって,監視対象サービスの処理ごとのサービス性能の異常の予兆について対処できました。