Hitachi

JP1 Version 11 JP1/Service Level Management


4.6.1 監視対象サービスのサービス性能の異常の予兆検知と対処の支援の実行例

ここでは,JP1/SLMを使用した監視対象サービスに対するサービス性能の異常の予兆検知と対処の支援について,ある条件に基づいて具体的にどのように実行するとよいかを,例を用いて説明します。

〈この項の構成〉

(1) 前提条件

この実行例の条件は,次のとおりです。

(2) 監視対象サービスのサービス性能の異常の予兆検知

JP1/SLMでの作業

すべてのサービスの監視者が[ホーム]画面を表示して監視対象サービスの状況を監視していたところ,サービス性能の異常の予兆である警告が表示されました。

監視対象サービスに警告が表示されたときの[ホーム]画面での表示例を次の図に示します。

図4‒4 監視対象サービスに警告が表示されたときの[ホーム]画面での表示例

[図データ]

この図で表示されている警告の内容は次のとおりです。

  • 検出日時:2020-02-05 06:41:03

  • 種別:OUTLIER

  • 現象:UPPER LIMIT

  • サービスグループ:Group02

  • 監視対象サービス:Service02

  • 監視対象:All Web Access

  • 監視項目:平均応答時間

この警告は,2020年2月5日の6時41分03秒に,Group02に属するService02の平均応答時間について,ふだんの監視対象サービスの状況と大きく異なる外れ値(上限値を上回った)を検知したことを示しています。

作業の結果

監視員は,警告が表示されたことをすべてのサービスの監視者へ報告しました。

警告を放置すると,エラーにつながるおそれがあるため,すべてのサービスの監視者は,早速対処することにしました。

(3) 監視対象サービスのサービス性能の異常の予兆を検知したあとの対処

JP1/SLMでの作業

すべてのサービスの監視者は,[ホーム]画面に警告が表示されたことを受け,警告として検知された事象の発生時期を[問題調査]画面を利用して調査し,対処することにしました。

監視対象サービスに警告が表示されたときの[問題調査]画面での表示例を次の図に示します。

図4‒5 監視対象サービスに警告が表示されたときの[問題調査]画面での表示例

[図データ]

この図では,平均応答時間の性能グラフから,警告の原因となった事象が06:39:03〜06:43:03の間に発生したと考えられます。

障害予兆が発生した時間帯のWebシステムのサービス利用者からの要求やその応答に関する情報を[アクセス履歴]で確認し,問題となるWebシステム処理を調査します。

図4‒6 監視対象サービスに警告が表示されたときの[アクセス履歴]表示例

[図データ]

作業の結果

[問題調査]画面で,警告として表示された内容,およびその原因となった事象が発生したと考えられる時期が明らかになったため,すべてのサービスの監視者はそれらの情報を監視対象サービスの保守担当者に連絡し,根本的な原因の調査・対処を依頼しました。

(4) 対処後のサービス性能の確認

JP1/SLMでの作業

監視対象サービスの保守担当者による根本的な原因の対処後,すべてのサービスの監視者は,サービス性能が正常な状態に回復しているかを[リアルタイム監視]画面で確認することにしました。

対処が完了し,サービス性能が正常な状態に回復したときの[リアルタイム監視]画面での表示例を次の図に示します。

図4‒7 サービス性能が正常な状態に回復したときの[リアルタイム監視]画面での表示例

[図データ]

この図のように,サービス性能が正常な状態に回復したときは,[サービス性能情報]エリアに[図データ](正常)アイコンが表示されます。

作業の結果

すべてのサービスの監視者は,サービス性能が正常な状態に回復したことを確認でき,監視対象サービスのサービス性能の異常の予兆について対処できました。