Hitachi

JP1 Version 11 JP1/Service Level Management


1.1.2 サービスの状況を監視します

多くの利用者がいるサービスや,利用者の業務に欠かせないサービスにいったんトラブルが発生してしまうと,利用者に多大な影響を与えるおそれがあります。JP1/SLMでは,評価指標(SLO)となるしきい値に基づいた監視ができます。また,サービスの状況にふだんと異なる様子がないかを監視し,サービス性能の異常の予兆を検知することもできます。

JP1/SLMの監視の仕組みを次の図に示します。

図1‒4 JP1/SLMの監視の仕組み

[図データ]

JP1/SLMは,サービス利用者とサービスの提供サーバの間でやり取りされるリクエスト,およびレスポンスのHTTPパケットを収集し,リアルタイムに集計・分析します。これによって,サービスの状況の「今」を監視します。

また,業務システムで提供されるサービスでは,1つ以上のリクエストおよびレスポンスで1つの処理を実現します。例えば,メールサービスの場合,ログイン処理や,メールの一覧表示処理などの各処理は,複数のリクエストおよびレスポンスによって構成されています。JP1/SLMでは,これらのサービスの処理ごとの状況を監視するために,監視対象サービスのリクエストとレスポンスのうち,監視したい処理を構成するリクエストとレスポンスを判定して,まとまりとして監視できます。

サービスの処理ごとの監視をする場合,処理のまとまりは,リクエストおよびレスポンスのURIに含まれるクエリや,Cookieの情報を基に判別されます。

サービスを処理ごとに監視するかどうかは,次のような処理がある場合に検討してください。

監視対象サービスのサービス性能の異常の予兆検知と対処の支援の例

ここでは,監視対象サービスのサービス性能の異常の予兆である「ふだんと異なるサービスの状況」を検知し,トラブルを事前に対処する場合の例を説明します。

監視対象サービスについて,サービス性能の異常の予兆を検知して対処するまでの流れを次の図に示します。

図1‒5 JP1/SLMで監視対象サービスのサービス性能の異常の予兆を検知して対処するまでの流れ

[図データ]

最初に,応答時間の増加という「サービス性能の異常の予兆」がJP1/SLMを使用したサービスの状況の監視によって検知されます。次に,JP1/SLMでの過去の監視結果から,「サービス性能の異常の予兆」の原因と考えられる事象の発生時期を確認します。この確認結果は,検知された事象への対処に役立てることができます。

原因を特定して対処したあと,JP1/SLMでサービスレベルが回復したことを確認すれば,サービス性能の異常の予兆段階での対処は完了です。

このように,JP1/SLMは監視対象サービスのサービス性能の異常の予兆検知をします。また対処にも役立てられます。サービスにトラブルが発生する前に対処できるようになるため,サービスの利用者の満足度向上にもつながります。

なお,この事例については,監視項目の設定例を「3.3.1 監視対象サービスのサービス性能の異常の予兆検知と対処の支援の設定例」,監視の実行例を「4.6.1 監視対象サービスのサービス性能の異常の予兆検知と対処の支援の実行例」で説明しています。

監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援の例

ここでは,監視対象サービスに,新しく追加された処理を監視する場合の例を説明します。

監視対象サービスでは,バージョンアップに伴い新機能が追加され,新たに処理が追加されました。追加されたばかりの処理はトラブルが発生しやすいため,サービス全体の監視に加えて,新しく追加された処理をJP1/SLMに登録して,個別に監視することになりました。

登録した処理について,サービス性能の異常の予兆を検知して対処するまでの流れを次の図に示します。

図1‒6 JP1/SLMに登録した処理のサービス性能の異常の予兆を検知して対処するまでの流れ

[図データ]

この例では,新しく登録した処理の状況を監視しています。最初に,登録した処理に対する応答時間の増加という「処理ごとのサービス性能の異常の予兆」が,JP1/SLMによって検知されます。次に,JP1/SLMでの過去の監視結果から,「処理ごとのサービス性能の異常の予兆」の原因と考えられる事象の発生時期を確認します。この確認結果は,検知された事象への対処に役立てることができます。

異常の予兆が発生した処理と発生時期から原因を特定して対処したあと,JP1/SLMでサービスレベルが回復したことを確認すれば,処理ごとのサービス性能の異常の,予兆段階での対処は完了です。

このように,JP1/SLMは監視対象サービスの処理ごとのサービス性能の異常の予兆検知をします。また対処にも役立てられます。

なお,この事例については,監視項目の設定例を「3.3.2 監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援の設定例」,監視の実行例を「4.6.2 監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援の実行例」で説明しています。