3.3.2 監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援の設定例
ここでは,「1.1.2 サービスの状況を監視します」の監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援の例について説明します。
監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援について,ある条件に基づいて具体的にどのように検討・設定するとよいかを,例を用いて説明します。
- 〈この項の構成〉
(1) 前提条件
この設定例の条件は,次のとおりです。
サービスグループおよび監視対象サービスは,「3.3.1 監視対象サービスのサービス性能の異常の予兆検知と対処の支援の設定例」と同じように登録されている。
サービスグループGroup01のサービスService01に対して,新たに処理が追加される予定であり,追加される処理はまだ稼働していない。追加される処理については,サービスの委託元で平均応答時間,スループット,およびエラー率の値がシステム要件として決められている。
サービスグループGroup01のサービスService01の監視は停止している。
この作業に関わる担当者の関係は次の図のとおり。
図3‒32 監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援(設定例)に関わる担当者の関係 すべてのサービスの監視者
サービスの委託元の担当者を経てサービスの保守SEから入手したパス,クエリ,およびCookieの情報に基づき,[設定]画面でWebトランザクションを設定する。また,各監視項目についてシステム要件を基にしきい値を検討し,[設定]画面で監視項目を設定する。
サービスの委託元の担当者
契約を交わしてサービスを委託した,サービスの提供者である。委託したサービスのサービスレベルの管理などは,すべてのサービスの監視者に一任している。パス,クエリ,およびCookieなどの監視対象サービスの内部情報について,すべてのサービスの監視者から問い合わせがあった場合,監視対象サービスの保守担当者に確認する。
監視対象サービスの保守担当者
サービスを開発したSEであり,サービス利用者側に駐在して顧客対応をする。サービス委託元の担当者から監視対象サービスについて問い合わせがあった場合,必要な情報を伝える。
(2) パス,クエリ,Cookieの情報からのWebアクセス条件の定義とシステム要件からのしきい値の定義
- JP1/SLMでのWebトランザクションの設定に向けた作業
すべてのサービスの監視者は,サービスの委託元の担当者を経て,監視する処理のパス,クエリ,およびCookieの情報をサービスの保守SEから入手しました。また,監視する処理のシステム要件を基に,監視項目のしきい値を検討しました。入手したパス,クエリ,およびCookieの情報とシステム要件から定義した,Webアクセス条件,セッション条件および監視項目のしきい値を次に示します。
Webアクセス条件
Webアクセス条件
パス
クエリ
Cookie
Webアクセス条件1
/top.html
q=.*
time=.*
session=.*
exp=10
Webアクセス条件2
/middle.html
q=.*
session=.*
exp=10
Webアクセス条件3
/bottom.html
q=.*
session=.*
exp=10
Webアクセス条件4
example/index.html
q=.*
qqq=1
session=.*
セッション条件
クエリ条件:q
Cookie条件:session
監視項目のしきい値
平均応答時間:3,000ミリ秒
スループット:800件/秒
エラー率:1.0%
また,監視項目については,しきい値での監視だけでなく監視対象サービスの処理ごとのサービス性能の異常を予兆段階で検知・対処する必要があったため,外れ値検知もすることにしました。
- 作業の結果
Webトランザクション名を「Transaction1」と決めて,定義したWebアクセス条件を設定することにしました。また,Transaction1にWebアクセス条件を設定したあと,監視項目を設定することにしました。
(3) Webトランザクションの設定
- JP1/SLMでの作業
すべてのサービスの監視者は,サービスの保守SEから入手した情報を基に,Webトランザクションを設定することにしました。WebトランザクションのWebアクセス条件は,自動検出したURIから取り込む方法で設定します。設定は次の流れで実行しました。
JP1/SLM - Managerにログインして[設定]画面の[Webトランザクション設定]エリアを表示します。
[設定]画面の[Webトランザクション設定]エリアを次に示します。
図3‒33 [設定]画面の[Webトランザクション設定]エリア(設定例) この図では,サービスグループ「Group01」のサービス「Service01」に対してWebトランザクションを設定しようとしています。
[サービス一覧]でGroup01のService01を選択後,Webトランザクションの各項目を設定するために,[新規登録]ボタンをクリックして[Webトランザクション登録]画面を表示します。
[Webトランザクション登録]画面を次に示します。
図3‒34 [Webトランザクション登録]画面(設定例) ここでは,Webトランザクション名として「Transaction1」と入力しています。
Webトランザクション「Transaction1」のWebアクセス条件を設定するために,[条件追加]ボタンをクリックして[Webアクセス条件追加]画面を表示します。
自動検出したURIからWebアクセス条件を取り込むため,「検出開始」ボタンをクリックします。検出結果の例を次に示します。
図3‒35 検出されたURIの例 図の3行目のURIを編集して,Webアクセス条件を取り込むことにします。パスが「top.html」,クエリが「q=1」,「time=2」となっているため,パスはそのままでクエリを「q=.*」,「time=.*」に変更して,Webアクセス条件1と同じにします。
CookieもWebアクセス条件1と同じにするため,3行目のURIを選択した状態で,[Cookie編集]ボタンをクリックします。
[Cookie編集]画面を次に示します。
図3‒36 [Cookie編集]画面(設定例) 図のCookieは「index=0」「area=000」となっているため,テキストボックスを編集し,Webアクセス条件1と同じ「session=.*」「exp=10」となるように変更して,[OK]ボタンをクリックします。
[URI候補]3行目がWebアクセス条件1と一致するURIとなったことを確認して,3行目のURIを選択した状態で[∨ URI候補取り込み]ボタンをクリックします。
[Webアクセス条件定義]に,3行目のURIと同じパス,クエリ,Cookieの情報が表示されます。
パス,クエリ,Cookieの情報が表示された[Webアクセス条件追加]画面の例を次の図に示します。
図3‒37 パス,クエリ,Cookieの情報が表示された[Webアクセス条件追加]画面の例 なお,この状態で[∧ Webアクセス条件適用]ボタンをクリックすると,入力した[Webアクセス条件定義]が目的のWebアクセスと一致するかどうかを確認できます。
Webアクセス条件定義が入力されたら,[条件追加]ボタンをクリックします。
Webアクセス条件1がTransaction1に追加されます。
Webアクセス条件1の追加の完了後,残りのWebアクセス条件についても同様に追加します。4つのWebアクセス条件の追加が完了したら,[閉じる]ボタンをクリックして[Webトランザクション登録]画面に戻ります。
Webアクセス条件の追加が完了した[Webトランザクション登録]画面を次に示します。
図3‒38 Webアクセス条件の追加が完了した[Webトランザクション登録]画面(設定例) Webアクセス条件を追加したあと,Webアクセスが同一ユーザーだと識別するために,セッション条件を指定します。[クエリ条件候補]から「q」を選択して[クエリ条件]に移動し,[Cookie条件候補]から「session」を選択して[Cookie条件]に移動します。
セッション条件を指定したら,[登録]ボタンをクリックしてTransaction1を登録します。
- 作業の結果
Transaction1が登録できたため,すべてのサービスの監視者はTransaction1について監視項目を設定することにしました。
(4) 監視項目の設定
- JP1/SLMでの作業
すべてのサービスの監視者は,[設定]画面の[監視設定]エリアを表示し,Webトランザクションの監視項目を設定することにしました。
Webトランザクションの監視項目の設定例を次の図に示します。
図3‒39 Webトランザクションの監視項目の設定例 この図では,サービスグループ「Group01」のサービス「Service01」の「Transaction1」に対して監視項目を設定しています。監視項目の設定内容は,次のとおりです。
- [SLO監視設定]
-
表3‒13 [SLO監視設定]での設定内容例 チェックボックス
項目名
しきい値
チェックボックス
傾向監視
チェックする
平均応答時間
3000
チェックする
5
チェックする
スループット
800
チェックする
5
チェックする
エラー率
1.0
−
−
(凡例)
−:設定できません。
[SLO監視設定]では,SLOの定義内容をしきい値として設定した上で,平均応答時間とスループットについて監視対象サービスのサービス性能の異常をいち早く察知するために,傾向監視を設定しました。
また,サービス性能の異常発生時には,別の担当者にも連絡を取って対処しなければならないため,少なくとも5時間前までにサービス性能の異常を察知する必要がありました。そのため,傾向監視の設定時間は5時間としました。
- [予兆検知設定]
-
表3‒14 [予兆検知設定]での設定内容例 ベースライン算出日数
開始日数
チェックボックス
項目名
感度
相関項目
20
5
チェックする
平均応答時間
高
スループット
チェックする
スループット
高
−
チェックする
エラー率
高
−
(凡例)
−:設定できません。
[予兆検知設定]では,できるだけふだんのサービス性能に基づいた監視をするために,20日分のサービス性能でベースラインを算出することにしました。ただし,監視は5日後から開始したいと要望があったため,開始日数は5日としました。
また,すべての監視項目について外れ値検知をすることにした上で,ベースラインから離れたサービス性能が得られた場合に,敏感に検知できるよう感度を高く設定することにしました。さらに,複数の監視項目を組み合わせた外れ値検知も実施して,外れ値検知の精度を上げるよう設定しました。
- 作業の結果
「Service01」に対して,Webトランザクション「Transaction1」の設定と監視項目の設定が完了したため,「Service01」の監視と合わせて「Transaction1」の監視を実行することにしました。監視の実行例については,「4.6.2 監視対象サービスの処理ごとのサービス性能の異常の予兆検知と対処の支援の実行例」を参照してください。