4.6.2 サービス性能の監視項目を設定する
監視項目は監視対象サービスごとに設定します。この操作は,監視者が実施します。
(1) 作業の前に
サービスグループ管理者の権限があることを確認してください。
監視対象サービスが登録されていることを確認してください。
監視対象サービスの登録方法については,「4.6.1 監視対象サービスを登録する」を参照してください。
-
監視項目を設定する監視対象サービスの監視を停止していることを確認してください。
監視の停止方法については,「5.3.1 監視を開始する」の「(3) 監視の停止手順」を参照してください。
(2) 作業手順
この作業で使用する[設定]画面を次に示します。
[設定]ボタンをクリックする。
[設定メニュー]エリアの[監視設定]を選択する。
[監視設定]エリアが表示されます。
[サービス一覧]エリアから監視対象サービスの監視対象を選択する。
監視対象サービスの監視対象を選択すると,[監視設定]エリアにサービスグループ名と監視対象サービス名と監視対象が表示されます。[SLO監視設定]と[予兆検知設定]には,現在設定されている値が表示されます。監視対象サービスを登録した直後は,デフォルトの値が設定されています。
しきい値監視または傾向監視をする場合,[SLO監視設定]の[項目名]のチェックボックスで監視したい項目をチェックして[しきい値]に値を入力する。
[項目名]のチェックボックスをチェックしてテキストボックスを空欄にした場合,または入力できない値をテキストボックスに入力した場合はエラーメッセージが表示されます。
傾向監視をする場合,[SLO監視設定]の[傾向監視]のチェックボックスで監視したい項目をチェックして,傾向を計算する基準となる時間を入力する。
[項目名]のチェックボックスが選択されているときだけ,[傾向監視]のチェックボックスが活性化します。[傾向監視]のテキストボックスには,傾向監視の対象となる時間を設定します。
[傾向監視]のチェックボックスをチェックしてテキストボックスを空欄にした場合,または入力できない値をテキストボックスに入力した場合はエラーメッセージが表示されます。なお,[エラー率]は傾向監視ができないため,チェックボックスがありません。
[予兆検知設定]の[ベースライン算出日数]および[開始日数]を入力する。
入力できない値をテキストボックスに入力した場合,または空欄の場合はエラーメッセージが表示されます。外れ値検知をしない場合,ベースライン算出日数と開始日数は,デフォルト値のままにしてください。
外れ値検知をする場合,[予兆検知設定]の[項目名]のチェックボックスで監視したい項目をチェックして[感度]を選択する。
監視したい項目を選択して,検知の感度を高・中・低から選択します。感度を高くすると検知されやすくなり,感度を低くすると検知されにくくなります。まずは中を設定して,検知される件数を見ながら感度を調整してください。
複数の監視項目を組み合わせた外れ値検知をするとき,[予兆検知設定]の[平均応答時間]の行の[相関項目]のプルダウンメニューから[スループット]を選択する。
[設定]ボタンをクリックする。
監視項目の設定が成功すると,監視項目の設定の成功を通知するダイアログボックスが表示されます。
ダイアログボックスの[OK]ボタンをクリックすると,設定が反映されます。
(3) 次の作業
(4) 設定例
監視対象サービスに対するサービス性能の異常の予兆検知と対処の支援について,ある条件に基づいて具体的にどのように検討・設定するとよいかを,例を用いて説明します。
(a) SLAからのSLOの定義
- JP1/SLMでの監視項目の設定に向けた作業
監視者は,SLAの内容を確認して,しきい値とするSLOを検討することにしました。
その結果,SLAの契約内容に,応答性能達成率95%以上,サービス可用性99.8%以上などの項目があったため,SLOは次のように定義しました。
平均応答時間:3000ミリ秒
スループット:800件/秒
エラー率:1.0%
また,SLOというしきい値での監視だけでなく,サービス性能の異常を予兆段階で検知・対処する必要があったため,外れ値検知もすることにしました。
- 作業の結果
SLOが定義できたため,監視者は各監視対象サービスについて,監視項目を設定することにしました。
(b) 監視項目の設定
- JP1/SLMでの作業
監視者は,JP1/SLM - Managerにログインして[設定]画面を表示し,定義したSLOに基づき,監視対象サービスの監視項目を設定することにしました。
SLOに基づいた監視対象サービスの監視項目の設定例を次の図に示します。
図4‒15 SLOに基づいた監視対象サービスの監視項目の設定例 この図では,サービスグループ「Group01」のサービス「Service01」に対して監視項目を設定しています。監視項目の設定内容は,次のとおりです。
- [SLO監視設定]
-
表4‒2 [SLO監視設定]での設定内容例 チェックボックス
項目名
しきい値
チェックボックス
傾向監視
チェックする
平均応答時間
3000
チェックする
5
チェックする
スループット
800
チェックする
5
チェックする
エラー率
1.0
−
−
(凡例)
−:設定できません。
[SLO監視設定]では,SLOの定義内容をしきい値として設定した上で,平均応答時間とスループットについて監視対象サービスのサービス性能の異常をいち早く察知するために,傾向監視を設定しました。
また,サービス性能の異常発生時には,別の担当者にも連絡を取って対処しなければならないため,少なくとも5時間前までにサービス性能の異常を察知する必要がありました。そのため,傾向監視の設定時間は5時間としました。
- [予兆検知設定]
-
表4‒3 [予兆検知設定]での設定内容例 ベースライン算出日数
開始日数
チェックボックス
項目名
感度
相関項目
20
5
チェックする
平均応答時間
高
スループット
チェックする
スループット
高
−
チェックする
エラー率
高
−
(凡例)
−:設定できません。
[予兆検知設定]では,できるだけふだんのサービス性能に基づいた監視をするために,20日分のサービス性能でベースラインを算出することにしました。ただし,監視は5日後から開始したいと要望があったため,開始日数は5日としました。
また,すべての監視項目について外れ値検知をすることにした上で,ベースラインから離れたサービス性能が得られた場合に,敏感に検知できるよう感度を高く設定することにしました。さらに,複数の監視項目を組み合わせた外れ値検知も実施して,外れ値検知の精度を上げるよう設定しました。
- 作業の結果
サービスグループ「Group01」のサービス「Service01」について設定が完了したため,残りの監視対象サービスについても同様に監視項目の設定をすることにしました。
すべての監視対象サービスの設定が完了したあと,監視を実行することにしました。