3.1.3 傾向監視によるしきい値超過の事前検知
傾向監視は,監視項目ごとに監視します。監視項目については「3.1.1 JP1/SLMの監視方法および監視対象の種類」を参照してください。ただし,エラー率については,傾向監視はできません。
ここでは,傾向監視について説明します。
(1) 傾向監視とは
傾向監視は,監視対象サービスのサービス性能の傾向を算出して,傾向からサービス性能のしきい値超過を事前に検知する監視方法です。
傾向とは,現在のサービス性能から算出した近似直線です。N時間前から現在時刻までの期間のサービス性能の近似直線が算出されます。この近似直線が現在時刻からN時間以内にしきい値を超過する場合に,サービス性能の異常の予兆として検知されます。Nは[設定]画面で指定する数値です。
[設定]画面での数値の指定方法については,「3.2.9 サービス性能の監視項目を設定する」を参照してください。
傾向監視でしきい値の超過が事前に検知された例を次の図に示します。
この図では,平均応答時間を監視しています。N時間前から現在時刻までの期間のサービス性能から傾向を算出して,傾向がN時間以内にしきい値を超過する場合に検知されます。
N時間以内のしきい値超過を事前に知るための傾向の算出には,N時間分のサービス性能の蓄積が必要となります。これは,長時間の傾向監視による誤差を小さくするためです。そのため,1時間後までのしきい値超過を事前に知りたい場合は,1時間分のサービス性能の蓄積が必要となります。
近似直線は60秒ごとに更新され,そのたびにしきい値を超過するかどうかが判定されます。検知された場合,警告となって画面に表示されます。
画面に警告が表示された例を次の図に示します。
|
画面には,警告のアイコン,検出日時,サービス性能がしきい値を超過すると予測される時刻,警告の対象となったサービスグループの名称,サービスの名称などの情報が表示されます。傾向がしきい値を超過し続ける場合は,最初に検知された時点の警告だけが表示されます。表示された警告の前後のサービス性能はグラフで確認できます。
グラフを表示した例を次の図に示します。
|
グラフでは,傾向のしきい値超過を検知した時刻が警告のアイコンで示されます。また,サービス性能がしきい値を超過すると予測される時刻と,傾向のしきい値超過を検知した時刻が黄色の帯で表示されます。
傾向監視をするためには,[設定]画面で次の項目を設定する必要があります。
しきい値
傾向を算出する基準となる時間
- しきい値
監視対象サービスの状況を判断する基準となるしきい値を設定します。
- 傾向を算出する基準となる時間
傾向を算出する基準となるN時間を設定します。N時間は次のように使用されます。
N時間前から現在時刻までの期間のサービス性能で傾向が算出されます。
現在時刻からN時間以内に傾向がしきい値を超過するとわかったら検知されます。
- JP1/PFMと連携する場合
-
JP1/PFMと連携することで,システム性能についても傾向監視ができます。システム性能の傾向監視では,次の2種類の監視項目があります。
-
しきい値を上回った場合に通知する監視項目
-
しきい値を下回った場合に通知する監視項目
どちらの監視項目に該当するかは,[設定]画面の[監視設定]エリアで確認できます。[しきい値]列のアイコンが
の場合はしきい値を上回った場合に通知する監視項目,
の場合はしきい値を下回った場合に通知する監視項目になります。
-
(2) 検知される基準
傾向監視では,算出した傾向が平行または上昇傾向で,次のどちらかを満たす場合に検知されます。
傾向が現在時刻ですでにしきい値以上の場合
通知する警告イベントの[詳細]の時刻は,現在時刻と同じになります。
傾向がN時間以内にしきい値以上になる場合
通知する警告イベントの[詳細]の時刻には,しきい値を超過する時刻が表示されます。
Nは[設定]画面で指定する数値です。
[設定]画面での数値の指定方法については,「3.2.9 サービス性能の監視項目を設定する」を参照してください。
傾向が下降傾向の場合は,現在時刻で傾向がしきい値を超過しているときでも,回復する傾向にあると見なせるため検知されません。
なお,傾向の精度を維持するため,傾向は条件を満たした場合だけに算出されます。サービス性能を監視する場合とシステム性能を監視する場合とで傾向を算出する基準は異なります。それぞれの傾向を算出する基準について説明します。
- サービス性能を監視する場合
傾向は次の条件を満たした場合に算出されます。
N時間前から現在時刻まででサービス性能を取得した時間の合計(単位:秒)≧N×3600×30/100(単位:秒)
例えば,Nに5時間を設定した場合は,5×3600×30/100=5400(単位:秒),つまり90分となるため,90分以上のサービス性能を取得している場合に初めて傾向が算出され,傾向監視が実行されます。
- システム性能を監視する場合
-
傾向は次のすべての基準を満たした場合に算出されます。
-
N時間前から現在時刻まででシステム性能を取得した時間の合計(単位:秒)≧N×3600×30/100(単位:秒)
-
N時間前から現在時刻までの間に2つ以上の性能データを取得している
例えば,Nに5時間を設定した場合は,5×3600×30/100=5400(単位:秒),つまり90分となります。90分以上のシステム性能の監視を実施していて,かつ2つ以上の性能データを取得している場合に初めて傾向が算出され,傾向監視が実行されます。
-
(3) 正常に戻ったと判断される基準
傾向監視の状態が正常に戻ったと判断される基準について説明します。
- 上限しきい値の監視項目
次のどれかの基準を満たしている場合に,傾向監視の状態が正常に戻ります。
現在時間からN時間後までに傾向がしきい値を超過しなくなった場合
傾向が下降傾向になった場合
傾向が現在時刻でしきい値未満,かつN時間後までしきい値以上にならなくなった場合
- 下限しきい値の監視項目
次のどれかの基準を満たしている場合に,傾向監視の状態が正常に戻ります。
現在時間からN時間後までに傾向がしきい値を超過しなくなった場合
傾向が上昇傾向になった場合
傾向が現在時刻でしきい値より大きく,かつN時間後までしきい値以下にならなくなった場合
Nは[設定]画面で指定する数値です。
[設定]画面での数値の指定方法については,「3.2.9 サービス性能の監視項目を設定する」を参照してください。
なお,警告が通知されてから正常に回復するまでは,JP1/SLM画面の[ホーム]画面および[リアルタイム監視]画面での警告の対象となった監視対象サービスの状態は,警告の状態が維持されます。同じ監視対象サービスの同じ監視項目の傾向監視の通知は抑止されます。そのため,傾向監視で傾向のしきい値超過が検知された場合,最低でも通知から60秒の間は警告の状態が表示されます。
(4) 補足事項
現在時刻で,すでにしきい値監視で検知されている場合は,傾向監視による検知はされません。
傾向を算出するに当たって,次のサービス性能は使用されません。
N時間前から現在時刻までに,一度監視を停止して再度開始した場合の開始以前のサービス性能
平均応答時間の傾向監視で,スループットが0となった時刻のサービス性能
Nは[設定]画面の[監視設定]エリアで指定する数値です。
[設定]画面での数値の指定方法については,「3.2.9 サービス性能の監視項目を設定する」を参照してください。
平均応答時間の傾向監視で傾向のしきい値超過が検知されたあとに,スループットと平均応答時間がともに0の時間が続いた場合など,検知された時刻以降に傾向監視に使用しないサービス性能が続いた場合,傾向を変更する情報の追加がないため警告の対象となった監視対象サービスの状態が正常に戻るのが遅くなることがあります。
[監視設定]画面で指定したNがその監視項目の収集間隔以下の場合,傾向監視を実行する設定にしても傾向監視時間の間に性能データを2つ以上取得できません。この場合,近似直線を作成できないため,傾向監視は実行されません。