Hitachi

JP1 Version 10 JP1/IT Service Level Management


3.1.3 傾向監視によるしきい値超過の事前検知

傾向監視は,監視項目ごとに監視します。監視項目については「3.1.1 JP1/ITSLMの監視方法および監視対象の種類」を参照してください。ただし,エラー率については,傾向監視はできません。

ここでは,傾向監視について説明します。

〈この項の構成〉

(1) 傾向監視とは

傾向監視は,監視対象サービスのサービス性能の傾向を算出して,傾向からサービス性能のしきい値超過を事前に検知する監視方法です。

傾向とは,現在のサービス性能から算出した近似直線です。N時間前から現在時刻までの期間のサービス性能の近似直線が算出されます。この近似直線が現在時刻からN時間以内にしきい値を超過する場合に,サービス性能の異常の予兆として検知されます。Nは[設定]画面で指定する数値です。

[設定]画面での数値の指定方法については,「3.2.7 サービス性能の監視項目を設定する」を参照してください。

傾向監視でしきい値の超過が事前に検知された例を次の図に示します。

図3‒15 しきい値の超過が事前に検知された例

[図データ]

この図では,平均応答時間を監視しています。N時間前から現在時刻までの期間のサービス性能から傾向を算出して,傾向がN時間以内にしきい値を超過する場合に検知されます。

N時間以内のしきい値超過を事前に知るための傾向の算出には,N時間分のサービス性能の蓄積が必要となります。これは,長時間の傾向監視による誤差を小さくするためです。そのため,1時間後までのしきい値超過を事前に知りたい場合は,1時間分のサービス性能の蓄積が必要となります。

近似直線は60秒ごとに更新され,そのたびにしきい値を超過するかどうかが判定されます。検知された場合,警告となって画面に表示されます。

画面に警告が表示された例を次の図に示します。

図3‒16 画面に警告が表示された例(傾向監視)

[図データ]

画面には,警告のアイコン,検出日時,サービス性能がしきい値を超過すると予測される時間,警告の対象となったサービスグループの名称,サービスの名称などの情報が表示されます。傾向がしきい値を超過し続ける場合は,最初に検知された時点の警告だけが表示されます。表示された警告の前後のサービス性能はグラフで確認できます。

グラフを表示した例を次の図に示します。

図3‒17 グラフを表示した例(傾向監視)

[図データ]

グラフでは,傾向がしきい値を超過した時刻が警告のアイコンで,傾向がしきい値を超過する原因となった事象が発生したと推測される時刻が色付きの帯で表示されます。

傾向監視をするためには,[設定]画面で次の項目を設定する必要があります。

しきい値

監視対象サービスの状況を判断する基準となるしきい値を設定します。

傾向を算出する基準となる時間

傾向を算出する基準となるN時間を設定します。N時間は次のように使用されます。

  • N時間前から現在時刻までの期間のサービス性能で傾向が算出されます。

  • 現在時刻からN時間以内に傾向がしきい値を超過するとわかったら検知されます。

JP1/PFMと連携する場合

JP1/PFMと連携することで,システム性能についても傾向監視ができます。システム性能の傾向監視では,次の2種類の監視項目があります。

  • しきい値を上回った場合に通知する監視項目

  • しきい値を下回った場合に通知する監視項目

どちらの監視項目に該当するかは,[設定]画面の[監視設定]エリアで確認できます。[しきい値]列のアイコンが[図データ]の場合はしきい値を上回った場合に通知する監視項目,[図データ]の場合はしきい値を下回った場合に通知する監視項目になります。

(2) 検知される基準

傾向監視では,算出した傾向が平行または上昇傾向で,次のどちらかを満たす場合に検知されます。

Nは[設定]画面で指定する数値です。

[設定]画面での数値の指定方法については,「3.2.7 サービス性能の監視項目を設定する」を参照してください。

傾向が下降傾向の場合は,現在時刻で傾向がしきい値を超過しているときでも,回復する傾向にあると見なせるため検知されません。

なお,傾向の精度を維持するため,傾向は条件を満たした場合だけに算出されます。サービス性能を監視する場合とシステム性能を監視する場合とで傾向を算出する基準は異なります。それぞれの基準について説明します。

サービス性能を監視する場合

傾向は次の条件を満たした場合に算出されます。

  • N時間前から現在時刻まででサービス性能を取得した時間の合計(単位:秒)≧N×3600×30/100(単位:秒)

例えば,Nに5時間を設定した場合は,5×3600×30/100=5400(単位:秒),つまり90分となるため,90分以上のサービス性能を取得している場合に初めて傾向が算出され,傾向監視が実行されます。

システム性能を監視する場合

傾向は次のすべての基準を満たした場合に算出されます。

  • N時間前から現在時刻まででシステム性能を取得した時間の合計(単位:秒)≧N×3600×30/100(単位:秒)

  • N時間前から現在時刻までの間に2つ以上の性能データを取得している

例えば,Nに5時間を設定した場合は,5×3600×30/100=5400(単位:秒),つまり90分となります。90分以上のシステム性能の監視を実施していて,かつ2つ以上の性能データを取得している場合に初めて傾向が算出され,傾向監視が実行されます。

(3) 正常に戻ったと判断される基準

傾向監視の状態が正常に戻ったと判断される基準について説明します。

上限しきい値の監視項目

次のどれかの基準を満たしている場合に,傾向監視の状態が正常に戻ります。

  • 現在時間からN時間後までに傾向がしきい値を超過しなくなった場合

  • 傾向が下降傾向になった場合

  • 傾向が現在時刻でしきい値未満,かつN時間後までしきい値以上にならなくなった場合

下限しきい値の監視項目

次のどれかの基準を満たしている場合に,傾向監視の状態が正常に戻ります。

  • 現在時間からN時間後までに傾向がしきい値を超過しなくなった場合

  • 傾向が上昇傾向になった場合

  • 傾向が現在時刻でしきい値より大きく,かつN時間後までしきい値以下にならなくなった場合

Nは[設定]画面で指定する数値です。

[設定]画面での数値の指定方法については,「3.2.7 サービス性能の監視項目を設定する」を参照してください。

なお,警告が通知されてから正常に回復するまでは,JP1/ITSLM画面の[ホーム]画面および[リアルタイム監視]画面での警告の対象となった監視対象サービスの状態は,警告の状態が維持されます。同じ監視対象サービスの同じ監視項目の傾向監視の通知は抑止されます。そのため,傾向監視で傾向のしきい値超過が検知された場合,最低でも通知から60秒の間は警告の状態が表示されます。

(4) 補足事項

(5) 関連項目