6.3.5 アラーム正常回復時の測定値出力機能の設定
複数インスタンスレコードを監視するアラームでは,すべてのインスタンスの値が正常域になった場合に正常と判断するため,アラーム発行の要因となるインスタンスが特定されません。そのため,アラームが正常に回復した場合に,測定値やメッセージテキストには固定値が設定されます。
アラーム正常回復時の測定値出力機能を有効に設定すると,アラームが正常に回復した場合に,最後に異常または警告のアラームが発行されたときに発行の要因となったインスタンスを,アラームが正常に回復した要因となったインスタンスであると仮定し,測定値やメッセージテキストを設定します。
複数インスタンスレコードを監視するアラームが正常状態に回復したときに発行されるアラームの違いを次の表に示します。
項目 |
アラーム正常回復時の測定値出力機能の設定 |
|
---|---|---|
有効 |
無効 |
|
発行されるアラームの数 |
最後に異常または警告のアラームが発行されたときに同時に発行されたアラームの数 |
1個 |
測定値(アラーム定義の変数%CVS) |
最後に異常または警告のアラームが 発行されたときに発行の要因となったインスタンスの現在の値※ |
<OK> |
メッセージテキストの内容(アラーム定義の変数%MTS) |
アラームの定義で設定した値 |
− |
- (凡例)
-
−:発行されない
- 注※
-
値がない場合は(N/A)になります。
アラーム正常回復時の測定値出力機能の設定方法については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。
- ポイント
-
アラーム正常回復時の測定値出力機能が有効な場合でも,アラームメッセージテキストの測定値以外の部分は変化しません。したがって,アラームメッセージテキストに,アラームの状態が異常または警告になったことを示すメッセージを設定している場合,正常アラームの発行時にも異常または警告になったように見えます。このため,アラーム正常回復時の測定値出力機能を有効にする場合は,アラームメッセージテキストには状態を特定しないようなメッセージを設定することをお勧めします。
また,PFM - AgentおよびPFM - RMの監視テンプレートアラームの一部にも,状態を特定するアラームメッセージテキストが設定されているものがあります。アラーム正常回復時の測定値出力機能が有効な場合に,このような監視テンプレートアラームを使用するときには,アラームテーブルをコピーした上でアラームメッセージテキストの内容を適切に編集しておくことをお勧めします。
(1) アラームメッセージテキストの内容
ヘルスチェックエージェントのAbnormal Status(A)アラームでの監視を例にして,アラームメッセージテキストの内容を説明します。Abnormal Status(A)アラームは,エージェントのヘルスチェック状態を監視するアラームです。ここでは,host01のPFM - Agent for Platform(Windows)を対象エージェントとして説明します。
アラーム正常回復時の測定値出力機能の設定による,アラームメッセージテキストの内容の違いを次の表に示します。
事象 |
アラームメッセージテキスト |
|
---|---|---|
機能が有効の場合 |
機能が無効の場合 |
|
値がしきい値を超えて異常または警告アラームが発行された |
Status of TA1host01 changed to Incomplete |
Status of TA1host01 changed to Incomplete |
値がしきい値を下回り正常アラームが発行された |
Status of TA1host01 changed to Running |
− |
- (凡例)
-
−:出力されない
(2) アラームの設定と発行されるアラームの例
ここでは,発行されるアラームとその際のアラームメッセージテキストの内容の例を,次に示すアラームの設定ごとに説明します。
-
通常のアラーム
[状態が変化したときに通知する]※1および[アラームの状態変化]※1を設定していて,かつ[すべてのデータを評価する]※1を設定していないアラームのことです。
-
値の存在を監視するアラーム
[値の存在を監視するアラームとする]※2を設定しているアラームのことです。
-
すべてのデータを評価するアラーム
[すべてのデータを評価する]※1を設定しているアラームのことです。
- 注※1
-
詳細については,マニュアル「JP1/Performance Management リファレンス」の,[新規アラーム > 基本情報]または[編集 > 基本情報]の画面について説明している章を参照してください。
- 注※2
-
詳細については,「6.4.3 存在を監視する値を設定する」を参照してください。
(a) 通常のアラームの場合
通常のアラームが発行された場合の例を説明します。ここでは,PFM - Agent for Platform(Windows)での監視例を示します。アラームの定義内容を次に示します。
-
[アラームメッセージテキスト]:Disk Busy % (%CVS1) = %CVS2
-
[値の存在を監視するアラームとする]:チェックしない
-
[アラームを有効にする]:チェックする
-
[状態が変化したときに通知する]:選択する
-
[アラームの状態変化]:選択する
-
[すべてのデータを評価する]:チェックしない
-
[常に監視する]:チェックする
-
[発生頻度を満たした時にアラーム通知する]:チェックしない
-
[レコード]:Logical Disk Overview (PI_LOGD)
-
[異常条件]:ID <> "_Total" AND % Disk Time >= "90.000"
-
[警告条件]:ID <> "_Total" AND % Disk Time >= "50.000"
■ 異常または警告のアラーム発行後に,その状態を示すインスタンスが遷移した場合
異常または警告のアラームが発行されたあとに,別のインスタンスがそのアラームと同一な状態になった場合の例を次の表に示します。
アラーム評価タイミング |
インスタンスの状態 |
発行アラーム |
|
---|---|---|---|
インスタンス1(Cドライブ) |
インスタンス2(Dドライブ) |
||
1回目 |
測定値:10 状態:正常 |
測定値:20 状態:正常 |
−※1 |
2回目 |
測定値:90 状態:異常 |
測定値:30 状態:正常 |
アラーム:
|
3回目 |
測定値:60 状態:警告 |
測定値:90 状態:異常 |
−※2 |
4回目 |
測定値:20 状態:正常 |
測定値:30 状態:正常 |
アラーム:
|
- (凡例)
-
−:発行されない
- 注※1
-
初回評価時のため正常アラームは発行されません。
- 注※2
-
アラームの状態が変化していないため,異常アラームは発行されません。
この場合,アラーム評価タイミングの2回目と3回目で,それぞれ異なるインスタンスが異常域に遷移しています。しかし,レコードとしての状態は,2回目と3回目の間で変化がないため,3回目に異常アラームは発行されません。
正常アラームの%CVSには,最後に発行された異常または警告アラームの要因となったインスタンスの測定値が格納されます。このため,4回目に発行される正常アラームでは,2回目に異常アラーム発行の要因となったインスタンス1の測定値が用いられます。
■ 異常または警告のアラーム発行後に,別の状態を示すアラームが発行された場合
異常または警告のアラームが発行されたあとに,別のインスタンスの測定値を契機に異なる状態を示すアラームが発行された場合の例を次の表に示します。
アラーム評価タイミング |
インスタンスの状態 |
発行アラーム |
|
---|---|---|---|
インスタンス1(Cドライブ) |
インスタンス2(Dドライブ) |
||
1回目 |
測定値:10 状態:正常 |
測定値:20 状態:正常 |
−※ |
2回目 |
測定値:90 状態:異常 |
測定値:30 状態:正常 |
アラーム:
|
3回目 |
測定値:40 状態:正常 |
測定値:60 状態:警告 |
アラーム:
|
4回目 |
測定値:20 状態:正常 |
測定値:30 状態:正常 |
アラーム:
|
- (凡例)
-
−:発行されない
- 注※
-
初回評価時のため正常アラームは発行されません。
この場合,アラーム評価タイミングの3回目では,インスタンス1が正常域に遷移しています。しかし,同時にインスタンス2が警告域に遷移したため,警告アラームが発行されます。
正常アラームの変数%CVSには,最後に発生した異常または警告アラームの要因となったインスタンスの測定値が格納されます。このため,4回目に発行される正常アラームでは,3回目に警告アラーム発行の要因となったインスタンス2の測定値が用いられます。
(b) 値の存在を監視するアラームの場合
値の存在を監視するアラームが発行された場合を,例を使って説明します。ここでは,PFM - Agent for Platform(Windows)での監視例を示します。アラームの定義内容を次に示します。
-
[アラームメッセージテキスト]:%CVS
-
[値の存在を監視するアラームとする]:チェックする
-
[アラームを有効にする]:チェックする
-
[状態が変化したときに通知する]:選択する
-
[アラームの状態変化]:選択する
-
[すべてのデータを評価する]:チェックしない
-
[常に監視する]:チェックする
-
[発生頻度を満たした時にアラーム通知する]:チェックしない
-
[レコード]:Process Detail Interval (PD_PDI)
-
[フィールド]:Program
-
[値]:process2
このアラームが発行された場合の例を次の表に示します。
アラーム評価タイミング |
インスタンスの状態 |
発行アラーム |
|
---|---|---|---|
インスタンス1 |
インスタンス2 |
||
1回目 |
測定値:process1 |
測定値:process2 |
−※1 |
2回目 |
測定値:process1 |
測定値:process3 |
アラーム:
|
3回目 |
測定値:process3 |
測定値:process4 |
−※2 |
4回目 |
測定値:process2 |
測定値:process3 |
アラーム:
|
- (凡例)
-
−:発行されない
- 注※1
-
初回評価時のため正常アラームは発行されません。
- 注※2
-
アラームの状態が変化していないため,異常アラームは発行されません。
この場合,2回目のアラーム評価タイミングで,存在を監視する値「process2」が消滅したため,異常アラームが発行されます。しかし,値がないためアラームメッセージテキスト中の変数%CVSは(N/A)になります。
4回目では,値「process2」が再び生成されたため,正常アラームが発行されます。アラームメッセージテキスト中の変数%CVSには,存在を監視する値である「process2」が格納されます。
(c) すべてのデータを評価するアラームの場合
すべてのデータを評価するアラームが発行された場合を,例を使って説明します。ここでは,PFM - Agent for Platform(Windows)での監視例を示します。アラームの定義内容を次に示します。
-
[アラームメッセージテキスト]:Disk Busy % (%CVS1) = %CVS2
-
[値の存在を監視するアラームとする]:チェックしない
-
[アラームを有効にする]:チェックする
-
[状態が変化したときに通知する]:選択する
-
[アラームの状態変化]:選択する
-
[すべてのデータを評価する]:チェックする
-
[常に監視する]:チェックする
-
[発生頻度を満たした時にアラーム通知する]:チェックしない
-
[レコード]:Logical Disk Overview (PI_LOGD)
-
[異常条件]:ID <> "_Total" AND % Disk Time >= "90.000"
-
[警告条件]:ID <> "_Total" AND % Disk Time >= "50.000"
このアラームが発行された場合の例を次の表に示します。
アラーム評価タイミング |
インスタンスの状態 |
発行アラーム |
||
---|---|---|---|---|
インスタンス1(Cドライブ) |
インスタンス2(Dドライブ) |
インスタンス1(Cドライブ) |
インスタンス2(Dドライブ) |
|
1回目 |
測定値:10 状態:正常 |
測定値:20 状態:正常 |
−※1 |
−※1 |
2回目 |
測定値:90 状態:異常 |
測定値:90 状態:異常 |
アラーム:
|
アラーム:
|
3回目 |
測定値:20 状態:正常 |
測定値:90 状態:異常 |
−※2 |
−※2 |
4回目 |
測定値:10 状態:正常 |
測定値:20 状態:正常 |
アラーム:
|
アラーム:
|
- (凡例)
-
−:発行されない
- 注※1
-
初回評価時のため正常アラームは発行されません。
- 注※2
-
アラームの状態が変化していないため,異常アラームは発行されません。
すべてのデータを評価する場合,アラームの状態が変化したときに,アラーム条件を満たすデータがあるインスタンスごとにアラームが発行されます。したがって,2回目のアラーム評価タイミングでは,異常域に遷移したインスタンス1とインスタンス2のそれぞれについて,異常アラームが発行されます。
正常アラームは,すべてのインスタンスの測定値が正常域に戻ったときに,最後に発行された異常または警告アラーム数と同じだけ発行されます。この例では,2回目に異常アラームが2つ発行されたため,4回目にも正常アラームが2つ発行されます。このとき,正常アラームの変数%CVSには,2回目に異常アラーム発行の要因となったインスタンス1とインスタンス2の測定値がそれぞれ用いられます。