Hitachi

JP1 Version 12 JP1/SNMP System Observer


10.4.2 インシデントの自動解決

NNMiのインシデントの設定で,Pairwise(相関処理)の設定をすることで,自動的にインシデントが解決済みになるようにします。Pairwiseを設定するには,SSOでの設定と,NNMiでの設定の両方が必要です。Pairwiseについての詳細や設定方法については,NNMiの管理者用のヘルプを参照してください。

Pairwiseは,あるインシデントが別のインシデントによって解決とみなせるような,相関する任意の二つのインシデントを定義するものです。Pairwiseの設定は,インシデントを,「問題発生」と「問題解決」を意味するインシデントに分けられる場合に有効です。しかし,SSOの監視(しきい値監視)インシデントは大きく分けて,「正常」,「警戒」,および「危険」の三つの状態があります。したがって,Pairwiseを導入するには,しきい値監視の設定を工夫する必要があります。

ここでは,リソース収集およびアプリケーション監視(プロセス監視)の場合について,自動解決を導入するための設定例を説明します。

なお,インシデントの自動解決をインシデント発行の抑止と併用する場合は,「問題解決」と判断するための正常域のインシデント発行は抑止しないよう設定してください。

〈この項の構成〉

(1) リソース収集の場合

次のような運用をする場合を例に挙げます。

このような運用をする際は,まず,リソース収集での危険しきい値および連続超過回数を,真に危険状態だと判断されるときに「危険域」となるように設定します。

次に,SSOでの定義ファイルの定義例およびNNMiでの設定例を示します。

イベントフィルタ定義ファイル(ssoevtfilter.conf)の定義例(抜粋)を次に示します。

[図データ]

ssocolmng動作定義ファイル(ssocolmng.def)のomit-first-monitor-event:キーの定義例(抜粋)を次に示します。

[図データ]

NNMiでの,インシデントの設定例(Pairwiseの設定例)を次に示します。

[図データ]

(2) アプリケーション監視の場合

アプリケーション監視としてプロセス監視を例に挙げます。通常,監視アプリケーションに登録しているプロセスは複数個(複数種類)ありますが,それらすべてのプロセスが停止することはあまりなく,一部が停止するのが一般的です。つまり,プロセス監視では,プロセス停止などを知らせる,プロセス状態変更イベントが重要です。アプリケーション状態変更イベント(認識不能への状態変化を除く)は抑止できます。

なお,監視アプリケーションによっては,停止したプロセスが自動的に復旧(再起動)する場合があります。そのため,必ずしもシステム管理者が回復処置を実施するとは限りません。プロセス状態が自動的に正常になるアプリケーションを監視している場合,Pairwise設定によって危険インシデントが自動的に解決済みになってしまうため,システム管理者がプロセス停止の発生事実を見逃すおそれがあります。したがって,プロセス監視では,Pairwiseは必ずしも有効ではありません。このことを知った上でインシデント解決を自動化する場合は,次の定義例および設定を参考にしてください。

イベントフィルタ定義ファイル(ssoevtfilter.conf)の定義例(抜粋)を次に示します。

[図データ]

NNMiでの,インシデントの設定例(Pairwiseの設定例)を次に示します。

[図データ]