2.2.8 インシデントの設定
NNMiは,モニタリングで検出した問題やSNMPトラップを根本原因解決機能によって解析し,根本原因を特定すると,インシデントとして通知します。
(1) インシデントとは
インシデントとは,ネットワークに関連して管理者に通知する必要がある重要性の高い情報です。NNMiはネットワークを監視,発生した事象(イベント)を検知し,根本原因解析の機能によって解析することで,管理者が把握する必要がある「インシデント」に絞って通知します。
インシデントは,SNMPやICMP(Ping)によるネットワークの監視や,SNMPトラップによる問題通知の情報を基に根本原因解析をした結果,通知されます。
NNMiでは,このネットワークの監視に対応したインシデント定義として,標準で[管理イベント]インシデントと[SNMPトラップ]インシデントなど約150種類のインシデント定義が設定されています。これらはさまざまな事象に対応しているため,そのまま運用で使用できます。
例えば,ノードダウンが発生したときに発生するインシデントとして,次の内容が[管理イベント]インシデントに設定されています。これらのうち根本原因解析の機能が状況を解析して,適切なインシデントを通知します。
NodeDown(ノード停止中)
NodeOrConnectionDown(ノードまたは接続が停止中)
運用方法の一つとして,「重要なノード」ノードグループに含める方法があります。「重要なノード」が無応答になると,NodeDownのインシデントが発行されるため,これを監視します。
- インシデントの発行例
ネットワーク機器がノードダウンして停止したときに発生したインシデントの例を次に示します。このように,根本原因解析機能によって,根本原因の事象だけがインシデントとして通知されます。
ネットワーク運用での障害の影響を最小限にするため,NNMiではインシデントをもれなく適切に対処する次の仕組みを提供しています。
機能 |
説明 |
参照先 |
---|---|---|
インシデントの自動アクション |
インシデントのライフサイクル状態にあわせて,自動的にアクションが実行されるように設定できます。 |
2.2.8(4) |
インシデントでの障害モニタリング |
インシデントが発生すると,NNMiコンソール上で通知され,表示されます。トポロジマップとインシデントの参照で画面を切り替えながら,内容を確認できます。 |
3.1 |
インシデントのライフサイクル管理 |
NNMiは,インシデントの対応の進行状況をライフサイクル状態として管理しています。 |
4.2 |
これらの機能を使用するために,インシデントを設定しましょう。
(2) インシデント設定の内容を確認する
JP1ネットワーク管理製品には,運用で使用する標準のインシデント設定があらかじめ設定されています。標準で提供されているインシデント設定を見て,基本的な項目を確認してみましょう。
操作手順
[設定]ワークスペース−[インシデント]−[SNMPトラップの設定]または[管理イベントの設定]をクリックします。
SNMPトラップによるインシデントを確認する場合は[SNMPトラップの設定]を,NNMiがネットワーク監視時に検出したインシデントを確認する場合は[管理イベントの設定]を選択してください。
参照したいインシデントの行をクリックして
(開く)をクリックします。
インシデントの設定内容が表示されます。例えば,ノードダウンで発生する次の[管理イベント]インシデントを見てみましょう。
NodeDown(ノード停止中)
NodeOrConnectionDown(ノードまたは接続が停止中)
[説明]にインシデントの意味が表示されます。
インシデントの内容を確認し,理解を深めましょう。必要に応じて,SNMPトラップのインシデントを設定したり,インシデントに自動アクションを設定したりしてください。
(3) SNMPトラップのインシデントを設定する
ネットワーク機器などが障害発生をSNMPトラップで通知するために,SNMPトラップの定義を拡張MIBファイルとして提供している場合があります。NNMiは標準で多くのSNMPトラップのインシデント定義を用意していますが,ネットワーク機器などのベンダー固有の拡張MIBファイルをロードして,機器独自のSNMPトラップのインシデント定義を設定することもできます。一般的なMIBファイルには,MIB定義とSNMPトラップ定義が記述されています。各ベンダーのMIBファイルの詳細については,各ベンダーのマニュアルなどを参照してください。NNMiのインストール時に標準で多くのMIBがロード済みです。ロード済みMIBの一覧は,[設定]ワークスペース−[MIB]−[ロード済みMIB]で参照できます。
前提条件
SNMPトラップを受信するには,次の条件があります。条件を満たさない場合,そのトラップは破棄されます。
SNMPトラップに対応したインシデントが設定されている。かつ,その設定の[有効にする]がチェックされている。
SNMPトラップを発行したソースノードが,検出されている。かつ,そのノードの管理モードが「管理対象」になっている。
詳しくは,NNMiヘルプ「管理」の「SNMPトラップを管理する」のトピックを参照してください。また,検出されていないノードが発行したSNMPトラップを受信したい場合は,NNMiヘルプ「管理」の「未解決の受信SNMPトラップを管理する」のトピックを参照してください。
操作手順
NNMiのnnmloadmib.ovplコマンドを実行します。
指定例:nnmloadmib.ovpl -load MIBファイル名
MIBファイルの内容が,NNMiにロードされます。-loadオプションに,ロードするMIBファイルを指定してください。
NNMiのnnmincidentcfg.ovplコマンドを実行します。
指定例:nnmincidentcfg.ovpl -loadTraps MIBモジュール名
NNMiのMIBデータベースからインシデント構成を作成します。
-loadTrapsオプションに,MIBファイルに定義されているMIBモジュール名を指定してください。
[設定]ワークスペース−[インシデント]−[SNMPトラップの設定]をクリックします。
SNMPトラップの状況を確認できます。
- メモ
SNMPトラップの状況は,nnmtrapdump.ovplコマンドでも確認できます。
- (例)
nnmtrapdump.ovpl -source IPaddr
IPaddrからの受信トラップを表示します。
nnmtrapdump.ovpl -t
受信トラップを連続表示します。設定時の確認などで使用します。
詳細は,ヘルプ「オペレータ用のヘルプ」の「[SNMPトラップ]ビュー」のトピックと,[ヘルプ]メニュー−[NNMiドキュメントライブラリ]−[リファレンスページ]−[nnmtrapdump.ovpl]を参照してください。
- メモ
MIBモジュール名は,MIBファイルを開いてファイルの先頭付近を確認します。「DEFINITIONS ::= BEGIN」の前に定義されている名前がMIBモジュール名です。
- (例)
MIBモジュール名の例
------ MIB Simple Sample
SAMPLE-MIB DEFINITIONS ::= BEGIN
ここでは,SAMPLE-MIBがMIBモジュール名となります。
(4) インシデントに自動アクションを設定する
インシデントに自動アクションを設定すると,特定のライフサイクル状態のときに,指定したコマンドを実行できます。
背景
- メモ
-
JP1/IMと連携すれば,障害発生時にメールを送信したり,パトランプを使用したりできます。
操作手順
[設定]ワークスペース−[インシデント]−[SNMPトラップの設定]または[管理イベントの設定]をクリックします。
SNMPトラップによるインシデントに自動アクションを設定したい場合は[SNMPトラップの設定]を,NNMiがネットワーク監視時に検出したインシデントに自動アクションを設定したい場合は[管理イベントの設定]を選択してください。
自動アクションを設定したいインシデントの行をクリックして
(開く)をクリックします。
をクリックしてタブ表示を切り替え,[アクション]タブが表示されたらクリックします。
- ヒント
自動アクションの設定をノードによって変更したい場合は,設定を行うタブによって,ノードごとに条件を指定できます。
[インタフェースの設定]タブの[アクション]タブ…対象:インタフェースグループで条件指定
[ノードの設定]タブの[アクション]タブ…対象:ノードグループで条件指定
[アクション]タブ…対象:指定なし
優先度は[インタフェースの設定]タブ>[ノードの設定]タブ>普通の[アクション]タブの順です。高い優先度のアクション設定がほかの設定を上書きするため,アクションは1度だけ実行されます。そのため,ノード全般に自動アクションを設定し,特定のノードグループだけ別の自動アクションを実行するなどの運用ができます。
詳細は,NNMiヘルプ「管理」の「インシデントの設定」のトピックを参照してください。
[有効にする]をチェックします。
この設定をしないと,インシデントが発生しても自動アクションが実行されません。
作成者を「カスタマ」に設定します。
ユーザーがインシデントの設定を変更する場合は,作成者を「カスタマ」に変更する必要があります。
[アクション]タブの[ライフサイクルの移行アクション]で
(新規作成)をクリックします。
自動アクションが実行されるタイミングを[ライフサイクル状態]から選択します。
自動アクションを実行したいタイミングに応じて,次のように設定します。
登録済み:障害を検知し,インシデントが発行されたときに,自動アクションを実行します。
進行中:インシデントに担当が割り当てられたり,調査中になったりなどで,[ライフサイクル状態]が「進行中」になったときに,自動アクションを実行します。
完了:障害の対処が完了して,[ライフサイクル状態]が「完了」になったときに,自動アクションを実行します。
解決済み:障害が解決したことをNNMiが検知し,[ライフサイクル状態]が「解決済み」になったときに,自動アクションを実行します。例えば,「ノードが停止したあと回復して起動したタイミングで通報システムと連動したい」という場合は,「解決済み」を指定します。
[コマンドのタイプ]を選択します。
Jythonコマンドを指定する場合は「Jython」,実行ファイルまたはバッチファイルを指定する場合は「ScriptOrExecutable」を選択します。
[コマンド]を入力します。
コマンドタイプ「ScriptOrExecutable」の場合,必要なパラメータが指定されたOS上で実行できるコマンドを入力します。
(設定例)
msg.exe Administrator "インシデント$nameが$sourceNodeNameで発生しました。"
コマンドタイプ「Jython」の場合の入力方法については,NNMiヘルプ「管理」の「インシデントのアクションを設定する」のトピックを参照してください。
(保存して閉じる)をクリックします。
[SNMPトラップの設定]ビューまたは[管理イベントの設定]ビューの
(保存して閉じる)をクリックします。
設定内容が保存されます。
- ヒント
自動アクションの実行状況は,[ツール]メニュー−[インシデントアクションログ]で確認します。また,次のログファイルでも確認できます。
Windowsの場合
NNMiのインストール先データフォルダ\log\nnm\incidentActions.*.*.log
Linuxの場合
/var/opt/OV/log/nnm/public/incidentActions.*.*.log
アクション設定の「有効にする」のチェックを忘れていると,自動アクションが実行されずログにも履歴が出ません。実行されない場合は,まず有効になっているか確認しましょう。詳細は,NNMiヘルプ「管理」の「インシデントの設定」のトピックを参照してください。
次の作業
これで,インシデントに自動アクションを設定できました。次は,SSOにアクセスして,SSOの設定をしましょう。