JP1/Integrated Management - Manager 導入・設計ガイド
監視グループの状態変更条件を定義することで,監視ツリーによるシステム監視がより詳細にできるようになります。
例えば,以降に説明するようなロードバランサーを用いて負荷分散をしているシステムの監視の場合,下位の監視ノードの障害が,上位の監視グループの障害にはならないことがあります。このような特殊な条件下のシステム監視の場合,監視グループの状態変更条件を定義することで,より正確にシステムの状態を管理できるようになります。
ただし,監視グループの状態変更条件を定義する場合には,以降で説明する制限事項があることも留意してください。
- <この項の構成>
- (1) 監視グループの状態変更条件の定義例
- (2) 監視グループの状態変更条件の定義についての制限事項
(1) 監視グループの状態変更条件の定義例
例えば,次のようなロードバランスシステムを,監視ツリーで監視したい場合について説明します。なお,ここでいうロードバランスシステムとは,ロードバランサーを用いて負荷分散をしているシステムを指します。
図11-22 監視ツリーでの監視例
- なお,この説明での監視ノードは次のように省略します。
- 「Webシステム」:監視グループ(Webシステム)
- 「ロードバランスシステム」:監視グループ(ロードバランスシステム)
- 「サーバX」:監視オブジェクト(サーバX)
- また,次のような条件があるものとします。
- Webシステムを構成するサーバ群(サーバ1〜サーバ5)の内,60%以上(3/5個以上)のサーバの負荷が警告域に達したときに,Webシステムの異常と判定する。
このようなシステムを監視ツリーで監視する場合には,状態の上位伝播の動作として,次のように検討します。
図11-23 監視ツリーでの監視例,状態の上位伝播の動作
この場合,監視グループの状態変更条件の定義は次のようになります。
表11-5 監視グループの状態変更条件の定義例
監視ノード名称 監視グループの状態変更条件 状態 子ノードの状態※ 比較条件 ロードバランスシステム エラー 警告 比率:60%以上
または
個数:3個以上注※ ここで設定する状態は,設定した状態よりも優先度の高い状態を含みます。例えば,「エラー」を設定した場合には「緊急」「警戒」「致命的」も含みます。
上記のように設定した場合,「警告」より優先度の高い状態になった「サーバX」が,60%以上または3個以上にならないかぎり,「ロードバランスシステム」「Webシステム」の状態は「初期状態」から変化しません。したがって,上位の監視グループである「ロードバランスシステム」「Webシステム」から,状態変更イベントの検索ができなくなります。
下位の監視ノードの状態変更を管理したい場合,また,上位の監視グループから下位の監視ノードの状態変更イベントを検索したい場合は,例えば次の表に示す定義をしておくことをお勧めします。
表11-6 監視グループの状態変更条件の定義例(推奨)
監視ノード名称 監視グループの状態変更条件 状態 子ノードの状態※ 比較条件 ロードバランスシステム エラー 警告 比率:60%以上
または
個数:3個以上警告または正常 警告 比率:20%以上
または
個数:1個以上注※ ここで設定する状態は,設定した状態よりも優先度の高い状態を含みます。例えば,「エラー」を設定した場合には「緊急」「警戒」「致命的」も含みます。
(2) 監視グループの状態変更条件の定義についての制限事項
監視グループの状態変更条件を定義する場合には,次のような制限事項に留意してください。
- 子ノードが障害色になっていても,上位の監視グループに上位伝播しない。
子ノードが「エラー」になっていても,上位の監視グループは「初期状態」になっている場合があります。この場合,最上位の監視グループまで状態が伝播しないため,アラームランプも点滅しません(アラームランプは最上位の監視ノードが「エラー」以上の状態になったときだけ点滅します)。
- 状態変更イベントの検索をした場合,下位すべての監視ノードの状態変更イベントが検索結果に表示されないことがある。
検索の対象とした監視グループから,障害色になっている監視オブジェクトまでの間に「初期状態」の監視グループがある場合には,「初期状態」の監視グループ以下の状態変更イベントは,検索の対象外になります。
この場合には,監視ノード検索で,障害色の監視ノードを検索したあと,状態変更イベントの検索をする必要があります。
上記の2項目が,運用上問題になる場合は,子ノードが一つでも「エラー」になった場合に,上位の監視グループを「警告」にする,などの定義をしてください。
- 子ノード数が追加・削除などにより増減した場合には,状態変更条件を見直す必要がある。
子ノードの増減に対しては,定義を見直す必要があります。例えば,子ノード数が5の監視グループに対して,状態変更条件を設定している場合,個数:3個以上,比率:60%以上は同義ですが,子ノードを追加したあとは次のように異なります。
セントラルスコープは自動的に状態変更条件の定義を修正しないため,定期的に状態変更条件の定義を見直すようにしてください。
- 個数:3個以上を設定したあと,子ノードを5追加し,子ノード数が10になった場合でも,個数:3個以上のままです(3を契機に状態が変更されます)。
- 比率:60%以上を設定したあと,子ノードを5追加し,子ノード数が10になった場合には,10の60%,つまり6になります(6を契機に状態が変更されます)。
- 対処済み連動機能を使用している場合,下位の監視オブジェクトに対して対処を終えると(状態変更イベントをすべて「対処済」にすると),監視グループは「初期状態」になる。つまり,状態変更イベントの検索の対象外になる。
なお,これが運用上問題になる場合は,一つの子ノードの状態が変わったときに,監視グループの状態も合わせて変わるよう設定してください。例えば,子ノードが一つでも「正常」に遷移した場合,監視グループの状態を「正常」にするなどです。
All Rights Reserved. Copyright (C) 2009, 2011, Hitachi, Ltd.