14.2.5 監視グループの状態変更条件の定義の検討
監視グループの状態変更条件を定義することで,監視ツリーによるシステム監視がより詳細にできるようになります。
例えば,以降に説明するようなロードバランサーを用いて負荷分散をしているシステムの監視の場合,下位の監視ノードの障害が,上位の監視グループの障害にはならないことがあります。このような特殊な条件下のシステム監視の場合,監視グループの状態変更条件を定義することで,より正確にシステムの状態を管理できるようになります。
ただし,監視グループの状態変更条件を定義する場合には,以降で説明する制限事項があることも留意してください。
(1) 監視グループの状態変更条件の定義例
例えば,次のようなロードバランスシステムを,監視ツリーで監視したい場合について説明します。なお,ここでいうロードバランスシステムとは,ロードバランサーを用いて負荷分散をしているシステムを指します。
- なお,この説明での監視ノードは次のように省略します。
-
-
「Webシステム」:監視グループ(Webシステム)
-
「ロードバランスシステム」:監視グループ(ロードバランスシステム)
-
「サーバX」:監視オブジェクト(サーバX)
-
- また,次のような条件があるものとします。
-
Webシステムを構成するサーバ群(サーバ1〜サーバ5)の内,60%以上(3/5個以上)のサーバの負荷が警告域に達したときに,Webシステムの異常と判定する。
このようなシステムを監視ツリーで監視する場合には,状態の上位伝播の動作として,次のように検討します。
この場合,監視グループの状態変更条件の定義は次のようになります。
監視ノード名称 |
監視グループの状態変更条件 |
||
---|---|---|---|
状態 |
子ノードの状態※ |
比較条件 |
|
ロードバランスシステム |
エラー |
警告 |
比率:60%以上 または 個数:3個以上 |
上記のように設定した場合,「警告」より優先度の高い状態になった「サーバX」が,60%以上または3個以上にならないかぎり,「ロードバランスシステム」「Webシステム」の状態は「初期状態」から変化しません。したがって,上位の監視グループである「ロードバランスシステム」「Webシステム」から,状態変更イベントの検索ができなくなります。
下位の監視ノードの状態変更を管理したい場合,また,上位の監視グループから下位の監視ノードの状態変更イベントを検索したい場合は,例えば次の表に示す定義をしておくことをお勧めします。
監視ノード名称 |
監視グループの状態変更条件 |
||
---|---|---|---|
状態 |
子ノードの状態※ |
比較条件 |
|
ロードバランスシステム |
エラー |
警告 |
比率:60%以上 または 個数:3個以上 |
警告または正常 |
警告 |
比率:20%以上 または 個数:1個以上 |
(2) 監視グループの状態変更条件の定義についての制限事項
監視グループの状態変更条件を定義する場合には,次のような制限事項に留意してください。
-
子ノードが障害色になっていても,上位の監視グループに上位伝播しない。
子ノードが「エラー」になっていても,上位の監視グループは「初期状態」になっている場合があります。この場合,最上位の監視グループまで状態が伝播しないため,アラームランプも点滅しません。
-
状態変更イベントの検索をした場合,下位すべての監視ノードの状態変更イベントが検索結果に表示されないことがある。
検索の対象とした監視グループから,障害色になっている監視オブジェクトまでの間に「初期状態」の監視グループがある場合には,「初期状態」の監視グループ以下の状態変更イベントは,検索の対象外になります。
この場合には,監視ノード検索で,障害色の監視ノードを検索したあと,状態変更イベントの検索をする必要があります。
上記の2項目が,運用上問題になる場合は,子ノードが一つでも「エラー」になった場合に,上位の監視グループを「警告」にする,などの定義をしてください。
-
子ノード数が追加・削除などにより増減した場合には,状態変更条件を見直す必要がある。
子ノードの増減に対しては,定義を見直す必要があります。例えば,子ノード数が5の監視グループに対して,状態変更条件を設定している場合,個数:3個以上,比率:60%以上は同義ですが,子ノードを追加したあとは次のように異なります。
-
個数:3個以上を設定したあと,子ノードを5追加し,子ノード数が10になった場合でも,個数:3個以上のままです(3を契機に状態が変更されます)。
-
比率:60%以上を設定したあと,子ノードを5追加し,子ノード数が10になった場合には,10の60%,つまり6になります(6を契機に状態が変更されます)。
セントラルスコープは自動的に状態変更条件の定義を修正しないため,定期的に状態変更条件の定義を見直すようにしてください。
-
-
対処済み連動機能を使用している場合,下位の監視オブジェクトに対して対処を終えると(状態変更イベントをすべて「対処済」にすると),監視グループは「初期状態」になる。つまり,状態変更イベントの検索の対象外になる。
なお,これが運用上問題になる場合は,一つの子ノードの状態が変わったときに,監視グループの状態も合わせて変わるよう設定してください。例えば,子ノードが一つでも「正常」に遷移した場合,監視グループの状態を「正常」にするなどです。