監視グループの状態変更条件を定義することで,監視ツリーによるシステム監視がより詳細にできるようになります。
例えば,以降に説明するようなロードバランサーを用いて負荷分散をしているシステムの監視の場合,下位の監視ノードの障害が,上位の監視グループの障害にはならないことがあります。このような特殊な条件下のシステム監視の場合,監視グループの状態変更条件を定義することで,より正確にシステムの状態を管理できるようになります。
ただし,監視グループの状態変更条件を定義する場合には,以降で説明する制限事項があることも留意してください。
(1) 監視グループの状態変更条件の定義例
例えば,次のようなロードバランスシステムを,監視ツリーで監視したい場合について説明します。なお,ここでいうロードバランスシステムとは,ロードバランサーを用いて負荷分散をしているシステムを指します。
図11-22 監視ツリーでの監視例
このようなシステムを監視ツリーで監視する場合には,状態の上位伝播の動作として,次のように検討します。
図11-23 監視ツリーでの監視例,状態の上位伝播の動作
この場合,監視グループの状態変更条件の定義は次のようになります。
表11-5 監視グループの状態変更条件の定義例
監視ノード名称 | 監視グループの状態変更条件 | ||
---|---|---|---|
状態 | 子ノードの状態※ | 比較条件 | |
ロードバランスシステム | エラー | 警告 | 比率:60%以上 または 個数:3個以上 |
注※ ここで設定する状態は,設定した状態よりも優先度の高い状態を含みます。例えば,「エラー」を設定した場合には「緊急」「警戒」「致命的」も含みます。
上記のように設定した場合,「警告」より優先度の高い状態になった「サーバX」が,60%以上または3個以上にならないかぎり,「ロードバランスシステム」「Webシステム」の状態は「初期状態」から変化しません。したがって,上位の監視グループである「ロードバランスシステム」「Webシステム」から,状態変更イベントの検索ができなくなります。
下位の監視ノードの状態変更を管理したい場合,また,上位の監視グループから下位の監視ノードの状態変更イベントを検索したい場合は,例えば次の表に示す定義をしておくことをお勧めします。
表11-6 監視グループの状態変更条件の定義例(推奨)
監視ノード名称 | 監視グループの状態変更条件 | ||
---|---|---|---|
状態 | 子ノードの状態※ | 比較条件 | |
ロードバランスシステム | エラー | 警告 | 比率:60%以上 または 個数:3個以上 |
警告または正常 | 警告 | 比率:20%以上 または 個数:1個以上 |
注※ ここで設定する状態は,設定した状態よりも優先度の高い状態を含みます。例えば,「エラー」を設定した場合には「緊急」「警戒」「致命的」も含みます。
(2) 監視グループの状態変更条件の定義についての制限事項
監視グループの状態変更条件を定義する場合には,次のような制限事項に留意してください。
上記の2項目が,運用上問題になる場合は,子ノードが一つでも「エラー」になった場合に,上位の監視グループを「警告」にする,などの定義をしてください。