Hitachi

JP1 Version 12 JP1/Integrated Management 2 - Manager 導入・設計ガイド


12.2.5 監視グループの状態変更条件の定義の検討

監視グループの状態変更条件を定義することで,監視ツリーによるシステム監視がより詳細にできるようになります。

例えば,以降に説明するようなロードバランサーを用いて負荷分散をしているシステムの監視の場合,下位の監視ノードの障害が,上位の監視グループの障害にはならないことがあります。このような特殊な条件下のシステム監視の場合,監視グループの状態変更条件を定義することで,より正確にシステムの状態を管理できるようになります。

ただし,監視グループの状態変更条件を定義する場合には,以降で説明する制限事項があることも留意してください。

〈この項の構成〉

(1) 監視グループの状態変更条件の定義例

例えば,次のようなロードバランスシステムを,監視ツリーで監視したい場合について説明します。なお,ここでいうロードバランスシステムとは,ロードバランサーを用いて負荷分散をしているシステムを指します。

図12‒24 監視ツリーでの監視例

[図データ]

なお,この説明での監視ノードは次のように省略します。
  • 「Webシステム」:監視グループ(Webシステム)

  • 「ロードバランスシステム」:監視グループ(ロードバランスシステム)

  • 「サーバX」:監視オブジェクト(サーバX)

また,次のような条件があるものとします。

Webシステムを構成するサーバ群(サーバ1〜サーバ5)の内,60%以上(3/5個以上)のサーバの負荷が警告域に達したときに,Webシステムの異常と判定する。

このようなシステムを監視ツリーで監視する場合には,状態の上位伝播の動作として,次のように検討します。

図12‒25 監視ツリーでの監視例,状態の上位伝播の動作

[図データ]

この場合,監視グループの状態変更条件の定義は次のようになります。

表12‒8 監視グループの状態変更条件の定義例

監視ノード名称

監視グループの状態変更条件

状態

子ノードの状態

比較条件

ロードバランスシステム

エラー

警告

比率:60%以上

または

個数:3個以上

注※ ここで設定する状態は,設定した状態よりも優先度の高い状態を含みます。例えば,「エラー」を設定した場合には「緊急」「警戒」「致命的」も含みます。

上記のように設定した場合,「警告」より優先度の高い状態になった「サーバX」が,60%以上または3個以上にならないかぎり,「ロードバランスシステム」「Webシステム」の状態は「初期状態」から変化しません。したがって,上位の監視グループである「ロードバランスシステム」「Webシステム」から,状態変更イベントの検索ができなくなります。

下位の監視ノードの状態変更を管理したい場合,また,上位の監視グループから下位の監視ノードの状態変更イベントを検索したい場合は,例えば次の表に示す定義をしておくことをお勧めします。

表12‒9 監視グループの状態変更条件の定義例(推奨)

監視ノード名称

監視グループの状態変更条件

状態

子ノードの状態

比較条件

ロードバランスシステム

エラー

警告

比率:60%以上

または

個数:3個以上

警告または正常

警告

比率:20%以上

または

個数:1個以上

注※ ここで設定する状態は,設定した状態よりも優先度の高い状態を含みます。例えば,「エラー」を設定した場合には「緊急」「警戒」「致命的」も含みます。

(2) 監視グループの状態変更条件の定義についての制限事項

監視グループの状態変更条件を定義する場合には,次のような制限事項に留意してください。

上記の2項目が,運用上問題になる場合は,子ノードが一つでも「エラー」になった場合に,上位の監視グループを「警告」にする,などの定義をしてください。