JP1/Cm2/SNMP System Observer
収集条件を設定してリソースを監視している場合,収集したデータがしきい値を超えているかどうかを監視できます。しきい値を超えた場合にイベントを発行したり,任意のコマンドを自動的に実行したりできます。
- <この項の構成>
- (1) しきい値による監視の方式
- (2) しきい値とリソース状態
- (3) しきい値の検証
- (4) 自動アクション
- (5) 注意事項
しきい値による監視は次に示す二つの方式があります。
- 固定しきい値方式
しきい値を固定値で設定する方式です。通常のシステム監視運用では,この方式を採用してください。
なお,運用開始初期など,固定しきい値を決定するのが困難な場合があります。このため,SSOで収集できるリソースについては,しきい値定義ファイルでデフォルト値を提供しています。ただし,このデフォルト値は参考値です。必要に応じて設定値を最適化してください。固定しきい値のデフォルト値については,「付録H しきい値定義ファイルの初期値一覧」を参照してください。
- 統計的しきい値方式
統計学に基づいた標準偏差から理論的にしきい値を算出する方式です。実際に収集したデータを統計対象母数として,警戒または危険を示す収集データがどの程度含まれているかを「データの割合」として指定します。統計対象とする収集データは「統計の延べ時間」で指定します。収集の継続に伴い統計対象データが変化するため,一定のタイミングで,しきい値も変化するように「算出タイミング」を指定します。現在のしきい値は,ssocolshowコマンドで確認できます。統計期間を時間帯で分割して,時間帯ごとにしきい値を算出することもできます。時間帯にそれぞれIDを付与したものを「時間帯ID」といいます。
固定しきい値方式では,適切なしきい値を検討して設定する必要があります。対して,統計的しきい値方式では,適切なデータの割合を検討して設定する必要があります。一般的に,「しきい値」は固定の方が直感的であり,固定しきい値方式の方が監視運用設計は容易です。
なお,どちらの方式でも,しきい値を時間帯に応じて変更するには,タスクスケジューラ(Windows),cron(UNIX),またはスケジューラ機能を持つ製品(JP1/AJS3など)と,SSOの運用コマンドを連携させて切り替える必要があります。
リソース監視機能のしきい値による監視では,リソース収集値がしきい値を超えているかどうかを監視できます。そのしきい値には,「警戒しきい値」と「危険しきい値」を設定できます。これらによってリソースが,正常域,警戒域,危険域のどの状態にあるかを把握できます。リソースによっては一時的にしきい値を超過する場合があります。このような場合(特異点)に,リソースの状態を変化させないようにするために,連続超過回数を設定することもできます。
しきい値(警戒・危険)とリソース状態の関係を,次の図に示します。この図では,警戒しきい値および危険しきい値の連続超過回数を3に設定した場合の例を示します。
図2-12 しきい値とリソース状態の関係
リソース状態の種類とその決定方法を,次の表に示します。
表2-4 リソース状態の種類と決定方法
状態 決定方法 正常域 リソースの値が警戒しきい値の範囲内※1,または設定された警戒しきい値の超過回数未満連続してしきい値の範囲外※2。 警戒域 リソースの値が設定された警戒しきい値の超過回数以上連続して警戒しきい値の範囲外※2,かつ下記「危険域」の条件を満たさない。 危険域 リソースの値が設定された危険しきい値の超過回数以上連続して危険しきい値の範囲外※2。 認識不能 収集状態が「延期中」となった。 非監視
- 収集状態が「収集完了」,「収集不可」,または「待機中」となった。
- 収集中の監視対象のインスタンスが減った。
- 注※1
- 「範囲内」にはしきい値を含みます。
- 注※2
- 「範囲外」にはしきい値を含みません。
リソース状態が変化した場合には,リソース状態変更イベントを発行できます。イベントについては,「付録I イベント」を参照してください。
初期導入時や運用初期段階で,最適な固定しきい値やデータの割合を決定するのは困難です。そのため,しきい値(固定しきい値またはデータの割合)の見直しが必要になる場合があります。この時,実際の収集データを基にして,しきい値や連続超過回数に,現在の設定値または任意の値を指定して検証することで,指定した設定値の場合では,リソース状態が何回警戒域および危険域に変化したかを確認することができます。また,検証で使用したしきい値および連続超過回数を収集条件に反映することもできます。
リソース状態が変化した際に,自動アクションを実行することもできます。自動アクションとは,システム管理者への通報や資料採取などを実施する任意のコマンドを自動的に実行する機能です。自動アクションに設定するコマンドでは,変数を定義することもできます。定義できる変数については,「付録J 自動アクションで定義できる変数」を参照してください。なお,コマンドの実行権限は,Windowsの場合はAdministrators権限,UNIXの場合はスーパーユーザ権限です。
(5) 注意事項
(a) Windowsでの自動アクション
Windows上でバッチファイルを実行する場合,コマンドラインの先頭に「cmd /q /c」を付加してください。例えば,「C:\temp\aaa.bat」を実行する場合は「cmd /q /c C:\temp\aaa.bat」と指定してください。また,コマンド拡張機能(IF,DELコマンドなど)を使用したバッチファイルは使用できません。コマンド拡張機能については,Windowsのヘルプを参照してください。
(b) ssocolmngデーモンプロセス起動時の自動アクション実行について
ssocolmngデーモンプロセス起動時のリソース状態に応じて,次に示す表のように自動アクションが実行されます。
ssocolmngデーモンプロセス起動時のリソース状態 自動アクションを設定したリソース状態 正常 正常 警戒 警戒 危険 危険 (c) 統計的しきい値に関する注意事項
統計的しきい値監視で,下記の場合しきい値が0になります。
- 初期値算出しない場合
- 初期値算出または定期算出で,統計的しきい値を求めるための収集データが存在しない場合
Copyright (C) 2009, 2011, Hitachi, Ltd.
Copyright (C) 2009, 2011, Hitachi Solutions, Ltd.