収集条件を設定してリソースを監視している場合,収集したデータがしきい値を超えているかどうかを監視できます。しきい値を超えた場合にイベントを発行したり,任意のコマンドを自動的に実行したりできます。
(1) しきい値による監視の方式
しきい値による監視は次に示す二つの方式があります。
固定しきい値方式では,適切なしきい値を検討して設定する必要があります。対して,統計的しきい値方式では,適切なデータの割合を検討して設定する必要があります。一般的に,「しきい値」は固定の方が直感的であり,固定しきい値方式の方が監視運用設計は容易です。
なお,どちらの方式でも,しきい値を時間帯に応じて変更するには,タスクスケジューラ(Windows),cron(UNIX),またはスケジューラ機能を持つ製品(JP1/AJS3など)と,SSOの運用コマンドを連携させて切り替える必要があります。
(2) しきい値とリソース状態
リソース監視機能のしきい値による監視では,リソース収集値がしきい値を超えているかどうかを監視できます。そのしきい値には,「警戒しきい値」と「危険しきい値」を設定できます。これらによってリソースが,正常域,警戒域,危険域のどの状態にあるかを把握できます。リソースによっては一時的にしきい値を超過する場合があります。このような場合(特異点)に,リソースの状態を変化させないようにするために,連続超過回数を設定することもできます。
しきい値(警戒・危険)とリソース状態の関係を,次の図に示します。この図では,警戒しきい値および危険しきい値の連続超過回数を3に設定した場合の例を示します。
図2-12 しきい値とリソース状態の関係
リソース状態の種類とその決定方法を,次の表に示します。
表2-4 リソース状態の種類と決定方法
状態 | 決定方法 |
---|---|
正常域 | リソースの値が警戒しきい値の範囲内※1,または設定された警戒しきい値の超過回数未満連続してしきい値の範囲外※2。 |
警戒域 | リソースの値が設定された警戒しきい値の超過回数以上連続して警戒しきい値の範囲外※2,かつ下記「危険域」の条件を満たさない。 |
危険域 | リソースの値が設定された危険しきい値の超過回数以上連続して危険しきい値の範囲外※2。 |
認識不能 | 収集状態が「延期中」となった。 |
非監視 |
|
リソース状態が変化した場合には,リソース状態変更イベントを発行できます。イベントについては,「付録I イベント」を参照してください。
(3) しきい値の検証
初期導入時や運用初期段階で,最適な固定しきい値やデータの割合を決定するのは困難です。そのため,しきい値(固定しきい値またはデータの割合)の見直しが必要になる場合があります。この時,実際の収集データを基にして,しきい値や連続超過回数に,現在の設定値または任意の値を指定して検証することで,指定した設定値の場合では,リソース状態が何回警戒域および危険域に変化したかを確認することができます。また,検証で使用したしきい値および連続超過回数を収集条件に反映することもできます。
(4) 自動アクション
リソース状態が変化した際に,自動アクションを実行することもできます。自動アクションとは,システム管理者への通報や資料採取などを実施する任意のコマンドを自動的に実行する機能です。自動アクションに設定するコマンドでは,変数を定義することもできます。定義できる変数については,「付録J 自動アクションで定義できる変数」を参照してください。なお,コマンドの実行権限は,Windowsの場合はAdministrators権限,UNIXの場合はスーパーユーザ権限です。
(5) 注意事項
(a) Windowsでの自動アクション
Windows上でバッチファイルを実行する場合,コマンドラインの先頭に「cmd /q /c」を付加してください。例えば,「C:¥temp¥aaa.bat」を実行する場合は「cmd /q /c C:¥temp¥aaa.bat」と指定してください。また,コマンド拡張機能(IF,DELコマンドなど)を使用したバッチファイルは使用できません。コマンド拡張機能については,Windowsのヘルプを参照してください。
(b) ssocolmngデーモンプロセス起動時の自動アクション実行について
ssocolmngデーモンプロセス起動時のリソース状態に応じて,次に示す表のように自動アクションが実行されます。
ssocolmngデーモンプロセス起動時のリソース状態 | 自動アクションを設定したリソース状態 |
---|---|
正常 | 正常 |
警戒 | 警戒 |
危険 | 危険 |
(c) 統計的しきい値に関する注意事項
統計的しきい値監視で,下記の場合しきい値が0になります。