10.2.4 プロセス監視に関するアラームが意図したとおりに通知されない
監視対象ホストがUNIXの場合,プロセスの稼働・非稼働を監視するときに,監視対象プロセスを停止していなくても異常アラームが通知されて,次の収集時間に正常アラームが通知されることがあります。
UNIX環境では,プロセスが子プロセスを生成する過程で,プロセスのコピーが作成されるため,同じプロセスが複数あるように見えることがあります。そのため,子プロセスを生成するプロセスを監視対象とするときは,プロセス数が増加することを考慮してください。具体的には,プロセス数が増えたタイミングでプロセスの情報が収集されると異常アラームが通知され,プロセス数が1つに戻ったタイミングでプロセスの情報が収集されると正常アラームが通知されるという現象が起こります。
この現象を回避するために,次の設定をして運用してください。
-
監視対象のプロセスから生成される子プロセスについて,同時に存在する最大数が明確なときは,監視対象対象プロセス数の上限のしきい値に,次の計算結果を指定してください。プロセスの最大起動数をm,プロセス1個ごとに同時に存在する子プロセスの最大数をnとします。
m * (1 + n)
ただし,計算結果が「65535」を超えたら,「65535」を設定してください。
-
監視対象のプロセスから生成される子プロセスについて,同時に存在するプロセスの最大数が不明なときは,監視対象対象プロセス数の上限のしきい値に,「65535」を設定してください。
また,プロセスの稼働・非稼働情報をOSから収集できなかった場合,監視対象プロセス数が0個となって,アラームが通知されることがあります。このアラームの通知を防ぐために,[アラーム階層]画面から[新規アラーム > 基本情報]画面または[編集 > 基本情報]画面を開いて,[高度な設定]で[発生頻度を満たした時にアラーム通知する]をチェックし,[2回しきい値超過/インターバル中]と設定してください。