Hitachi

JP1 Version 12 JP1/SNMP System Observer


10.2.3 プロセスおよびサービス監視での運用方法の最適化

APMと連携してプロセスおよびサービスを監視する際,SSO起動時やAPM起動時のシステムヘルスチェックによって,監視条件が一致しているかを検証します。特にSSO起動時には,すべての監視サーバに対してヘルスチェックを一斉に実行します。そのため,大規模システムの場合は,監視マネージャの処理負荷が増大して,システムヘルスチェックが失敗することがあります。

大規模システム監視の場合は,システムヘルスチェックの失敗を防ぐために,ある一定のエージェント数を単位として,時間差でシステムヘルスチェックを実行する運用とすることを推奨します。

システムヘルスチェックについては,ssoapmon動作定義ファイル(ssoapmon.def)のsso-start-hcheck-interval:キーおよびsso-start-hcheck-unit:キーで設定します。設定方法については,「7.3.7 ssoapmon動作定義ファイル(ssoapmon.def)」を参照してください。

なお,各監視サーバとのヘルスチェックの処理性能はネットワークの性能に依存するため,環境に合わせて,sso-start-hcheck-interval:キーおよびsso-start-hcheck-unit:キーの値を設定する必要があります。また,ヘルスチェックの処理性能は,監視サーバとの同時接続数(max-apm-session:キー)も考慮する必要があります。

例えば,監視サーバの台数が100台の場合,APMのリトライ回数を5回に設定すると,max-apm-session:キーの値は次のように計算できます。

max-apm-session

≧(監視サーバの台数/ (1+APMのリトライ回数))×安全係数1.2

= (100/ (1+5))×1.2

≒20

計算したmax-apm-session:キーと同じ値を,ヘルスチェックを実行する監視サーバの台数(sso-start-hcheck-unit:キー)に設定します。また,20台の監視サーバとのヘルスチェックに必要な時間をsso-start-hcheck-interval:キーに設定します。ヘルスチェックに掛かる時間は,ネットワーク性能に依存しますが,おおよその目安として,監視サーバ1台当たり0.5秒で見積もることを推奨します。

sso-start-hcheck-interval:キーの値の計算式を次に示します。

sso-start-hcheck-interval

≧0.5×sso-start-hcheck-unit

=0.5×20

=10

よって,sso-start-hcheck-interval:キーの設定値は10秒になります。これらの見積もりの値でヘルスチェックの失敗などが発生する場合は,設定値を見直してください。

また,max-apm-session:キーの上記計算式でmax-apm-session:キーの値が32を超える場合は,sso-start-hcheck-unit:キーの値は32を設定してください。

max-apm-session:キーの計算式の詳細は,「7.3.7 ssoapmon動作定義ファイル(ssoapmon.def)」を参照してください。