2.5.2 大規模システムでの運用の検討
大規模システムでの運用で検討が必要な内容について説明します。
- 〈この項の構成〉
(1) エージェントホストのPFMサービスの起動方法
監視マネージャーに接続するエージェントホストのPFMサービスを,複数回に分けて起動することを検討してください。運用で許容できる起動時間と,すべてのエージェントがスタンドアロンモードにならずに起動する時間を検証・比較しながら,同時に起動するエージェント数および間隔時間を決定してください。
同時に起動するエージェント数および間隔時間の目安を次に示します。(エージェントと同一ホストのStatus ServerサービスとAction Handlerサービスを同時に起動させる場合)
-
同時に起動するエージェント数 100
-
間隔時間 100秒
(例)エージェント数が1500の大規模システムで05:00にエージェントホストのPFMサービスを起動する場合,監視マネージャーのPFMサービスが稼働している状態で,エージェントホストのPFMサービスを次の表に示す時刻に起動する。
起動時刻 |
起動するエージェントホストのPFMサービス |
---|---|
05:00:00 |
1〜100までのエージェント |
05:01:40 |
101〜200までのエージェント |
05:03:20 |
201〜300までのエージェント |
05:05:00 |
301〜400までのエージェント |
05:06:40 |
401〜500までのエージェント |
05:08:20 |
501〜600までのエージェント |
05:10:00 |
601〜700までのエージェント |
05:11:40 |
701〜800までのエージェント |
05:13:20 |
801〜900までのエージェント |
05:15:00 |
901〜1000までのエージェント |
05:16:40 |
1001〜1100までのエージェント |
05:18:20 |
1101〜1200までのエージェント |
05:20:00 |
1201〜1300までのエージェント |
05:21:40 |
1301〜1400までのエージェント |
05:23:20 |
1401〜1500までのエージェント |
エージェントホストのPFMサービスを同時に起動(OSの一斉起動や定期的な再起動を含む)した場合,次の注意事項があります。
-
エージェント起動時のエージェントイベント(メッセージテキストにStartupと表示されるイベント)がイベントモニターとイベント履歴に表示されないことがあります。
-
エージェントとアクションハンドラが一時的にスタンドアロンモードで起動し,アラームイベントが発行されるまでに時間がかかることがあります。
(2) PFMサービスを一斉起動したときに通常モードで起動するまでの時間
OSの一斉起動や定期的な再起動などによりPFMサービスが同時に起動した場合,監視マネージャーに負荷が掛かり,エージェントとアクションハンドラが一時的にスタンドアロンモードで起動します。エージェント数が多いとスタンドアロンモードから通常モードに移行するまでに時間が掛かります。スタンドアロンモードの間は,レコードの収集は行われますがアラームの評価が行われません。大規模システムでの運用は,これを考慮する必要があります。通常モードに移行するまでの時間の目安を次の表に示します。
エージェント数※ |
アクションハンドラ数 |
通常モードで起動するまでの時間の目安(単位:分) |
---|---|---|
100 |
100 |
2 |
500 |
500 |
30 |
1,200 |
1,024 |
70 |
2,500 |
2,500 |
120 |
注※ Agent CollectorまたはRM Collectorの数です。
(3) コマンドの実行時間について
jpctool config syncコマンド,jpctool config alarmsyncコマンド,およびjpcconf primmgr notifyコマンドは,エージェントとアクションハンドラに対して通信するため,大規模システムでは実行に時間が掛かります。コマンドの実行時間の目安を次の表に示します。
エージェント数※1 |
アクションハンドラ数 |
コマンドの実行時間の目安(単位:分) |
||
---|---|---|---|---|
jpctool config syncコマンド |
jpctool config alarmsyncコマンド※2 |
jpcconf primmgr notifyコマンド |
||
100 |
100 |
25 |
15 |
2 |
500 |
500 |
120 |
55 |
10 |
1,200 |
1,024 |
240 |
120 |
20 |
2,500 |
2,500 |
585 |
290 |
50 |
- 注※1
-
Agent CollectorまたはRM Collectorの数です。
- 注※2
-
すべてのサービスが同期対象の場合(反映状態がFailedまたはUncertain)の時間です。
jpctool config syncコマンドは,エージェントとアクションハンドラのアラーム情報とノード情報を同期します。jpctool config alarmsyncコマンドは,反映状態がFailedまたはUncertainであるエージェントとアクションハンドラのアラーム情報を同期します。大規模システムではコマンドの実行に時間が掛かるため,必要に応じてコマンドを使い分けてください。
(4) 自動バインド機能を使用するシステムでPFMサービスを一斉起動する場合
自動バインドを設定したあとの初回エージェント起動時にPFMサービスを一斉起動する場合,PFMサービスの過負荷によって,一部のエージェントで自動バインドが失敗する場合があります。自動バインドが失敗すると,KAVE00568-Eメッセージが出力されます。この場合,アラームを再バインドするか対象エージェントを再起動して,アラーム情報を反映してください。
なお,エージェントを複数回に分けて起動すると,この現象を回避できます。この場合,運用で許容できる起動時間と,すべてのエージェントがスタンドアロンモードにならずに起動する時間を十分に検証・比較しながら,同時に起動するエージェント数および間隔時間を決定する必要があります。
(5) エージェントホストのPFMサービスの停止方法
監視マネージャーに接続するエージェントホストのPFMサービスを,複数回に分けて停止することを検討してください。同時に停止するエージェント数および間隔時間の目安を次に示します。(エージェントと同一ホストのStatus ServerサービスとAction Handlerサービスを同時に停止させる場合)
-
同時に停止するエージェント数:500
-
間隔時間:60秒
エージェントホストのPFMサービスを同時に停止(OSの一斉停止や定期的な再起動を含む)した場合,次の注意事項があります。
-
エージェント停止時のエージェントイベント(メッセージテキストにShutdownと表示されるイベント)がイベントモニターとイベント履歴に表示されないことがあります。