Hitachi

JP1 Version 12 JP1/Performance Management 設計・構築ガイド


2.5.2 大規模システムでの運用の検討

大規模システムでの運用で検討が必要な内容について説明します。

〈この項の構成〉

(1) エージェントホストのPFMサービスの起動方法

監視マネージャーに接続するエージェントホストのPFMサービスを,複数回に分けて起動することを検討してください。運用で許容できる起動時間と,すべてのエージェントがスタンドアロンモードにならずに起動する時間を検証・比較しながら,同時に起動するエージェント数および間隔時間を決定してください。

同時に起動するエージェント数および間隔時間の目安を次に示します。(エージェントと同一ホストのStatus ServerサービスとAction Handlerサービスを同時に起動させる場合)

(例)エージェント数が1500の大規模システムで05:00にエージェントホストのPFMサービスを起動する場合,監視マネージャーのPFMサービスが稼働している状態で,エージェントホストのPFMサービスを次の表に示す時刻に起動する。

表2‒3 05:00:00にエージェントホストのサービスを起動するときの例

起動時刻

起動するエージェントホストのPFMサービス

05:00:00

1〜100までのエージェント

05:01:40

101〜200までのエージェント

05:03:20

201〜300までのエージェント

05:05:00

301〜400までのエージェント

05:06:40

401〜500までのエージェント

05:08:20

501〜600までのエージェント

05:10:00

601〜700までのエージェント

05:11:40

701〜800までのエージェント

05:13:20

801〜900までのエージェント

05:15:00

901〜1000までのエージェント

05:16:40

1001〜1100までのエージェント

05:18:20

1101〜1200までのエージェント

05:20:00

1201〜1300までのエージェント

05:21:40

1301〜1400までのエージェント

05:23:20

1401〜1500までのエージェント

エージェントホストのPFMサービスを同時に起動(OSの一斉起動や定期的な再起動を含む)した場合,次の注意事項があります。

(2) PFMサービスを一斉起動したときに通常モードで起動するまでの時間

OSの一斉起動や定期的な再起動などによりPFMサービスが同時に起動した場合,監視マネージャーに負荷が掛かり,エージェントとアクションハンドラが一時的にスタンドアロンモードで起動します。エージェント数が多いとスタンドアロンモードから通常モードに移行するまでに時間が掛かります。スタンドアロンモードの間は,レコードの収集は行われますがアラームの評価が行われません。大規模システムでの運用は,これを考慮する必要があります。通常モードに移行するまでの時間の目安を次の表に示します。

表2‒4 通常モードで起動するまでの時間の目安

エージェント数

アクションハンドラ数

通常モードで起動するまでの時間の目安(単位:分)

100

100

2

500

500

30

1,200

1,024

70

2,500

2,500

120

注※ Agent CollectorまたはRM Collectorの数です。

(3) コマンドの実行時間について

jpctool config syncコマンド,jpctool config alarmsyncコマンド,およびjpcconf primmgr notifyコマンドは,エージェントとアクションハンドラに対して通信するため,大規模システムでは実行に時間が掛かります。コマンドの実行時間の目安を次の表に示します。

表2‒5 コマンドの実行時間の目安

エージェント数※1

アクションハンドラ数

コマンドの実行時間の目安(単位:分)

jpctool config syncコマンド

jpctool config alarmsyncコマンド※2

jpcconf primmgr notifyコマンド

100

100

25

15

2

500

500

120

55

10

1,200

1,024

240

120

20

2,500

2,500

585

290

50

注※1

Agent CollectorまたはRM Collectorの数です。

注※2

すべてのサービスが同期対象の場合(反映状態がFailedまたはUncertain)の時間です。

jpctool config syncコマンドは,エージェントとアクションハンドラのアラーム情報とノード情報を同期します。jpctool config alarmsyncコマンドは,反映状態がFailedまたはUncertainであるエージェントとアクションハンドラのアラーム情報を同期します。大規模システムではコマンドの実行に時間が掛かるため,必要に応じてコマンドを使い分けてください。

(4) 自動バインド機能を使用するシステムでPFMサービスを一斉起動する場合

自動バインドを設定したあとの初回エージェント起動時にPFMサービスを一斉起動する場合,PFMサービスの過負荷によって,一部のエージェントで自動バインドが失敗する場合があります。自動バインドが失敗すると,KAVE00568-Eメッセージが出力されます。この場合,アラームを再バインドするか対象エージェントを再起動して,アラーム情報を反映してください。

なお,エージェントを複数回に分けて起動すると,この現象を回避できます。この場合,運用で許容できる起動時間と,すべてのエージェントがスタンドアロンモードにならずに起動する時間を十分に検証・比較しながら,同時に起動するエージェント数および間隔時間を決定する必要があります。

(5) エージェントホストのPFMサービスの停止方法

監視マネージャーに接続するエージェントホストのPFMサービスを,複数回に分けて停止することを検討してください。同時に停止するエージェント数および間隔時間の目安を次に示します。(エージェントと同一ホストのStatus ServerサービスとAction Handlerサービスを同時に停止させる場合)

エージェントホストのPFMサービスを同時に停止(OSの一斉停止や定期的な再起動を含む)した場合,次の注意事項があります。