14.2.1 セットアップやサービスの起動について
セットアップやサービスの起動に関するトラブルの対処方法を次に示します。
- <この項の構成>
- (1) Performance Managementプログラムのサービスが起動しない
- (2) サービスの起動要求をしてからサービスが起動するまで時間が掛かる
- (3) Performance Managementプログラムのサービスを停止した直後に,別のプログラムがサービスを開始したとき,通信が正しく実行されない
- (4) 「ディスク容量が不足しています」というメッセージが出力されたあとMaster Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが停止する
- (5) PFM - Managerの再起動後にCorrelatorサービスの起動に時間が掛かる
- (6) Agent CollectorサービスまたはRemote Monitor Collectorサービスが起動しない
(1) Performance Managementプログラムのサービスが起動しない
考えられる要因およびその対処方法を次に示します。
- PFM - Managerが停止している
PFM - Managerと,PFM - AgentまたはPFM - RMが同じホストにある場合,PFM - Managerが停止していると,PFM - AgentまたはPFM - RMサービスは起動できません。PFM - Managerサービスが起動されているか確認してください。PFM - Managerサービスが起動されていない場合は,起動してください。サービスの起動方法については,「1. Performance Managementの起動と停止」を参照してください。
- Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している
Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している場合,Performance Managementプログラムのサービスは起動できません。デフォルトでは,ポート番号は自動的に割り当てられるため,ポート番号が重複することはありません。Performance Managementのセットアップ時にPerformance Managementプログラムのサービスに対して固定のポート番号を設定している場合は,ポート番号の設定を確認してください。Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している場合は,異なるポート番号を設定し直してください。ポート番号の設定については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。
- Storeデータベースの格納ディレクトリの設定に誤りがある
次のディレクトリを,アクセスできないディレクトリまたは存在しないディレクトリに設定していると,Agent StoreまたはRemote Monitor Storeサービスは起動できません。ディレクトリ名や属性の設定を見直し,誤りがあれば修正してください。
- Storeデータベースの格納先ディレクトリ
- Storeデータベースのバックアップディレクトリ
- Storeデータベースの部分バックアップディレクトリ
- Storeデータベースのエクスポート先ディレクトリ
- Storeデータベースのインポート先ディレクトリ
また,これらのディレクトリを複数のAgent StoreまたはRemote Monitor Storeサービスに対して設定していると,Agent StoreまたはRemote Monitor Storeサービスは起動できません。ディレクトリ設定を見直し,誤りがあれば修正してください。
- 指定された方法以外の方法でマシンのホスト名を変更した
マシンのホスト名の変更方法は,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章で説明しています。指定された方法以外の方法でホスト名を変更した場合,Performance Managementプログラムのサービスが起動しないことがあります。次の現象が発生する場合は,この要因に該当しています。
- 現象が発生しているホストで「jpctool service list -id * -host *」を実行した結果,「Service Name」列にサービスIDが重複するサービスが存在している。
jpctool service listコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
- PFM - AgentからPFM - Managerに接続できない状態から,PFM - Agentを停止しPFM - Agentのホスト名を変更した
Performance Managementの各サービスは,起動時にPFM - Managerに対して自分自身のサービス情報(IPアドレス,ホスト名,ポート番号)を登録し,サービス停止時にそれらの情報を削除しています。ここでサービス停止時に何らかの原因でPFM - Managerのサービスと通信できずにサービス情報が削除できなかった場合,PFM - Manager側にはサービス情報が残ります。この状態で前回とまったく同じサービス情報を使用してサービスを起動した場合,Performance Managementの機能で2重起動が抑止されるため,サービスの起動に失敗します(サービスの起動に失敗したホストの共通メッセージログにはKAVE00133-Eが出力されます)。この場合,サービス情報を変更するため,次の手順を実施してください。
- jpcconf port defineコマンドを実行し,PFM - Agentのポート固定を解除する(ポートを固定している場合だけ)。
- PFM - Agentサービスを再起動する。
- jpcconf port defineコマンドを実行し,PFM - Agentのポートを再度固定する(ポートを固定する場合だけ)
jpcconf port defineコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
- 過去に起動していたプロセスが残っている
過去に起動していたプロセスが残っている場合,Performance Managementの機能で2重起動が抑止されるため,そのサービスは起動できません。タスクマネージャー(Windowsの場合)やpsコマンド(UNIXの場合)などで起動に失敗したサービスのプロセスが残っていないか確認し,残っていればプロセスを終了させてください。
- サービスコントロールマネージャでエラーが発生した
Windowsでjpcspm startコマンドを実行した場合,KAVE05163-Eメッセージが出力され,サービスの起動に失敗することがあります。この現象が発生した場合,jpcspm startコマンドを再実行してください。頻繁に同じ現象が発生する場合は,jpcspm startコマンド実行時にサービス起動処理がリトライされる間隔および回数を,jpccomm.iniファイルを編集して変更してください。リトライ間隔およびリトライ回数を変更する方法については,「1.8.3 Windowsマシンでの起動について」を参照してください。
(2) サービスの起動要求をしてからサービスが起動するまで時間が掛かる
jpcspm startコマンドを実行してから,または[サービス]アイコンでサービスを開始してから,実際にサービスが起動するまで時間が掛かることがあります。次の要因で時間が掛かっている場合,2回目の起動時からはサービスの起動までに掛かる時間が短縮されます。
- スタンドアロンモードで起動する場合,サービスが起動するまでに時間が掛かることがあります。
- Storeデータベースをリストアしたあとサービスを起動すると,初回起動時だけStoreデータベースのインデックスが再構築されます。そのため,サービスが起動するまでに時間が掛かることがあります。
- エージェントを新規に追加したあとサービスを起動すると,初回起動時だけStoreデータベースのインデックスが作成されます。そのため,サービスが起動するまでに時間が掛かることがあります。
- 電源切断などによってStoreサービスが正常な終了処理を行えなかったときは,再起動時にStoreデータベースのインデックスが再構築されるため,Storeサービスの起動に時間が掛かることがあります。
(3) Performance Managementプログラムのサービスを停止した直後に,別のプログラムがサービスを開始したとき,通信が正しく実行されない
Performance Managementプログラムのサービスを停止した直後に,このサービスが使用していたポート番号で,ほかのプログラムがサービスを開始した場合,通信が正しく実行されないことがあります。この現象を回避するために,次のどちらかの設定をしてください。
- Performance Managementプログラムのサービスに割り当てるポート番号を固定する
Performance Managementプログラムの各サービスに対して,固定のポート番号を割り当てて運用してください。ポート番号の設定方法については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。
- TCP_TIMEWAIT値の設定をする
TCP_TIMEWAIT値で接続待ち時間を設定してください。
HP-UX,AIXの場合,次のように指定して,接続待ち時間を75秒以上にしてください。
- HP-UXの場合:tcp_time_wait_interval:240000
- AIXの場合:tcp_timewait:5
Windows,Solarisの場合,接続待ち時間をデフォルトの設定としてください。デフォルト値は,次のとおりです。
- Solarisの場合:4分
- Windows Server 2003,Windows Server 2008の場合:2分
Linuxの場合,接続待ち時間のデフォルト値(60秒)は変更できません。Performance Managementプログラムのサービスのポート番号を固定する方法で対応してください。
(4) 「ディスク容量が不足しています」というメッセージが出力されたあとMaster Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが停止する
Storeデータベースが使用しているディスクに十分な空き容量がない場合,Storeデータベースへのデータの格納が中断されます。この場合,「ディスク容量が不足しています」というメッセージが出力されたあと,Master Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが停止します。
このメッセージが表示された場合,次のどちらかの対処をしてください。
- 十分なディスク容量を確保する
Storeデータベースのディスク占有量を見積もり,Storeデータベースの格納先を十分な容量があるディスクに変更してください。Storeデータベースのディスク占有量を見積もる方法については,各PFM - AgentまたはPFM - RMマニュアルの,付録に記載されているシステム見積もりを参照してください。
Storeデータベースの格納先について,イベントデータの格納先を変更する方法は,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。パフォーマンスデータの格納先を変更する方法については,各PFM - AgentまたはPFM - RMマニュアルを参照してください。
- Storeデータベースの保存条件を変更する
Storeデータベースの保存条件を変更し,Storeデータベースのデータ量の上限値を調整してください。Storeデータベースの保存条件を変更する方法については,「4.1.2 パフォーマンスデータの保存条件を変更する(Storeバージョン2.0の場合)」,「4.1.3 パフォーマンスデータの保存条件を変更する(Storeバージョン1.0の場合)」または「4.2.1 イベントデータのレコード数の上限値を変更する」を参照してください。
これらの対処をしたあともMaster Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが起動されない場合,Storeデータベースに回復できない論理矛盾が発生しています。この場合,バックアップデータからStoreデータベースをリストアしたあと,Master Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスを起動してください。利用できるバックアップデータが存在しない場合は,Storeデータベースを初期化したあと,Master Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスを起動してください。Storeデータベースを初期化するには,Storeデータベースの格納先ディレクトリにある次のファイルをすべて削除してください。
- 拡張子が.DBであるファイル
- 拡張子が.IDXであるファイル
デフォルトのStoreデータベースの格納先ディレクトリは,次のとおりです。
- パフォーマンスデータのStoreデータベース格納先ディレクトリ
- 各PFM - AgentまたはPFM - RMマニュアルを参照してください。
- イベントデータのStoreデータベース格納先ディレクトリ
- Windowsの場合:
インストール先フォルダ¥mgr¥store¥
- UNIXの場合:
/opt/jp1pc/mgr/store/
(5) PFM - Managerの再起動後にCorrelatorサービスの起動に時間が掛かる
Correlatorサービスは起動時にエージェントのアラームステータスを確認します。そのため,エージェントを停止しないでPFM - Managerを再起動した場合,Correlatorサービスの起動に時間が掛かることがあります。このような場合,Correlatorクイック起動機能を有効にすることを検討してください。
Correlatorクイック起動機能を有効にすると,エージェントのアラームステータスの確認はCorrelatorサービスの起動後に必要に応じて実施されるようになるため,サービスの起動に掛かる時間が短縮されます。なお,Correlatorサービスがアラームステータスの確認状況を通知する際,次の表に示すメッセージテキストがエージェントイベントで出力されることがあります。
メッセージテキストの内容 | 意味 |
---|
State information | Correlatorサービスが,エージェントからアラームイベントを受信し,アラームステータスを正しく確認した。 |
State information(Unconfirmed) | Correlatorサービスが,エージェントからアラームイベントを受信したが,アラームステータスを確認できなかった。 |
State change(Unconfirmed) | Correlatorサービスが,アラームステータスが未確認のエージェントからアラームイベントを受信した。受信したアラームイベントの内容からPFM - AgentまたはPFM - RMの状態を推定した。 |
次の表に,メッセージテキストの出力契機を示します。
Correlatorクイック起動機能の設定 | アラームステータスの確認契機 | アラームステータスの確認成否と出力されるメッセージテキスト |
---|
成功 | 失敗 |
---|
無効(ただし,起動情報ファイル(jpccomm.ini)でRetry Getting Alarm Statusラベルを有効に指定した場合) | PFM - Manager起動時 | State information | State information(Unconfirmed) |
アラームステータスの確認失敗後,エージェントから次のアラームイベントを受信したとき | State information | State change(Unconfirmed)※ |
有効 | PFM - Manager起動後,エージェントからのアラームイベント初回受信時 | State information | State information(Unconfirmed) |
アラームステータスの確認失敗後,エージェントから次のアラームイベントを受信したとき | State information | State change(Unconfirmed)※ |
- 注※
- PFM - Managerが推定したPFM - AgentまたはPFM - RMの状態が変化した場合だけ出力されます。
Correlatorクイック起動機能の設定を変更する手順を次に示します。
- Performance Managementのプログラムおよびサービスを停止する。
Performance Managementのプログラムおよびサービスが起動されている場合は,jpcspm stopコマンドですべて停止してください。クラスタシステムを利用している場合は,クラスタソフトから停止してください。
- テキストエディターなどで,jpccomm.iniファイルを開く。
jpccomm.iniファイルは,次の場所に格納されています。
物理ホストの場合
- Windowsの場合
インストール先フォルダ¥
- UNIXの場合
/opt/jp1pc/
論理ホストの場合
- Windowsの場合
環境ディレクトリ¥jp1pc¥
- UNIXの場合
環境ディレクトリ/jp1pc/
- Correlatorクイック起動機能の利用可否を設定する。
jpccomm.iniファイル中の[Common Section]セクションで次のラベルの値を変更します。
- 有効にする場合
Correlator Startup Mode=1
- 無効にする場合
Correlator Startup Mode=0
- jpccomm.iniファイルを保存して閉じる。
- Performance Managementのプログラムおよびサービスを起動する。
(6) Agent CollectorサービスまたはRemote Monitor Collectorサービスが起動しない
PFM - AgentまたはPFM - RMホストがWindowsの場合,PFM - AgentまたはPFM - RMの起動時にAgent CollectorサービスまたはRemote Monitor Collectorサービスの起動に失敗して,Windowsの再起動時,Windowsイベントログに次のどちらかのメッセージが出力されることがあります。
- 「サービス名サービスは起動時に停止しました。」
- 「サービス名サービスは開始時にハングしました。」
この現象は,Windowsのサービスコントロールマネージャのタイムアウトによって発生するため,PFM - Managerへの通信負荷が高く,PFM - Managerからの応答に時間が掛かるときに発生しやすくなります。次の条件にすべて該当する場合に発生します。
- PFM - Managerへの通信負荷が高い。
例えば,多数のPFM - AgentまたはPFM - RMの起動処理が同時に実行されている場合などが該当します。
- PFM - AgentまたはPFM - RMの各サービスについて,Windowsの[サービス]アプレットでスタートアップ種別が「自動」に設定されている。
- OSを再起動する。
この現象を回避するためには,次のどちらかの設定をして運用してください。
- OSの再起動と同時にサービスを起動する場合,Windowsのサービスコントロールマネージャから起動するのではなく,jpcspm startコマンドを実行して起動する。
- PFM - AgentまたはPFM - RMホストで次の設定を行って,PFM - AgentまたはPFM - RMの起動時間を短縮する。
この設定で,PFM - AgentまたはPFM - RMのサービスの起動時に,PFM - Managerに接続できない場合の再接続処理が短縮されます。この場合,PFM - AgentまたはPFM - RMのサービスがスタンドアロンモードで起動する確率が高くなります。
PFM - AgentまたはPFM - RMの起動時間を短縮するには,起動情報ファイル(jpccomm.ini)の[Agent Collector x Section]※および[Agent Store x Section]※の「NS Init Retry Count」ラベルを,「NS Init Retry Count =2」から「NS Init Retry Count =1」に変更します。
- 注※
- 「x」には,PFM - AgentまたはPFM - RMのプロダクトIDが入ります。プロダクトIDについては,各PFM - AgentまたはPFM - RMマニュアルの,付録に記載されている識別子一覧を参照してください。同一ホスト上にPFM - AgentまたはPFM - RMが複数インストールされている場合は,それぞれのプロダクトIDごとに「NS Init Retry Count」ラベルの値を設定してください。
起動情報ファイル(jpccomm.ini)の格納先は,次のとおりです。
- PFM - AgentまたはPFM - RMホストが物理ホストの場合
- インストール先フォルダ¥jpccomm.ini
- PFM - AgentまたはPFM - RMホストが論理ホストの場合
- 環境ディレクトリ※¥jp1pc¥jpccomm.ini
- 注※
- 論理ホスト作成時に指定した共有ディスク上のディレクトリを示します。