17.2.1 セットアップやサービスの起動に関するトラブルシューティング
- 〈この項の構成〉
(1) Performance Managementプログラムのサービスが起動しない(PFM - Web Console以外)
考えられる要因およびその対処方法を次に示します。
-
PFM - Managerが停止している
PFM - Managerと,PFM - AgentまたはPFM - RMが同じホストにある場合,PFM - Managerが停止していると,PFM - AgentまたはPFM - RMサービスは起動できません。PFM - Managerサービスが起動されているか確認してください。PFM - Managerサービスが起動されていない場合は,起動してください。サービスの起動方法については,「1. Performance Managementの起動と停止」を参照してください。
-
Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している
Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している場合,Performance Managementプログラムのサービスは起動できません。デフォルトでは,ポート番号は自動的に割り当てられるため,ポート番号が重複することはありません。Performance Managementのセットアップ時にPerformance Managementプログラムのサービスに対して固定のポート番号を設定している場合は,ポート番号の設定を確認してください。Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している場合は,異なるポート番号を設定し直してください。ポート番号の設定については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。
-
Storeデータベースの格納ディレクトリの設定に誤りがある
次のディレクトリを,アクセスできないディレクトリまたは存在しないディレクトリに設定していると,Agent StoreまたはRemote Monitor Storeサービスは起動できません。ディレクトリ名や属性の設定を見直し,誤りがあれば修正してください。
-
Storeデータベースの格納先ディレクトリ
-
Storeデータベースのバックアップディレクトリ
-
Storeデータベースの部分バックアップディレクトリ
-
Storeデータベースのエクスポート先ディレクトリ
-
Storeデータベースのインポート先ディレクトリ
また,これらのディレクトリを複数のAgent StoreまたはRemote Monitor Storeサービスに対して設定していると,Agent StoreまたはRemote Monitor Storeサービスは起動できません。ディレクトリ設定を見直し,誤りがあれば修正してください。
-
-
指定された方法以外の方法でマシンのホスト名を変更した
マシンのホスト名の変更方法は,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章で説明しています。指定された方法以外の方法でホスト名を変更した場合,Performance Managementプログラムのサービスが起動しないことがあります。次の現象が発生する場合は,この要因に該当しています。
-
共通メッセージログにKAVE00493-Eが出力されてサービスが起動できない。
この現象からの回復方法については,「17.2.2 KAVE00493-Eが出力されてサービスが起動できない場合の回復方法について」を参照してください。
-
現象が発生しているホストで「jpctool service list -id * -host *」を実行した結果,「Service Name」列にサービスIDが重複するサービスがある。
jpctool service listコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
-
-
PFM - AgentからPFM - Managerに接続できない状態から,PFM - Agentを停止しPFM - Agentのホスト名を変更した
Performance Managementの各サービスは,起動時にPFM - Managerに対して自分自身のサービス情報(IPアドレス,ホスト名,ポート番号)を登録し,サービス停止時にそれらの情報を削除しています。ここでサービス停止時に何らかの原因でPFM - Managerのサービスと通信できずにサービス情報が削除できなかった場合,PFM - Manager側にはサービス情報が残ります。この状態で前回とまったく同じサービス情報を使用してサービスを起動した場合,Performance Managementの機能で2重起動が抑止されるため,サービスの起動に失敗します(サービスの起動に失敗したホストの共通メッセージログにはKAVE00133-Eが出力されます)。この場合,サービス情報を変更するため,次の手順を実施してください。
-
jpcconf port defineコマンドを実行し,PFM - Agentのポート固定を解除する(ポートを固定している場合だけ)。
-
PFM - Agentサービスを再起動する。
-
jpcconf port defineコマンドを実行し,PFM - Agentのポートを再度固定する(ポートを固定する場合だけ)
jpcconf port defineコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
-
-
過去に起動していたプロセスが残っている
過去に起動していたプロセスが残っている場合,Performance Managementの機能で2重起動が抑止されるため,そのサービスは起動できません。タスクマネージャー(Windowsの場合)やpsコマンド(UNIXの場合)などで起動に失敗したサービスのプロセスが残っていないか確認し,残っていればプロセスを終了させてください。
-
サービスコントロールマネージャーでエラーが発生した
Windowsでjpcspm startコマンドを実行した場合,KAVE05163-Eメッセージが出力され,サービスの起動に失敗することがあります。メッセージの対処方法に従って対処してください。
(2) PFM - Web Consoleのサービスが起動しない
考えられる要因およびその対処方法を次に示します。要因だけを示している場合は,「17.2.1(1) Performance Managementプログラムのサービスが起動しない(PFM - Web Console以外)」にある対処方法と同じです。
-
Performance Managementプログラムの複数のサービスに対して同一のポート番号を設定している
-
過去に起動していたプロセスが残っている
-
サービスコントロールマネージャーでエラーが発生した
-
暗号化通信を有効にしている場合,暗号化通信ファイル格納フォルダに必要なファイルを格納していない。
暗号化通信に必要なファイルを格納しているかどうか確認してください。詳細については,マニュアル「JP1/Performance Management 設計・構築ガイド」の暗号化通信ファイル格納フォルダにファイルを格納する手順について説明している個所を参照してください。
-
暗号化通信を有効にしている場合,暗号化通信ファイル格納フォルダに格納しているファイルが正しくない。
必要なファイルを格納していてもサービスが起動されないときは,ファイルが正しくないおそれがあります。ログを確認し,要因となっているファイルを正しいファイルに置き換えてください。
ログの格納先を次に示します。
-
Windowsの場合:
PFM - Web Consoleのインストール先フォルダ\CPSB\httpsd\log\error.xxx※
-
UNIXの場合:
/opt/jp1pcwebcon/CPSB/httpsd/log/error.xxx※
注※ xxxは001から始まる連番を表します。
ログは次の形式で表示されます。エラーレベルが「crit」の該当行を確認してください。
[日時] [エラーレベル] [メッセージ]
メッセージとその要因を次に示します。
項番
メッセージ
要因
1
The private key doesn't match the public key
秘密鍵ファイルとサーバ証明書ファイル(または自己署名証明書ファイル)がペアでない。
2
Bad password for the private key
秘密鍵ファイルと秘密鍵パスワードファイルがペアでない。
-
-
localhostの名前解決がされていない環境でPFM - Web Consoleのサービスを起動している。
localhostの名前解決がされていない環境では,PFM - Web Consoleのサービスが起動しません。localhostの名前解決がされている環境でサービスを起動してください。
-
PFM - Web Consoleのセットアップが完了していない。
PFM - Web Consoleのインストール時に設定するPFM - Web Consoleのポート番号がすでにほかのプログラムで使用されている場合,PFM - Web Consoleのセットアップが完了しないままインストールが終了します。この場合は,PFM - Web Consoleで使用するポート番号の設定を見直してからjpcwsvsetupコマンドを実行して,ポート番号のセットアップを完了させてください。
PFM - Web Consoleのポート番号の設定については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,ポート番号の設定について説明している個所を参照してください。jpcwsvsetupコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
-
PFM - Web Consoleの前提となるRPMパッケージが適用されていない。(UNIXの場合だけ)
PFM - Web Consoleのインストール時に,PFM - Web Consoleの前提となるRPMパッケージが適用されていない場合,PFM - Web Consoleのセットアップが完了しないままインストールが終了します。この場合は,PFM - Web Consoleの前提となるRPMパッケージが適用されているかを見直してからjpcwsvsetupコマンドを実行し,セットアップを完了させてからサービスを起動してください。
PFM - Web Consoleの前提となるRPMパッケージについては,リリースノートを参照してください。jpcwsvsetupコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
-
Webコンテナサービスの起動に時間が掛かっていることによって,PFM - Web Consoleのサービスの起動に失敗した。
負荷の高い環境などでjpcwstartコマンドやサービスコントロールパネルなどからPFM - Web Consoleサービスを起動した場合,Webコンテナサービスの起動に時間に掛かっていることによって,サービスの起動が失敗する場合があります。この場合は,しばらく時間を置いてから再度サービスを起動してください。この現象が頻発する環境では,次の対処方法で,サービス起動完了の待ち時間を変更することができます。
■Windowsの場合
次のレジストリを作成または変更する。
-
レジストリキー:HKEY_LOCAL_MACHINE\Software\Hitachi\JP1PCWEBCON
-
値:ContainerStartupWaitCount:DWORD(デフォルト値:12)
値の種類はDWORDで作成します。単位は5秒で,デフォルト値は12(60秒)です。0(待ち時間なし)〜120(10分)の範囲で値を指定できます。
■UNIXの場合
jpcwstartコマンドを,-rcオプションを指定して実行する。
jpcwstartコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
-
(3) サービスの起動要求をしてからサービスが起動するまで時間が掛かる
jpcspm startコマンドを実行してから,またはWindowsの[サービス]でサービスを開始してから,実際にサービスが起動するまで時間が掛かることがあります。次の要因で時間が掛かっている場合,2回目の起動時からはサービスの起動までに掛かる時間が短縮されます。
-
スタンドアロンモードで起動する場合,サービスが起動するまでに時間が掛かることがあります。
-
Storeデータベースをリストアしたあとサービスを起動すると,初回起動時だけStoreデータベースのインデックスが再構築されます。そのため,サービスが起動するまでに時間が掛かることがあります。
-
エージェントを新規に追加したあとサービスを起動すると,初回起動時だけStoreデータベースのインデックスが作成されます。そのため,サービスが起動するまでに時間が掛かることがあります。
-
電源切断などによってStoreサービスが正常な終了処理を実施できなかったときは,再起動時にStoreデータベースのインデックスが再構築されるため,Storeサービスの起動に時間が掛かることがあります。
(4) Performance Managementプログラムのサービスを停止した直後に,別のプログラムがサービスを開始したとき,通信が正しく実行されない
Performance Managementプログラムのサービスを停止した直後に,このサービスが使用していたポート番号で,ほかのプログラムがサービスを開始した場合,通信が正しく実行されないことがあります。この現象を回避するために,次のどちらかの設定をしてください。
-
Performance Managementプログラムのサービスに割り当てるポート番号を固定する
Performance Managementプログラムの各サービスに対して,固定のポート番号を割り当てて運用してください。ポート番号の設定方法については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。
-
TCP_TIMEWAIT値を設定する
TCP_TIMEWAIT値で接続待ち時間を設定してください。
HP-UX,AIXの場合,次のように指定して,接続待ち時間を75秒以上にしてください。
-
HP-UXの場合:tcp_time_wait_interval:240000
-
AIXの場合:tcp_timewait:5
Windows,Solarisの場合,接続待ち時間をデフォルトの設定としてください。デフォルト値は,次のとおりです。
-
Solarisの場合:4分
-
Windowsの場合:2分
Linuxの場合,接続待ち時間のデフォルト値(60秒)は変更できません。Performance Managementプログラムのサービスのポート番号を固定する方法で対応してください。
-
(5) 「ディスク容量が不足しています」というメッセージが出力されたあとMaster Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが停止する
Storeデータベースが使用しているディスクに十分な空き容量がない場合,Storeデータベースへのデータの格納が中断されます。この場合,「ディスク容量が不足しています」というメッセージが出力されたあと,Master Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが停止します。
このメッセージが表示された場合,次のどちらかの対処をしてください。
-
十分なディスク容量を確保する
Storeデータベースのディスク占有量を見積もり,Storeデータベースの格納先を十分な容量があるディスクに変更してください。Storeデータベースのディスク占有量を見積もる方法については,各PFM - AgentまたはPFM - RMマニュアルの,付録に記載されているシステム見積もりを参照してください。
Storeデータベースの格納先について,イベントデータの格納先を変更する方法は,マニュアル「JP1/Performance Management 設計・構築ガイド」の,インストールとセットアップについて説明している章を参照してください。パフォーマンスデータの格納先を変更する方法については,各PFM - AgentまたはPFM - RMマニュアルを参照してください。
-
Storeデータベースの保存条件を変更する
Storeデータベースの保存条件を変更し,Storeデータベースのデータ量の上限値を調整してください。Storeデータベースの保存条件を変更する方法については,「4.1.2 パフォーマンスデータの保存条件を変更する(Storeバージョン2.0の場合)」,「4.1.3 パフォーマンスデータの保存条件を変更する(Storeバージョン1.0の場合)」または「4.2.1 イベントデータのレコード数の上限値を変更する」を参照してください。
これらの対処をしたあともMaster Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスが起動されない場合,Storeデータベースに回復できない論理矛盾が発生しています。この場合,バックアップデータからStoreデータベースをリストアしたあと,Master Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスを起動してください。利用できるバックアップデータがない場合は,Storeデータベースを初期化したあと,Master Storeサービス,Agent Storeサービス,またはRemote Monitor Storeサービスを起動してください。Storeデータベースを初期化するには,Storeデータベースの格納先ディレクトリにある次のファイルをすべて削除してください。
- [StoreVRが1.0の場合]
-
-
拡張子が.DBであるファイル
-
拡張子が.IDXであるファイル
-
- [StoreVRが2.0の場合]
-
-
拡張子が.DBであるファイル
-
拡張子が.IDXであるファイル
STPI,STPD,STPLディレクトリ配下を削除してください。
(STPI,STPD,STPLディレクトリは残してください)
-
デフォルトのStoreデータベースの格納先ディレクトリは,次のとおりです。
- パフォーマンスデータのStoreデータベース格納先ディレクトリ
-
各PFM - AgentまたはPFM - RMマニュアルを参照してください。
- イベントデータのStoreデータベースの格納先ディレクトリ
-
- [PFM - Managerがクラスタ環境でない場合]
-
-
Windowsの場合:
インストール先フォルダ\mgr\store\
-
UNIXの場合:
/opt/jp1pc/mgr/store/
-
- [PFM - Managerがクラスタ環境である場合]
-
-
Windowsの場合:
環境ディレクトリ\jp1pc\mgr\store\
-
UNIXの場合:
環境ディレクトリ/jp1pc/mgr/store/
-
(6) PFM - Managerの再起動後にCorrelatorサービスの起動に時間が掛かる
Correlatorサービスは起動時にエージェントのアラームステータスを確認します。そのため,エージェントを停止しないでPFM - Managerを再起動した場合,Correlatorサービスの起動に時間が掛かることがあります。このような場合,Correlatorクイック起動機能を有効にすることを検討してください。
Correlatorクイック起動機能を有効にすると,エージェントのアラームステータスの確認はCorrelatorサービスの起動後に必要に応じて実施されるようになるため,サービスの起動に掛かる時間が短縮されます。なお,Correlatorサービスがアラームステータスの確認状況を通知する際,次の表に示すメッセージテキストがエージェントイベントで出力されることがあります。
メッセージテキストの内容 |
意味 |
---|---|
State information |
Correlatorサービスが,エージェントからアラームイベントを受信し,アラームステータスを正しく確認した。 |
State information(Unconfirmed) |
Correlatorサービスが,エージェントからアラームイベントを受信したが,アラームステータスを確認できなかった。 |
State change(Unconfirmed) |
Correlatorサービスが,アラームステータスが未確認のエージェントからアラームイベントを受信した。受信したアラームイベントの内容からPFM - AgentまたはPFM - RMの状態を推定した。 |
次の表に,メッセージテキストの出力契機を示します。
Correlatorクイック起動機能の設定 |
アラームステータスの確認契機 |
アラームステータスの確認成否と出力されるメッセージテキスト |
|
---|---|---|---|
成功 |
失敗 |
||
無効(ただし,起動情報ファイル(jpccomm.ini)でRetry Getting Alarm Statusラベルを有効に指定した場合) |
PFM - Manager起動時 |
State information |
State information(Unconfirmed) |
アラームステータスの確認失敗後,エージェントから次のアラームイベントを受信したとき |
State information |
State change(Unconfirmed)※ |
|
有効 |
PFM - Manager起動後,エージェントからのアラームイベント初回受信時 |
State information |
State information(Unconfirmed) |
アラームステータスの確認失敗後,エージェントから次のアラームイベントを受信したとき |
State information |
State change(Unconfirmed)※ |
- 注※
-
PFM - Managerが推定したPFM - AgentまたはPFM - RMの状態が変化した場合だけ出力されます。
Correlatorクイック起動機能の設定を変更する手順を次に示します。
-
Performance Managementのプログラムおよびサービスを停止する。
PFM - ManagerホストでPerformance Managementのプログラムおよびサービスが起動されている場合は,jpcspm stopコマンドですべて停止してください。クラスタシステムを利用している場合は,クラスタソフトから停止してください。
-
テキストエディターなどで,PFM - Managerホストのjpccomm.iniファイルを開く。
jpccomm.iniファイルは,次の場所に格納されています。
物理ホストの場合
-
Windowsの場合
インストール先フォルダ\
-
UNIXの場合
/opt/jp1pc/
論理ホストの場合
-
Windowsの場合
環境ディレクトリ\jp1pc\
-
UNIXの場合
環境ディレクトリ/jp1pc/
-
-
Correlatorクイック起動機能の利用可否を設定する。
jpccomm.iniファイル中の[Common Section]セクションで次のラベルの値を変更します。
-
有効にする場合
Correlator Startup Mode=1
-
無効にする場合
Correlator Startup Mode=0
-
-
jpccomm.iniファイルを保存して閉じる。
-
Performance Managementのプログラムおよびサービスを起動する。
(7) Agent CollectorサービスまたはRemote Monitor Collectorサービスが起動しない
PFM - AgentまたはPFM - RMホストがWindowsの場合,PFM - AgentまたはPFM - RMの起動時にAgent CollectorサービスまたはRemote Monitor Collectorサービスの起動に失敗して,Windowsの再起動時,Windowsイベントログに次のどちらかのメッセージが出力されることがあります。
-
「サービス名サービスは起動時に停止しました。」
-
「サービス名サービスは開始時にハングしました。」
この現象は,Windowsのサービスコントロールマネージャーのタイムアウトによって発生するため,PFM - Managerへの通信負荷が高く,PFM - Managerからの応答に時間が掛かるときに発生しやすくなります。次の条件にすべて該当する場合に発生します。
-
PFM - Managerへの通信負荷が高い。
例えば,多数のPFM - AgentまたはPFM - RMの起動処理が同時に実行されている場合などが該当します。
-
PFM - AgentまたはPFM - RMの各サービスについて,Windowsの[サービス]でスタートアップ種別が「自動」に設定されている。
-
OSを再起動する。
この現象を回避するためには,次のどちらかの設定をして運用してください。
-
OSの再起動と同時にサービスを起動する場合,Windowsのサービスコントロールマネージャーから起動するのではなく,jpcspm startコマンドを実行して起動する。
-
PFM - AgentまたはPFM - RMホストで次の設定を行って,PFM - AgentまたはPFM - RMの起動時間を短縮する。
この設定で,PFM - AgentまたはPFM - RMのサービスの起動時に,PFM - Managerに接続できない場合の再接続処理が短縮されます。この場合,PFM - AgentまたはPFM - RMのサービスがスタンドアロンモードで起動する確率が高くなります。
PFM - AgentまたはPFM - RMの起動時間を短縮するには,起動情報ファイル(jpccomm.ini)の[Agent Collector x Section]※および[Agent Store x Section]※の「NS Init Retry Count」ラベルを,「NS Init Retry Count =2」から「NS Init Retry Count =1」に変更します。
- 注※
-
「x」には,PFM - AgentまたはPFM - RMのプロダクトIDが入ります。プロダクトIDについては,各PFM - AgentまたはPFM - RMマニュアルの,付録に記載されている識別子一覧を参照してください。同一ホスト上にPFM - AgentまたはPFM - RMが複数インストールされている場合は,それぞれのプロダクトIDごとに「NS Init Retry Count」ラベルの値を設定してください。
起動情報ファイル(jpccomm.ini)の格納先は,次のとおりです。
- PFM - AgentまたはPFM - RMホストが物理ホストの場合
-
インストール先フォルダ\jpccomm.ini
- PFM - AgentまたはPFM - RMホストが論理ホストの場合
-
環境ディレクトリ※\jp1pc\jpccomm.ini
- 注※
-
論理ホスト作成時に指定した共有ディスク上のディレクトリを示します。
(8) 同時に起動した複数のエージェントでスタンドアロンモードからの回復に時間が掛かる
起動時にスタンドアロンモードとなった監視エージェントは,自動的に監視マネージャーへの接続をリトライし,成功すれば通常モードに移行します。
多数の監視エージェントを同時に起動すると,各監視エージェントから監視マネージャーへの通信が集中することで接続エラーが発生し,複数の監視エージェントがスタンドアロンモードとなる場合があります。このとき,監視マネージャーへの接続リトライが一定間隔で実施される設定になっていると,それらの監視エージェントが同じタイミングでリトライし続けることで通信の集中が繰り返され,通常モードに移行するまでに時間が掛かってしまいます。
このような現象が発生するときは,対象となる監視エージェントの起動情報ファイル(jpccomm.ini)の[Common Section]セクションで,Random Retry Mode(再接続処理の分散機能)の値を1(有効)にしてください。
この操作によって,スタンドアロンモードの監視エージェントから監視マネージャーへの接続リトライが一定ではなくランダムな間隔となり,通信の集中を防止できます。
なお,この設定は,システム内のPFM - ManagerまたはPFM - Baseのバージョンが10-10-20以降で,PFM - AgentまたはPFM - RMのバージョンが10-00以降の場合に適用できます。
起動情報ファイル(jpccomm.ini)の変更方法については,マニュアル「JP1/Performance Management リファレンス」の付録の,起動情報ファイル(jpccomm.ini)について説明している個所を参照してください。