8.2.1 パフォーマンスデータの収集と管理に関するトラブルシューティング
(1) PFM - Agentを起動してもパフォーマンスデータが収集されない
考えられる主な要因は次のとおりです。
-
HiRDBが停止している。
HiRDBの起動状態を確認し,停止している場合は起動してください。
-
インスタンス環境のセットアップ時の設定に誤りがある。
jpcconf inst setupコマンドを実行して,各項目の値を確認してください。HiRDB_user,およびHiRDB_passwordに小文字を指定する場合は,引用符で囲む必要があります。インスタンス環境のセットアップについては,「2.4.3 インスタンス環境の設定」または「3.4.3 インスタンス環境の設定」を参照してください。
-
Type4 JDBCドライバから接続している。
PD_CNSTレコードでは,Type4 JDBCドライバから接続しているプロセスについては収集できません。
-
文字コードの定義に誤りがある。
HiRDBサーバ,HiRDBクライアント間の文字コード,またはPFM - Agent for HiRDBの文字コードの定義に誤りがある場合,一部のレコードの収集に失敗することがあります。HiRDBサーバ,HiRDBクライアント間の文字コードの定義については,マニュアル「HiRDB UAP開発ガイド」のUAP実行時の注意事項について説明している章を参照してください。PFM - Agent for HiRDBの文字コードの定義については「3.4.3 インスタンス環境の設定」を参照してください。
-
rsh(remsh)およびrcpサービスが機能していない。
PFM - Agent for HiRDBは2ユニット以上のHiRDB/パラレルサーバを監視する場合,rsh(remsh)およびrcpサービスを使用します。2ユニット以上のHiRDB/パラレルサーバを監視する場合はrsh(remsh)およびrcpサービスを停止しないでください。
(2) HiRDBのシステムマネジャ以外のユニットの情報が収集されない
考えられる主な要因は次のとおりです。
-
インスタンスのアカウントとHiRDBのアカウントが異なっている。
アカウントの設定方法については,「2.4.3(2) 2ユニット以上のHiRDB/パラレルサーバを監視する場合の設定」を参照してください。
-
IPアドレス接続制限機能によって接続が制限されている。
IPアドレス接続制限機能については,「2.2.4(1) 監視対象プログラム」または「3.2.4(1) 監視対象プログラム」の注意事項を参照してください。
-
root権限でログインを許可する設定になっていない。
権限の設定方法については,「3.4.3(2) 2ユニット以上のHiRDB/パラレルサーバを監視する場合の設定」を参照してください。
(3) 識別子付きセットアップでセットアップしたHiRDBの情報が正しく収集されない
考えられる主な要因は次のとおりです。
-
HiRDBのクライアント環境定義に誤りがある。
HiRDBのクライアント環境定義の設定方法については,「2.4.3 インスタンス環境の設定」を参照してください。
(4) 正常稼働時にアラームを通知する
考えられる主な要因は次のとおりです。
-
PI_RDFLまたはPI_RDFSレコードのCollection IntervalがHiRDBのシンクポイント間隔よりも短い。
監視対象HiRDBの各サーバのシンクポイント発生間隔をPI_RDFLまたはPI_RDFSレコードのCollection Intervalよりも小さな値にしてください。HiRDBのシンクポイントの詳細は,マニュアル「HiRDB システム運用ガイド」を参照してください。
-
HiRDBからSEGMENT情報が取得できなかった。
RDエリアの状態によっては,pddblsの出力結果にSEGMENT情報が出力されない場合があります。このとき,PI_RDDSレコードまたはPI_RDSTレコードのSEGMENT情報に関するフィールドには仮定値を設定します。PI_RDDSレコードおよびPI_RDSTレコードの詳細は「6. レコード」を参照してください。
-
HiRDBのpddbstコマンドが失敗した。
pddbstコマンドはRDエリアの状態によって動作しない場合があります。このとき,PI_RDDSレコードのpddbstコマンドから取得する情報に関するフィールドには仮定値を設定します。PI_RDDSレコードの詳細は「6. レコード」を参照してください。
(5) KAVE00213-Wが出力されて収集がスキップされる
考えられる主な要因は次のとおりです。
-
同じインスタンスのほかのレコードの収集や前回の収集が完了していない。
収集のスキップが多発する場合,メッセージKAVF15018-I,KAVF15019-Iからレコード収集に必要な時間を計算し,Collection Interval,Collection Offsetの値を調整してください。
(6) 一時的にパフォーマンスデータを収集できないときがある
考えられる主な要因は次のとおりです。
-
1つのホスト内で複数のPFM - Agent for HiRDBのインスタンスが動作する環境で,同時刻にPI_SSYSレコード,PI_RDFSレコード,またはPI_RDFLレコードを収集する設定になっている。
Collection IntervalとCollection Offsetを見直し,各レコードを同時刻に収集しないように設定してください。詳しくは「6. レコード」のレコードの注意事項を参照してください。
-
レコード収集中にフェールオーバーが発生した。
PI_SSYSレコード,PI_RDFSレコードまたはPI_RDFLレコードの収集中に系切り替えが発生すると,統計情報を収集できないことがあります。詳しくは
「4.7.2 レコード収集中のフェールオーバー」を参照してください。
(7) 定義変更などをしていないにも関わらず,PI_RDSTレコード,およびPI_RDDSレコードの収集に失敗するようになった
考えられる主な要因は次のとおりです。
-
HiRDB_userに指定したHiRDB認可識別子のパスワード有効期間を超えた。
CREATE CONNECTION SECURITYでHiRDB_userに指定したHiRDB認可識別子のパスワード有効期間を設定している場合は,この有効期間を確認してください。HiRDB_userについては,「2.4.3 インスタンス環境の設定」または「3.4.3 インスタンス環境の設定」を参照してください。CREATE CONNECTION SECURITYについては,マニュアル「HiRDB SQLリファレンス」を参照してください。
(8) レコード収集のタイミングで,rsh(remsh,rcp)用のポートが枯渇することがある
考えられる主な要因は次のとおりです。
-
レコードを収集する間隔が短い,または短期間に多種のレコードを収集したことによって,TIME-WAIT状態のコネクションが解放される前に次のレコードを収集した。
netstatコマンドなどでrsh(remsh,rcp)用のポートの使用状況を確認して,レコードの収集間隔を調整してください。
また,HiRDB 10-03以降のバージョンでは,pd_cmd_rmodeでsshを指定することも検討してください。pd_cmd_rmodeの詳細はマニュアル「HiRDB システム定義」を参照してください。
(9) KAVF15020-Wメッセージなどのワーニングメッセージやエラーメッセージが出力され続ける
PFM - Agent for HiRDBをクラスタシステムで運用しないでHiRDBの系切り替え機能を使用している場合,HiRDBの待機系でPFM - Agent for HiRDBを起動すると,PFM - Agent for HiRDBは待機系の(停止している)HiRDBに対してパフォーマンスデータを収集しようとするため,このような現象が発生します。待機系で出力されたメッセージを無視するか,待機系のPFM - Agent for HiRDBを停止してください。
(10) KAVF15063-Wが出力されて収集がスキップされる
考えられる主な要因は次のとおりです。
-
PFM - Agent for HiRDB起動時に,HiRDBクライアント環境定義PDLANGが有効になっていない。
シェルなどから起動コマンドを実行している場合は,シェル内で環境変数PDLANGを有効にして起動コマンドを実行してください。