17.8.4 NNMi固有のHAのトラブルシューティング
この項の内容が適用されるのは,NNMiだけのHA設定です。
- 〈この項の構成〉
(1) すべてのクラスタノードを設定解除したあとのHA用のNNMiを再び有効にする
すべてのNNMi HAクラスタノードの設定を解除した場合は,NNMiの共有ディスクのマウントポイントへのリンクが,ov.confファイルから削除されます。共有ディスク内のデータを上書きすることなく,マウントポイントへのリンクを作成し直すには,プライマリクラスタノードで次の手順を実行します。
-
NNMiが実行中であれば,停止する。
ovstop -c
-
共有ディスクへのリンクを削除する。
-
Windowsの場合
%NnmInstallDir%misc\nnm\ha\nnmhadisk.ovpl NNM -setmount <HA_mount_point>
-
UNIXの場合
$NnmInstallDir/misc/nnm/ha/nnmhadisk.ovpl NNM -setmount <HA_mount_point>
-
-
ov.confファイルのHAマウントポイント関連のエントリを確認する。
ov.confファイルの場所は,「17.9.1 NNMi HA設定ファイル」を参照してください。
(2) NNMiをHA下で正常に起動できない
NNMiが正しく起動しない場合,仮想IPアドレスまたはディスクに関するハードウェアの問題であるのか,アプリケーション障害の問題であるのかをデバッグする必要があります。このデバッグプロセスの間,システムをメンテナンスモードにします。
この問題を解決するには,次の手順を実行します。
-
HAクラスタのアクティブなクラスタノードで,次のメンテナンスファイルを作成して,HAリソースグループの監視を無効にする。
Windows:%NnmDataDir%\hacluster\<resource_group>\maintenance
UNIX:$NnmDataDir/hacluster/<resource_group>/maintenance
-
NNMiを起動する。
ovstart
-
NNMiを正常に起動できたことを確認する。
ovstatus -c
すべてのNNMiサービスで,[実行中]状態が表示される必要があります。このように表示されない場合,正しく開始していないプロセスをトラブルシューティングします。
-
トラブルシューティングが完了したら,メンテナンスファイルを削除する。
Windows:%NnmDataDir%\hacluster\<resource_group>\maintenance
UNIX:$NnmDataDir/hacluster/<resource_group>/maintenance
(3) NNMiデータへの変更がフェイルオーバーのあとに表示されない
NNMiの設定で,NNMiを実行中のシステム以外のシステムが設定されています。この問題を解決するには,ov.confファイルに次の項目に対応した適切なエントリがあることを確認します。
-
NNM_INTERFACE=<virtual_hostname>
-
HA_RESOURCE_GROUP=<resource_group>
-
HA_MOUNT_POINT=<HA_mount_point>
-
NNM_HA_CONFIGURED=YES
-
HA_POSTGRES_DIR=<HA_mount_point>/NNM/dataDir/shared/nnm/databases/Postgres
-
HA_EVENTDB_DIR=<HA_mount_point>/NNM/dataDir/shared/nnm/databases/eventdb
-
HA_CUSTOMPOLLER_DIR=<HA_mount_point>/NNM/dataDir/shared/nnm/databases/custompoller
-
HA_NNM_LOG_DIR=<HA_mount_point>/NNM/dataDir/log/nnm
-
HA_JBOSS_DATA_DIR=<HA_mount_point>/NNM/installDir/nonOV/jboss/nms/server/nms/data
-
HA_LOCALE=<ロケール>(UNIXだけ)
-
HA_PERFSPI_ADAPTER_DIR=<HA_mount_point>/NNM/dataDir/shared/perfSpi/datafiles
ov.confファイルの場所は,「17.9.1 NNMi HA設定ファイル」を参照してください。
(4) HAの設定後,nmsdbmgrを起動できない
この状況は,通常,nnmhaconfigure.ovplコマンドを実行したが,-toオプションを指定してnnmhadisk.ovplコマンドを実行しないで,NNMiを起動した場合に発生します。この状況では,ov.confファイルのHA_POSTGRES_DIRエントリは,共有ディスクの場所を指していますが,この場所はNNMiからはアクセスできません。
この問題を解決するには,次の手順を実行します。
-
HAクラスタのアクティブなクラスタノードで,次のメンテナンスファイルを作成して,HAリソースグループの監視を無効にする。
-
Windows:%NnmDataDir%\hacluster\<resource_group>\maintenance
-
UNIX:$NnmDataDir/hacluster/<resource_group>/maintenance
-
-
NNMiデータベースを共有ディスクにコピーする。
-
Windows:%NnmInstallDir%\misc\nnm\ha\nnmhadisk.ovpl NNM \
-to <HA_mount_point>
-
UNIX:$NnmInstallDir/misc/nnm/ha/nnmhadisk.ovpl NNM \
-to <HA_mount_point>
-
-
NNMi HAリソースグループを起動する。
-
Windows:%NnmInstallDir%\misc\nnm\ha\nnmhastartrg.ovpl NNM \
<resource_group>
-
UNIX:$NnmInstallDir/misc/nnm/ha/nnmhastartrg.ovpl NNM \
<resource_group>
-
-
NNMiを起動する。
ovstart
-
NNMiを正常に起動できたことを確認する。
ovstatus -c
すべてのNNMiサービスで,[実行中]状態が表示される必要があります。
-
トラブルシューティングが完了したら,メンテナンスファイルを削除する。
-
Windows:%NnmDataDir%\hacluster\<resource_group>\maintenance
-
UNIX:$NnmDataDir/hacluster/<resource_group>/maintenance
-
(5) NNMiが1つのHAクラスタノードでだけ正常に実行される(Windowsの場合)
Windowsオペレーティングシステムには,HAクラスタ用とHAリソースグループ用の2つの異なる仮想IPアドレスが必要です。HAクラスタの仮想IPアドレスとNNMi HAリソースグループの仮想IPアドレスが同じ場合,NNMiは,HAクラスタのIPアドレスと関連づけられているノードでだけ正常に実行されます。
この問題を修正するには,HAクラスタの仮想IPアドレスをネットワークで一意の値に変更します。
(6) ディスクフェイルオーバーが行われない
この状況は,オペレーティングシステムが共有ディスクをサポートしていない場合に発生します。HA製品,オペレーティングシステム,ディスクのメーカーのマニュアルなどを参照して,これらの製品を混在させて使用できるか確認してください。
ディスク障害が発生すると,NNMiはフェイルオーバーでは起動しません。nmsdbmgrが失敗する理由の多くは,HA_POSTGRES_DIRディレクトリが存在しないことです。共有ディスクがマウント済みであり,該当するファイルにアクセスできる状態になっていることを確認してください。
(7) 共有ディスクにアクセスできない(Windowsの場合)
nnmhaclusterinfo.ovpl -config NNM -get HA_MOUNT_POINTコマンドを実行しても何も戻されません。
共有ディスクのマウントポイントのドライブは,HA設定時に次のように完全に指定します。
(例)Y:
この問題を修正するには,HAクラスタの各ノードでnnmhaconfigure.ovplコマンドを実行します。
(8) フェイルオーバー後にセカンダリクラスタノードが共有ディスクファイルを見つけられない
この状況は,通常,共有ディスクがマウントされていないときに,-toオプションを付けたnnmhadisk.ovplコマンドを実行した場合に発生します。この場合は,データファイルはローカルディスクにコピーされ,共有ディスクには格納されません。
この問題を解決するには,次の手順を実行します。
-
HAクラスタのアクティブなクラスタノードで,次のメンテナンスファイルを作成して,HAリソースグループの監視を無効にする。
Windows:%NnmDataDir%\hacluster\<resource_group>\maintenance
UNIX:$NnmDataDir/hacluster/<resource_group>/maintenance
-
アクティブなクラスタノードにログオンして,ディスクがマウントされ,使用できることを確認する。
-
NNMiを停止する。
ovstop
-
NNMiデータベースを共有ディスクにコピーする。
Windows:%NnmInstallDir%\misc\nnm\ha\nnmhadisk.ovpl NNM \
-to <HA_mount_point>
UNIX:$NnmInstallDir/misc/nnm/ha/nnmhadisk.ovpl NNM \
-to <HA_mount_point>
-
NNMi HAリソースグループを起動する。
Windows:%NnmInstallDir%\misc\nnm\ha\nnmhastartrg.ovpl NNM \
<resource_group>
UNIX:$NnmInstallDir/misc/nnm/ha/nnmhastartrg.ovpl NNM \
<resource_group>
-
NNMiを起動する。
ovstart
-
NNMiを正常に起動できたことを確認する。
ovstatus -c
すべてのNNMiサービスで,[実行中]状態が表示される必要があります。
-
トラブルシューティングが完了したら,メンテナンスファイルを削除する。
Windows:%NnmDataDir%\hacluster\<resource_group>\maintenance
UNIX:$NnmDataDir/hacluster/<resource_group>/maintenance