Hitachi

JP1 Version 12 JP1/Network Node Manager i セットアップガイド


19.8.4 NNMi固有のHAのトラブルシューティング

この項の内容が適用されるのは,NNMiだけのHA設定です。

〈この項の構成〉

(1) NNMiをHA下で正常に起動できない

NNMiが正しく起動しない場合,仮想IPアドレスまたはディスクに関するハードウェアの問題であるのか,アプリケーション障害の問題であるのかをデバッグする必要があります。このデバッグプロセスの間,システムをメンテナンスモードにします。

この問題を解決するには,次の手順を実行します。

  1. HAクラスタのアクティブなクラスタノードで,次のメンテナンスファイルを作成して,HAリソースグループの監視を無効にする。

    • Windows:%NnmDataDir%hacluster\<resource_group>\maintenance

    • Linux:$NnmDataDir/hacluster/<resource_group>/maintenance

  2. NNMiを起動する。

    ovstart
  3. NNMiを正常に起動できたことを確認する。

    ovstatus -c

    すべてのNNMiサービスで,[実行中]状態が表示される必要があります。このように表示されない場合,正しく開始していないプロセスをトラブルシューティングします。

  4. トラブルシューティングが完了したら,メンテナンスファイルを削除する。

    • Windows:%NnmDataDir%hacluster\<resource_group>\maintenance

    • Linux:$NnmDataDir/hacluster/<resource_group>/maintenance

(2) NNMiデータへの変更がフェイルオーバーのあとに表示されない

NNMiの設定で,NNMiを実行中のシステム以外のシステムが設定されています。この問題を解決するには,ov.confファイルに次の項目に対応した適切なエントリがあることを確認します。

ov.confファイルの場所は,「19.9.1 NNMi HA設定ファイル」を参照してください。

(3) HAの設定後,nmsdbmgrを起動できない

この状況は,通常,nnmhaconfigure.ovplコマンドを実行したが,-toオプションを指定してnnmhadisk.ovplコマンドを実行しないで,NNMiを起動した場合に発生します。この状況では,ov.confファイルのHA_POSTGRES_DIRエントリは,共有ディスクの場所を指していますが,この場所はNNMiからはアクセスできません。

この問題を解決するには,次の手順を実行します。

  1. HAクラスタのアクティブなクラスタノードで,次のメンテナンスファイルを作成して,HAリソースグループの監視を無効にする。

    • Windows:%NnmDataDir%hacluster\<resource_group>\maintenance

    • Linux:$NnmDataDir/hacluster/<resource_group>/maintenance

  2. NNMiデータベースを共有ディスクにコピーする。

    • Windows:

      %NnmInstallDir%misc\nnm\ha\nnmhadisk.ovpl NNM -to <HA_mount_point>

    • Linux:

      $NnmInstallDir/misc/nnm/ha/nnmhadisk.ovpl NNM -to <HA_mount_point>

  3. NNMi HAリソースグループを起動する。

    • Windows:

      %NnmInstallDir%misc\nnm\ha\nnmhastartrg.ovpl NNM <resource_group>

    • Linux:

      $NnmInstallDir/misc/nnm/ha/nnmhastartrg.ovpl NNM <resource_group>

  4. NNMiを起動する。

    ovstart
  5. NNMiを正常に起動できたことを確認する。

    ovstatus -c

    すべてのNNMiサービスで,[実行中]状態が表示される必要があります。

  6. トラブルシューティングが完了したら,メンテナンスファイルを削除する。

    • Windows:%NnmDataDir%hacluster\<resource_group>\maintenance

    • Linux:$NnmDataDir/hacluster/<resource_group>/maintenance

(4) NNMiが1つのHAクラスタノードでだけ正常に実行される(Windowsの場合)

Windowsオペレーティングシステムには,HAクラスタ用とHAリソースグループ用の2つの異なる仮想IPアドレスが必要です。HAクラスタの仮想IPアドレスとNNMi HAリソースグループの仮想IPアドレスが同じ場合,NNMiは,HAクラスタのIPアドレスと関連づけられているノードでだけ正常に実行されます。

この問題を修正するには,HAクラスタの仮想IPアドレスをネットワークで一意の値に変更します。

(5) ディスクフェイルオーバーが行われない

この状況は,オペレーティングシステムが共有ディスクをサポートしていない場合に発生します。HA製品,オペレーティングシステム,ディスクのメーカーのマニュアルなどを参照して,これらの製品を混在させて使用できるか確認してください。

ディスク障害が発生すると,NNMiはフェイルオーバーでは起動しません。nmsdbmgrが失敗する理由の多くは,HA_POSTGRES_DIRディレクトリが存在しないことです。共有ディスクがマウント済みであり,該当するファイルにアクセスできる状態になっていることを確認してください。

(6) 共有ディスクにアクセスできない(Windowsの場合)

nnmhaclusterinfo.ovpl -config NNM -get HA_MOUNT_POINTコマンドを実行しても何も表示されない場合,共有ディスクのマウントポイントの設定が不適切のため,共有ディスクにアクセスできません。

共有ディスクのマウントポイントのドライブは,HA設定時に次のように完全に指定します。

(例)Y:

この問題を修正するには,HAクラスタの各ノードでnnmhaconfigure.ovplコマンドを実行します。

(7) フェイルオーバー後にセカンダリクラスタノードで共有ディスク上のファイルが見つからない

この状況は,通常,共有ディスクがマウントされていないときに,-toオプションを付けたnnmhadisk.ovplコマンドを実行した場合に発生します。この場合は,データファイルはローカルディスクにコピーされ,共有ディスクには格納されません。

この問題を解決するには,次の手順を実行します。

  1. HAクラスタのアクティブなクラスタノードで,次のメンテナンスファイルを作成して,HAリソースグループの監視を無効にする。

    • Windows:%NnmDataDir%hacluster\<resource_group>\maintenance

    • Linux:$NnmDataDir/hacluster/<resource_group>/maintenance

  2. アクティブなクラスタノードにログオンして,ディスクがマウントされ,使用できることを確認する。

  3. NNMiを停止する。

    ovstop
    • Windows:net stop NnmTrapReceiver

    • Linux:
      systemd でサービスを管理しているディストリビューションの場合
      /opt/OV/bin/nettrap stop
      それ以外のディストリビューションの場合
      /etc/init.d/nettrap stop
  4. NNMiデータベースを共有ディスクにコピーする。

    • Windows:

      %NnmInstallDir%misc\nnm\ha\nnmhadisk.ovpl NNM -to <HA_mount_point>

    • Linux:

      $NnmInstallDir/misc/nnm/ha/nnmhadisk.ovpl NNM -to <HA_mount_point>

  5. NNMi HAリソースグループを起動する。

    • Windows:

      %NnmInstallDir%misc\nnm\ha\nnmhastartrg.ovpl NNM <resource_group>

    • Linux:

      $NnmInstallDir/misc/nnm/ha/nnmhastartrg.ovpl NNM <resource_group>

  6. NNMiを起動する。

    ovstart
  7. NNMiを正常に起動できたことを確認する。

    ovstatus -c

    すべてのNNMiサービスで,[実行中]状態が表示される必要があります。

  8. トラブルシューティングが完了したら,メンテナンスファイルを削除する。

    • Windows:%NnmDataDir%hacluster\<resource_group>\maintenance

    • Linux:$NnmDataDir/hacluster/<resource_group>/maintenance