19.8.1 一般的な設定の誤り
HA設定での一般的な誤りの例を次に示します。
ディスク設定が正しくない。
VCSまたはSCSを使用している場合で,リソースをプローブできないときは,設定に何らかの間違いがあります。ディスクをプローブできないとき,オペレーティングシステムはディスクにアクセスできなくなることがあります。
手動でディスク設定をテストし,設定が適切であることをHA製品のマニュアルを参照して確認してください。
ディスクが使用中で,HAリソースグループで起動できない。
HAリソースグループを起動する前に,ディスクがアクティブでないことを必ず確認してください。
WSFCのネットワーク設定が正しくない。
ネットワークトラフィックが複数のNICカード上を流れる場合は,ovjbossプロセスなどのネットワーク帯域幅を大量に消費するプログラムをアクティブ化するとRDPセッションが失敗します。
一部のHA製品がブート時に自動的に再起動しない。
ブートアップ時の自動再起動の設定方法については,HA製品のマニュアルを参照してください。
NFS,またはほかのアクセスがOSに直接追加される。
リソースグループ設定でこの動作を管理している必要があります。
フェイルオーバーの間,またはHAリソースグループをオフラインにする間に,カレントディレクトリを共有ディスクのマウントポイントにしている。
HAは,共有ディスクのマウント解除を阻止するプロセスをすべて抹消します。フェイルオーバーまたはリソースグループのオフライン時には別のディレクトリに移動してください。
HAクラスタの仮想IPアドレスをHAリソースの仮想IPアドレスとして再使用している。
一方のシステムで有効で,他方では無効となります。それぞれに異なるIPアドレスを設定してください。
タイムアウトが短過ぎる。
製品に不具合があると,HA製品はHAリソースをタイムアウトさせ,フェイルオーバーが実行されます。
WSFCで,[リソースが開始するまでの待機時間]の設定値を確認します。NNMiでは,この値は15分に設定されますが,この値を増やすことができます。
メンテナンスモードを使用していない。
メンテナンスモードは,HAの障害をデバッグするためのモードです。リソースグループがシステムでオンラインになった直後にすぐフェイルオーバーしてしまうような場合に,メンテナンスモードは,システムでリソースグループを維持し,実際に障害のある部分を見つけるのに役立ちます。
クラスタログを再確認していない。
クラスタログで多くの一般的な間違いを確認できます。