6.3.3 【AWS】HVRD連携時の注意事項
HVRD連携時の注意事項について,説明します。
-
HVRDの通信障害でレプリケーションが中断した際は,次に従って対処してください。
<レプリケーション元でI/Oを継続している場合>
-
レプリケーションができなくなった原因を調査する
HAモニタエージェントが稼働している系で,monshow -agtコマンドを実行すると,各AZのHAモニタとの通信状況を確認できます。必要に応じて原因調査の手段として活用してください。
monshow -agtコマンドを実行すると,HAモニタエージェントが直近1分間に各HAモニタから受信したヘルスチェックメッセージの受信数がわかります。ヘルスチェックメッセージは100msごとに送信しているため,600個受信できている場合が正常です(コマンド実行とヘルスチェックメッセージ受信のタイミングによって599個の場合もあります)。例えば,レプリケーション先の系の受信数が0個となっていれば,レプリケーション先のOSやインスタンス,またはAZの通信不調や障害と判断できます。コマンドの詳細は,「8.1.3 monshow(サーバと系の状態表示)」を参照してください。
-
エラー原因を取り除いたあと,データを再同期してレプリケーションを再開させる
-
待機サーバが停止している場合は,待機サーバを再起動する
<レプリケーション元がI/Oを停止してディスクI/Oがエラーとなった場合>
-
AZ内で系切り替えして業務が継続しているとき
系切り替え元で発生したエラーの原因を取り除いたあと,待機サーバを起動します。必要に応じて切り戻しなどをしてください。
-
業務が停止しているとき
各AZの状態をAWSのコンソールなどを使用して確認し,業務を再開するAZを決めます。
HAモニタエージェントが稼働している系で,monshow -agtコマンドを実行すると,エージェントヘルスチェックによる通信状況が確認できます。各AZの各HAモニタからのヘルスチェックメッセージ受信数がわかるため,不調のないAZおよび系を確認できます。AZの状態確認でネットワーク状態を調査するときに,必要に応じて活用してください。各コマンドの詳細は,「8.1.3 monshow(サーバと系の状態表示)」を参照してください。
-
-
HVRDによるレプリケーションを必要とするサーバの稼働中は,HAモニタエージェントを停止しないでください。メンテナンスなどで停止する必要がある場合は,メンテナンスなどの終了後,速やかにHAモニタエージェントを起動してください。
-
HAモニタ起動時にメッセージKAMN766-Eが出力され,パブリッククラウド環境の情報取得が失敗している場合,パブリッククラウド環境の情報取得の成功を示すメッセージKAMN765-Iが出力されるまで,HAモニタエージェントとの接続はできません。HAモニタで,メッセージKAMN766-Eに従って対処してください。