Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


4.3.6 NFSの制御機能での処理の流れ

ここでは,NFSの制御機能での実行サーバの起動,停止,および監視の処理の流れについて説明します。

〈この項の構成〉

(1) 実行サーバの起動

次の順番で処理を実行します。

  1. ボリュームグループの接続,およびファイルシステムのマウントを実施します。

  2. エイリアスIPアドレスを付与します。

  3. NFSサービスの常駐プロセス※1が存在しない場合,NFSサブシステムのグループ※2を起動します。

  4. NFSクライアントからファイルシステムにアクセスできるようにするため,nameオペランドに指定した起動コマンドで,公開するディレクトリをエクスポートします。

    公開するディレクトリは,HAモニタのエクスポート設定ファイルで設定します。詳細は「6.14.5 エクスポート設定ファイルの設定」を参照してください。

注※1

NFSサービスの常駐プロセスとは,nfsdrpc.mountdrpc.lockdおよびrpc.statdを指します。

注※2

NFSサブシステムのグループとは,OSのstartsrcコマンドの-gオプションに渡すグループ(nfs)を指します。

(2) 実行サーバの停止

次の順番で処理を実行します。

  1. 停止コマンドによって,公開するディレクトリのアンエクスポートを実施します。

  2. エイリアスIPアドレスを削除します。

  3. ファイルシステムのアンマウント,およびボリュームグループの切断を実施します。

(3) 実行サーバの監視

監視間隔ごとに,次の順番でチェックを実施します。

  1. NFSサービスの常駐プロセスがあるかどうかをチェックします。

  2. 公開しているディレクトリがエクスポートされているかどうかをチェックします。

上記のどちらかのチェックで障害を検知した場合,サーバ対応の環境設定(servers)の設定に従って,系切り替えまたはサーバの再起動を実施します。また,障害を検知したあと,できるだけ早く業務を再開できるようにするため,1.のチェックで障害を検知した場合は,2.のチェックを実施しません。

各チェックの詳細を次に示します。

NFSサービスの常駐プロセスがあるかどうかのチェック

プロセス障害が発生した場合,またはNFSサービスを誤って停止した場合は,障害として検知します。また,監視処理の実行間隔×監視リトライ回数の期間内に,該当プロセスの一部またはすべてを確認できなかった場合,障害として検知します。監視処理の実行間隔および監視リトライ回数は,監視コマンドで設定します。詳細は「6.14.6 起動・停止・監視コマンドの設定」を参照してください。

また,監視中に該当のプロセスが再起動した場合,監視コマンドは次の動作を実施します。

  • 監視処理の実行間隔×監視リトライ回数の期間内に該当のプロセスが再起動した場合

    障害として検知されません。クライアントからはNFSアクセスを継続できます。

  • 監視処理の実行間隔×監視リトライ回数の期間内に該当のプロセスが再起動しなかった場合

    このチェックで障害として検知されます。

公開しているディレクトリがエクスポートされているかどうかのチェック

HAモニタのエクスポート設定ファイルに指定された公開ディレクトリがエクスポートされているかどうかをチェックします。誤ってアンエクスポートされた場合などは,障害として検知します。公開ディレクトリが複数ある場合は,どれか1つでもエクスポートされていないときに障害として検知します。

害を検知した場合,メッセージKAMN275-Eを出力して,servexec_retryオペランドの指定値に従ってサーバの再起動または系切り替えをします。

視の結果は/opt/hitachi/HAmon/spoolの下に「サーバ識別名.nfsptrllog」というファイル名で出力されます。出力される終了コードから障害の原因を判別できます。終了コードについては「6.14.6 起動・停止・監視コマンドの設定」を参照してください。