8.3.1 HAモニタの環境設定sysdef

HAモニタの環境を設定する定義ファイルは,HAモニタの環境設定用ディレクトリの下にsysdefというファイル名で作成します。

また,HAモニタのサンプルファイル用ディレクトリの下に,sysdefファイルのサンプルが用意されています。このファイルをHAモニタの環境設定用ディレクトリにコピーし,書き換えて使用すると,定義ファイルを最初から作成する手間が省けます。

なお,この定義ファイルは系ごとに作成します。太字部分は,系間で同じ値を指定してください。太字以外の部分は,系間で矛盾がないように設定してください。

HAモニタの環境設定をする定義ファイルを,次に示します。

/*    HAモニタの環境設定    */
 environment  name   自系のホスト名
             ,address
                    自系のホストアドレス
             ,patrol
                    系障害監視時間
             ,lan   TCP/IPのホスト名〔:TCP/IPのホスト名…〕
             ,lanport
                    TCP/IPのサービス名〔:TCP/IPのサービス名…〕
           〔,fs_log_size
                  {ファイルシステム切り替えログファイルのサイズ
                  |65536}〕
           〔,servmax
                  {1664}〕;
〔function  〔 cpudown
                  {onlinestandby}{,|;}〕
           〔 standbyreset
                  {usenouse}{,|;}〕
           〔 pathpatrol
                    監視パスのヘルスチェック間隔{,|;}〕
           〔 pathpatrol_retry
                  {再チェック間隔30}:{再チェック回数5}{,|;}〕
           〔 message_retry
                  {リトライ間隔3}{,|;}〕
           〔 connect_retry
                  {接続間隔5}:{接続回数200}{,|;}〕
           〔 monbegin_restart
                  {usenouse}{,|;}〕
           〔 netmask
                  {bytebit}{,|;}〕
           〔 usrcommand
                    ユーザコマンドのフルパス名{,|;}〕
           〔 lanpatrol
                  {LANアダプタの監視間隔15}{,|;}〕
           〔 lan_pair
                    現用LANアダプタ名-予備LANアダプタ名称〔:現用LANアダプタ名-予備LANアダプタ名…〕{,|;}〕
           〔 lanfailswitch
                    {usenouse}{,|;}〕
           〔 resetpatrol
                  {リセットパスのヘルスチェック間隔2}{,|;}〕
           〔 multistandby
                  {usenouse}{,|;}〕
           〔 deviceoff_order
                  {orderreverse}{,|;}〕
           〔 reset_type
                  {serverhost}{,|;}〕
           〔 jp1_event
                  {useuse_sesnouse}{,|;}〕
           〔 ph_log_size
                  監視履歴ファイルのサイズ{,|;}〕
           〔 ph_threshold
                  系監視履歴取得時間;〕〕
           〔 termcmd_at_abort
                   {usenouse}{,|;}〕
〔options   〔 keep_gsp_mode
                  {use|nouse}〕;〕

<この項の構成>
(1) environment定義文
(2) function定義文
(3) options定義文

(1) environment定義文

HAモニタの動作環境を定義します。environment定義文のオペランドを,次に示します。

name~<1~32文字の英数字>
HAモニタで複数の系を識別するために使用する名称です。使用するマシンの機種によって,指定する名称が異なります。nameオペランドに指定した名称は,HAモニタのコマンド実行時にホスト名(host name)として表示されます。
  • 使用するマシンの機種がBladeSymphonyの場合,系ごとに固有となる任意の名称を指定します。
  • 使用するマシンの機種がH9000VまたはHA8500の場合,自系の障害管理プロセサに指定したIPアドレスに対応するホスト名を指定します。
address~<1~8桁の符号なし整数>((0~99999999))
CPUのリセット時に系を特定するために,自系のホストアドレスを任意の値で指定します。ハードウェアへの設定はHAモニタがします。
監視パスまたはリセットパスでつながるすべての系で,それぞれ固有のアドレスを指定してください。なお,システム内に互いに監視し合わない系切り替え構成が複数あり,かつ,それらがリセットパスを共用する場合,すべての系でそれぞれ固有となるように指定してください。
複数の系で同じアドレスを設定すると,HAモニタが誤動作するおそれがあります。
使用するマシンの機種がBladeSymphonyの場合は,ハードウェアの制約上,0~9999の範囲で指定してください。
patrol~<符号なし整数>((5~600))(単位:秒)
系障害の判断基準となる,他系からのaliveメッセージを監視する時間(系障害監視時間)を指定します。現用系と予備系とで同じ値を指定してください。patrolオペランドに指定した時間を過ぎても他系からaliveメッセージが送信されない場合,HAモニタは系障害と判断します。
lan~<1~32文字の英数字>
監視パスに使用するTCP/IP LANのホスト名を指定します。系ごとに固有の名称にしてください。
lanオペランドに指定するホスト名は,/etc/hostsファイルに設定したホスト名と同じにしてください。/etc/hostsファイルについては,「6.6.1 ホスト名とサービス名の登録」を参照してください。
TCP/IP LANのホスト名は,":"で区切って指定します。3個まで指定できます。複線化した監視パスの中で優先して使用したいパスがある場合は,そのパスのホスト名の前に,"#"を付けて指定します。優先して使用したいパスは,一つだけ指定できます。次に指定の例を示します。

lan  #path11:path12,

例で示す指定では,監視パスが"path11"と"path12"の2本に複線化され,"path11"の監視パスが優先して使用されます。
lanport~<1~32文字の英数字>
監視パスに使用するTCP/IP LANのサービス名を指定します。現用系と予備系とで同じ値を指定してください。
lanportオペランドに指定するサービス名は,/etc/servicesファイルに設定したサービス名と同じにしてください。/etc/servicesファイルについては,「6.6.1 ホスト名とサービス名の登録」を参照してください。
lanportオペランドでは,lanオペランドで指定したホスト名に対応するサービス名を,同じ位置の引数に指定します。サービス名の指定数はlanオペランドのホスト名の指定数と同じにしてください。次に指定の例を示します。

   lan    path11 :path12,
         ↓   ↓
   lanport HAmon1 :HAmon2,

例の場合,lanオペランドの"path11"はlanportオペランドの"HAmon1"に,lanオペランドの"path12"はlanportオペランドの"HAmon2"に対応します。
fs_log_size~<符号なし整数>((0~2147483647))《65536》(単位:バイト)
ファイルシステム切り替え時のログファイルの最大サイズをバイト数で指定します。現用系と予備系とで同じ値を指定してください。ファイルサイズが最大を超えた場合,次のログ取得時点でファイルが自動的にバックアップされ,クリアされます。
servmax~((16または64))《16》
一つの系で同時に稼働できるサーバの最大数を指定します。現用系と予備系とで同じ値を指定してください。16または64以外の数値は指定できません。
  • 16:同時に稼働できるサーバの最大数を16に設定します。
  • 64:同時に稼働できるサーバの最大数を64に設定します。

(2) function定義文

HAモニタの動作オプションを定義します。定義は任意です。定義していない場合は,仮定値が設定されます。function定義文のオペランドを,次に示します。

cpudown~《online》
実行系と待機系のどちらをリセット優先系にするかを指定します。現用系と予備系とで同じ値を指定してください。リセット優先系に指定すると,実行系と待機系とで同時に系障害を検出した場合に,リセット優先系に指定した系が優先的に相手の系をリセットします。
  • online:実行系をリセット優先系にします。
  • standby:待機系をリセット優先系にします。
standbyreset~《nouse》
待機系の系障害を実行系が検出した場合に,待機系をリセットするかどうかを指定します。現用系と予備系とで同じ値を指定してください。multistandbyオペランドにuseを指定した場合は,このオペランドの指定は無視されます。
  • use:待機系をリセットします。1:1系切り替え構成以外では,useを指定しないでください。
  • nouse:待機系をリセットしません。
pathpatrol~<符号なし整数>((1~240))(単位:分)
監視パスのヘルスチェック間隔を指定します。現用系と予備系とで同じ値を指定してください。
pathpatrolオペランドの指定を省略した場合は,監視パスのヘルスチェックはしません。必ず設定してください。
pathpatrol_retry
監視パスの障害検出時に,監視パスの状態を再チェックする間隔と回数を,":"で区切って指定します。現用系と予備系とで同じ値を指定してください。pathpatrolオペランドの指定を省略した場合は,監視パスの再チェックはしません。
  • 再チェック間隔~<符号なし整数>((3~600))《30》(単位:秒)
    監視パスの再チェックの間隔を指定します。
  • 再チェック回数~<符号なし整数>((0~20))《5》(単位:回)
    監視パスの再チェックの回数を指定します。0を指定すると,監視パスの再チェックはしません。
再チェック間隔と再チェック回数には,それぞれの積がpathpatrolオペランドで指定した監視パスのヘルスチェック間隔を超えない値を指定してください。指定する値は,次に示す計算式で確認してください。

監視パスのヘルスチェック間隔×60 ≧ 再チェック間隔×(再チェック回数+1)

message_retry~<符号なし整数>((3~600))《3》(単位:秒)
監視パスを使用する問い合わせ応答メッセージの送信失敗時に,メッセージ送信をリトライする間隔を指定します。現用系と予備系とで同じ値を指定してください。
message_retryオペランドの指定を省略した場合は,HAモニタが3秒間隔でメッセージ送信をリトライします。
リトライは,送信が成功するまで続けます。系間の監視中(aliveメッセージの監視中)でない場合,HAモニタは,60秒を超えても問い合わせ応答メッセージの送信が成功しなければ系障害が発生したと判断します。なお,message_retryオペランドに60秒以上を指定した場合は,指定した時間までメッセージの受信を待ってから系障害と判断します。
connect_retry
HAモニタ間で接続処理をする間隔と回数を,":"で区切って指定します。現用系と予備系とで同じ値を指定してください。
接続されているHAモニタが多い場合は,HAモニタ間が接続しなくなることがあるため,必ず指定してください。このオペランドはHAモニタの接続構成設定ファイルが作成されている場合に有効となります。
  • 接続間隔~<符号なし整数>((5~60))《5》(単位:秒)
    HAモニタ間での接続処理の間隔を指定します。間隔が短いとHAモニタの性能に影響し,長いとHAモニタ間の接続が遅れる場合があります。目安として,接続されているHAモニタの数が10以上の場合は,10秒以上を指定してください。
  • 接続回数~<符号なし整数>((1~9999))《200》(単位:回)
    HAモニタ間での接続処理のリトライ回数を指定します。9999を指定すると,すべてのHAモニタと接続するまで接続処理を繰り返します。
    回数が少ないとHAモニタ間の接続ができない場合があり,多いとHAモニタの性能に影響します。したがって,通常はデフォルト値を指定しておき,HAモニタ間の接続ができないことがある場合だけ,回数を増やして指定してください。
    なお,この回数を超えても接続できなかった場合は,メッセージKAMN176-Eを出力します。
monbegin_restart~《use》
系障害で実行系がリセットされた際に,実行系のHAモニタの再起動後,自動でモニタモードのサーバ起動コマンド(monbeginコマンド)を実行して,モニタモードのサーバを起動するかどうかを指定します。現用系と予備系とで同じ値を指定してください。
  • use:モニタモードのサーバを自動で起動します。JP1などの運用管理ソフトウェアを使用して自動でサーバを起動しない場合は,useを指定することをお勧めします。
  • nouse:モニタモードのサーバを自動で起動しません。JP1などの運用管理を使用して自動でサーバを起動する場合は,nouseを指定してください。
netmask~《byte》
監視パスとして使用するLANインタフェースに設定したネットマスクを指定します。現用系と予備系とで同じ値を指定してください。また,LANが同一ネットワーク番号で複数のサブネットとして構成されているネットワークでは,同じネットマスクを設定してください。ネットマスクの設定については,「5.4.2 必要なIPアドレス」を参照してください。
netmaskオペランドの設定およびネットマスクの設定を誤ると,他系のHAモニタと通信ができないなど,HAモニタが誤動作します。
  • byte:ネットマスクが10進表現で255,0の値の場合にだけ指定します。次に例を示します。

    255.255.0.0

  • bit:ネットマスクが10進表現で255,0以外の値がある場合に指定します。次に例を示します。

    255.255.255.192

    netmaskオペランドにbitを指定する場合,ネットマスクの設定では,次の制限があります。
    IPアドレスとネットマスクの組み合わせによって認識されるネットワークアドレスの部分(ネットワーク番号の部分とサブネット番号の部分)は,各クラスで決められているネットワーク番号の部分をすべて含んでいる必要があります。例えば,クラスBのネットワークに対して"255.254.0.0"というネットマスクは設定できません。
ネットマスクの値は,OSのifconfigコマンドで確認できます。ネットマスクおよびifconfigコマンドの詳細については,OSのマニュアルを参照してください。
usrcommand~<1~1000文字のパス名>
HAモニタに自動発行させるユーザコマンドのフルパス名を指定します。現用系と予備系とで同じ値を指定してください。
ユーザコマンドの作成方法やコーディング例については,「6.11 ユーザコマンドの作成」を参照してください。
lanpatrol~<符号なし整数>((2~60))《15》(単位:秒)
LANアダプタを二重化している場合,HAモニタがLANアダプタの状態を調査する間隔を指定します。現用系と予備系とで同じ値を指定してください。
lan_pair~<1~32文字の英数字>
LANアダプタの二重化のために,ペアとなる二つのLANアダプタ名の組を指定します。現用系と予備系とで同じ値を指定してください。
現用LANアダプタとして使用するLANアダプタ名を一つ目に,予備LANアダプタとして使用するLANアダプタ名を二つ目に指定します。二つのLANアダプタ名は,"-"で結んで指定してください。":"で区切ることによって,複数のペアを指定できます。複数のペアを指定する場合,あるペアに指定したLANアダプタを,重複して別のペアに指定できません。次に指定の例を示します。

lan_pair  lan0-lan1:lan2-lan3,

例で示す指定では,"lan0"の予備LANアダプタとして"lan1"が使用され,"lan2"の予備LANアダプタとして"lan3"が使用されます。
このオペランドを省略した場合は,LANアダプタの二重化をしません。
lanfailswitch~《nouse》
二重化されたLANアダプタの両方が障害になった場合,指定した実行サーバを自動的に計画系切り替えをするかどうかを指定します。現用系と予備系とで同じ値を指定してください。
lan_pairオペランドが指定されていない場合は,このオペランドは無視されます。
  • use:LANアダプタ二重障害時に自動計画系切り替えをします。
  • nouse:LANアダプタ二重障害時に自動計画系切り替えをしません。
lanfailswitchオペランドにuseを指定する場合は,系切り替えをするサーバにLANアダプタ名を指定する必要があります。サーバ対応の環境設定のswitchbyfailオペランドに指定します。
resetpatrol~<符号なし整数>((1~60))《2》(単位:分)
リセットパスのヘルスチェック間隔を指定します。現用系と予備系とで同じ値を指定してください。
multistandby~《nouse》
一つの実行サーバに対して複数の待機サーバを定義できる,マルチスタンバイ機能を使用するかどうかを指定します。現用系と予備系で同じ値を指定してください。マルチスタンバイ機能の詳細については,「4.5 マルチスタンバイ機能を使用する場合のサーバと系の管理」を参照してください。
  • use:マルチスタンバイ機能を使用します。
  • nouse:マルチスタンバイ機能を使用しません。
deviceoff_order~《order》
共有リソースの切り離しをする順序を指定します。現用系と予備系とで同じ値を指定してください。このオペランドの指定は,HAモニタに定義されているサーバすべてに適用されます。
また,サーバごとに共有リソースの切り離しをする順序を指定することもできます。サーバごとに指定する方法については,「8.4.1 サーバ対応の環境設定(servers)」を参照してください。また,共有リソースの切り離しをする順序の詳細については,「4.7.5 共有リソースの切り離しを接続時と逆順にする場合の処理の流れ」を参照してください。
  • order:接続時と同じ順番で共有リソースの切り離しをします。
  • reverse:接続時と逆の順番で共有リソースの切り離しをします。
reset_type~《server》
リセット発行系の決定方法を指定します。現用系と予備系とで同じ値を指定してください。HAモニタの環境設定のmultistandbyオペランドにuseを指定した場合は,このオペランドの設定に関係なく,hostが仮定されます。
  • server:リセット発行系とリセット優先系の決定手順に従い,リセット発行系を決定します。
  • host:リセット発行系決定時のリセット優先系を,リセット優先度に基づいて決定します。リセット優先度は,HAモニタの環境設定のaddressオペランドに指定したホストアドレスが小さい系ほど,高くなります。
jp1_event
JP1のイベント通知機能を使用するかどうかを指定します。現用系と予備系とで同じ値を指定してください。JP1のイベント通知機能を使用するには,システムに物理ホスト環境のJP1/Baseが必要です。
OSがHP-UX(PA-RISC)の場合,イベント形式を選択できます。jp1_eventオペランドの指定を省略した場合,HAモニタはJP1/SES形式のイベントを発行します。
OSがHP-UX(IPF)の場合,イベント形式はJP1/IM形式を使用します。JP1/SES形式は使用できません。jp1_eventオペランドの指定を省略した場合,HAモニタではJP1のイベントを発行しません。
  • use:JP1/IM形式のイベントを発行します。
  • use_ses:JP1/SES形式のイベントを発行します。OSがHP-UX(PA-RISC)の場合だけ指定できます。
  • nouse:JP1のイベント通知機能を使用しません。
ph_log_size~<符号なし整数>((1024~10485760))(単位:バイト)
サーバや系に発生したスローダウンの情報を監視履歴として記録する監視履歴ファイルのサイズを指定します。現用系と予備系とで同じ値を指定してください。
このオペランドを指定しておくと,HAモニタ起動時に指定したサイズで監視履歴ファイルが作成され,サーバや系の監視履歴を取得できます。監視履歴ファイル内の空白がなくなると監視履歴ファイルの内容はラップアラウンドされ,バックアップファイルに書き換えられます。監視履歴ファイルのサイズを見積もるための計算式を,次に示します。

監視履歴を取得するサーバや系の起動回数×180+監視履歴ファイルに記録させたいスローダウンの回数×90

ph_threshold~<符号なし整数>((5~559))(単位:秒)
自系・他系に発生したスローダウンの情報を監視履歴として取得する場合に,aliveメッセージが途絶してから監視履歴を取得するまでの時間(系監視履歴取得時間)を指定します。現用系と予備系とで同じ値を指定してください。系監視履歴取得時間は,HAモニタの環境設定のpatrolオペランドで指定した系障害監視時間よりも小さい値になるように指定する必要があります。
このオペランドを省略した場合,系の監視履歴は取得しません。また,このオペランドを指定して系の監視履歴を取得する場合,必ずph_log_sizeオペランドも指定してください。
termcmd_at_abort~《nouse》
サーバ障害時に系切り替えまたは連動系切り替えをする場合,障害が発生したモニタモードのサーバの停止コマンドにHAモニタが渡す引数の種類を指定します。現用系と予備系とで同じ値を指定してください。
  • use:サーバの停止コマンドを引数"-c"で実行します。
  • nonuse:サーバの停止コマンドを引数"-w"で実行します。
HAモニタが渡す引数については,「6.9.2 サーバの停止コマンドの作成」を参照してください。

(3) options定義文

HAモニタの付加機能を定義します。定義は任意です。定義していない場合は,仮定値が設定されます。options定義文のオペランドを,次に示します。

keep_gsp_mode~《nouse》
使用しているマシンの機種がH9000Vの場合に有効な定義です。
OSコンソールとGSPコマンドモードを一つのコンソール画面で共用する機能の場合,リセットパスのヘルスチェック実行後,コンソール画面で使用するモードを指定します。
  • use:リセットパスのヘルスチェック実行後,コンソール画面でGSPコマンドモードを使用します。
  • nouse:リセットパスのヘルスチェック実行後,コンソール画面でOSコンソールモードを使用します。