8.3.1 HAモニタの環境設定(sysdef)
HAモニタの環境を設定する定義ファイルは,HAモニタの環境設定用ディレクトリの下にsysdefというファイル名で作成します。
また,HAモニタのサンプルファイル用ディレクトリの下に,sysdefファイルのサンプルが用意されています。このファイルをHAモニタの環境設定用ディレクトリにコピーし,書き換えて使用すると,定義ファイルを最初から作成する手間が省けます。
なお,この定義ファイルは系ごとに作成します。太字部分は,系間で同じ値を指定してください。太字以外の部分は,系間で矛盾がないように設定してください。
HAモニタの環境設定をする定義ファイルを,次に示します。
/* HAモニタの環境設定 */ environment name 自系のホスト名 ,address 自系のホストアドレス ,patrol 系障害監視時間 ,lan TCP/IPのホスト名〔:TCP/IPのホスト名…〕 ,lanport TCP/IPのサービス名〔:TCP/IPのサービス名…〕 〔,fs_log_size {ファイルシステム切り替えログファイルのサイズ |65536}〕 〔,servmax {16|64}〕; 〔function 〔 cpudown {online|standby|system}{,|;}〕 〔 standbyreset {use|nouse}{,|;}〕 〔 pathpatrol 監視パスのヘルスチェック間隔{,|;}〕 〔 pathpatrol_retry {再チェック間隔|30}:{再チェック回数|5}{,|;}〕 〔 message_retry {リトライ間隔|3}{,|;}〕 〔 connect_retry {接続間隔|5}:{接続回数|200}{,|;}〕 〔 monbegin_restart {use|nouse}{,|;}〕 〔 netmask {byte|bit}{,|;}〕 〔 usrcommand ユーザコマンドの絶対パス名{,|;}〕 〔 resetpatrol {リセットパスのヘルスチェック間隔|2}{,|;}〕 〔 resetpath_retry {use|nouse}{,|;}〕 〔 resetpath_inter リセットパスの再チェック間隔{,|;}〕 〔 multistandby {use|nouse}{,|;}〕 〔 deviceoff_order {order|reverse}{,|;}〕 〔 reset_type {server|host}{,|;}〕 〔 jp1_event {use|nouse}{,|;}〕 〔 ph_log_size 監視履歴ファイルのサイズ{,|;}〕 〔 ph_threshold 系監視履歴取得時間{,|;}〕 〔 termcmd_at_abort {use|nouse}{,|;}〕 〔 disk_ptrl {use|nouse}{,|;}〕 〔 disk_ptrl_inter {システムディスクの監視間隔|120}{,|;}〕 〔 disk_ptrl_retry {システムディスクの監視のリトライ間隔|60}: {システムディスクの監視のリトライ回数|1}{,|;}〕 〔 disk_log_size {ディスクの監視のログサイズ|1048576}{,|;}〕 〔 suppress_reset 最少稼働ホスト数;〕〕 〔 exitcode {type1|type2}{,|;}〕 〔 fence_scsi {nouse|use}{,|;}〕 〔 scsi_check リザーブ状況監視間隔{,|;}〕 〔 scsi_pathcheck ディスクパス状況監視間隔{,|;}〕 〔 scsi_timeout SCSIコマンドタイムアウト時間{,|;}〕 〔 scsi_retry SCSIコマンド発行リトライ回数{,|;}〕 〔 notswitch_notify {use|nouse}{,|;}〕 〔options 〔 dfp {use|nouse};〕〕
(1) environment定義文
HAモニタの動作環境を定義します。environment定義文のオペランドを,次に示します。
(a) name
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
1〜32文字の英数字 |
-- (単位:--) |
不可 |
-- |
説明
HAモニタで複数の系を識別するために使用する名称です。
系ごとに固有となる任意の名称を指定します。
nameオペランドに指定した名称は,HAモニタのコマンド実行時にホスト名(host name)として表示されます。
(b) address
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
1〜8桁の符号なし整数 |
0〜99999999※ ※ただし,次の場合,数値の範囲は1〜9999です。
(単位:--) |
不可 |
-- |
説明
系をリセットする場合はCPUのリセット時に系を特定するために,共有ディスクのSCSIリザーブをする場合はリザーブした系を特定するために,自系のホストアドレスを任意の値で指定します。
ハードウェアへの設定はHAモニタがします。
監視パスまたはリセットパスでつながるすべての系で,それぞれ固有のアドレスを指定してください。なお,システム内に互いに監視し合わない系切り替え構成が複数あり,かつ,それらがリセットパスを共用する場合,すべての系でそれぞれ固有となるように指定してください。
- 重要
-
複数の系で同じアドレスを設定すると,HAモニタが誤動作するおそれがあります。もし誤って同じアドレスを設定してしまい,メッセージKAMN414-Eが出力された場合は,「7.5.11 addressオペランドの指定値の重複に対処する」を参照の上,対処してください。
リセットパスにHRAまたはハードウェアマネージメントコンソールを適用する構成では,ハードウェアの制約上,1〜9999の範囲で指定してください。
function定義文のmultistandbyオペランド,または,reset_typeオペランドにhostを指定した場合,ホストアドレスが小さい系ほどリセット優先度が高くなります。次の点を考慮してホストアドレスを決定してください。
-
実行系と待機系とで同時に系障害を検出したときに,実行系を優先させ,待機系をリセットしたい場合は,実行系よりも待機系のホストアドレスを大きくします。マルチスタンバイ構成での待機系では,サーバの環境設定のstandbypriオペランドの指定値が小さい系ほど,ホストアドレスが小さくなるようにします。
-
実行系と待機系とで同時に系障害を検出したときに,系切り替えを優先させ,実行系をリセットしたい場合は,実行系よりも待機系のホストアドレスを小さくします。マルチスタンバイ構成での待機系では,サーバの環境設定のstandbypriオペランドの指定値が大きい系ほど,ホストアドレスが小さくなるようにします。なお,実行系のスローダウンなどで,調査に有効なダンプを早急に取得したい場合は,この設定をお勧めします。
-
実行系と待機系が明確に分かれない,すべての系が実行系のような構成の場合は,業務の重要度やリソース量などから,系のリセット優先度を検討して,ホストアドレスを決めてください。
(c) patrol
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
5〜600 (単位:秒) |
不可 |
-- |
説明
系障害の判断基準となる,他系からのaliveメッセージを監視する時間(系障害監視時間)を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。patrolオペランドに指定した時間を超えても他系からaliveメッセージが送信されない場合,HAモニタは系障害と判断します。
(d) lan
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
1〜32文字のパス名 |
-- (単位:--) |
不可 |
-- |
説明
監視パスに使用するTCP/IP LANのホスト名を指定します。
系ごとに固有の名称にしてください。
lanオペランドに指定するホスト名は,/etc/hostsファイルに設定したホスト名と同じにしてください。/etc/hostsファイルについては,「6.5.1 ホスト名とサービス名の登録」を参照してください。
TCP/IP LANのホスト名は,":"で区切って指定します。3個まで指定できます。複線化した監視パスの中で優先して使用したいパスがある場合は,そのパスのホスト名の前に,"#"を付けて指定します。優先して使用したいパスは,一つだけ指定できます。次に指定の例を示します。
lan #path11:path12,
例で示す指定では,監視パスが"path11"と"path12"の2本に複線化され,"path11"の監視パスが優先して使用されます。なお,優先的に使用する監視パスが障害になった場合,aliveメッセージが系障害監視時間の7割の時間途絶したときに,すべての監視パスで通信が行われ,応答のあった正常な監視パスに交替します。
(e) lanport
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
1〜32文字の英数字 |
-- (単位:--) |
不可 |
-- |
説明
監視パスに使用するTCP/IP LANのサービス名を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
lanportオペランドに指定するサービス名は,/etc/servicesファイルに設定したサービス名と同じにしてください。/etc/servicesファイルについては,「6.5.1 ホスト名とサービス名の登録」を参照してください。
lanportオペランドでは,lanオペランドで指定したホスト名に対応するサービス名を,同じ位置の引数に指定します。サービス名の指定数はlanオペランドのホスト名の指定数と同じにしてください。次に指定の例を示します。
lan path11 :path12, ↓ ↓ lanport HAmon1 :HAmon2,
例の場合,lanオペランドの"path11"はlanportオペランドの"HAmon1"に,lanオペランドの"path12"はlanportオペランドの"HAmon2"に対応します。
(f) fs_log_size
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
0〜2147483647 (単位:バイト) |
可 |
65536 |
説明
ファイルシステム切り替え時のログファイルの最大サイズをバイト数で指定します。
系切り替え構成内のすべての系で同じ値を指定してください。ファイルサイズが最大を超えた場合,次のログ取得時点でファイルが自動的にバックアップされ,クリアされます。
(g) servmax
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
16|64 |
-- (単位:--) |
可 |
16 |
説明
一つの系で同時に稼働できるサーバの最大数を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。16または64以外の数値は指定できません。
-
16:同時に稼働できるサーバの最大数を16に設定します。
-
64:同時に稼働できるサーバの最大数を64に設定します。
(2) function定義文
HAモニタの動作オプションを定義します。定義は任意です。定義していない場合は,仮定値が設定されます。function定義文のオペランドを,次に示します。
(a) cpudown
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
online|standby|system |
-- (単位:--) |
可 |
online |
説明
実行系と待機系のどちらをリセット優先系にするかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。リセット優先系に指定すると,実行系と待機系とで同時に系障害を検出した場合に,リセット優先系に指定した系が優先的に相手の系をリセットします。
-
online:実行系をリセット優先系にします。
-
standby:待機系をリセット優先系にします。
-
system:リセット優先系を決めないで,系の同時リセットを防止します。相互系切り替え構成の場合で,系切替機構がTHE-HA-0043(03-15以降)のとき以外は,systemを指定しないでください。
また,次のようにオペランドを指定する場合,systemは指定できません。
-
reset_typeオペランドにhostを指定
-
multistandbyオペランドにuseを指定
-
standbyresetオペランドにuseを指定
-
(b) standbyreset
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
nouse |
説明
待機系の系障害を実行系が検出した場合に,待機系をリセットするかどうかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。1:1系切り替え構成以外では,useを指定しないでください。
-
use:待機系をリセットします。
-
nouse:待機系をリセットしません。
(c) pathpatrol
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜240 (単位:分) |
可 |
--※ |
注※ 指定を省略した場合は,監視パスのヘルスチェックを実施しません。
説明
監視パスのヘルスチェック間隔を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
このオペランドを指定すると,ヘルスチェックが実行され,複線化した監視パスの一部に障害が発生した場合に障害を早期に検知できます。指定を省略した場合は,監視パスのヘルスチェックを実施しません。必ず設定してください。
(d) pathpatrol_retry
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
再チェック間隔:符号なし整数 |
3〜600 (単位:秒) |
可 |
30 |
再チェック回数:符号なし整数 |
0〜20 (単位:回) |
可 |
5 |
説明
監視パスの障害検出時に,監視パスの状態を再チェックする間隔と回数を,":"で区切って指定します。
系切り替え構成内のすべての系で同じ値を指定してください。pathpatrolオペランドの指定を省略した場合は,監視パスの再チェックはしません。
-
再チェック間隔
監視パスの再チェックの間隔を指定します。
-
再チェック回数
監視パスの再チェックの回数を指定します。0を指定すると,監視パスの再チェックはしません。
再チェック間隔と再チェック回数には,それぞれの積がpathpatrolオペランドで指定した監視パスのヘルスチェック間隔を超えない値を指定してください。指定する値は,次に示す計算式で確認してください。
監視パスのヘルスチェック間隔×60 ≧ 再チェック間隔×(再チェック回数+1)+a
(凡例) a:30〜60秒
例えば,pathpatrolオペランドの指定が1分で再チェック間隔を5秒とした場合,再チェック回数が5以下だと計算式を満たします。
(e) message_retry
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
3〜600 (単位:秒) |
可 |
3 |
説明
監視パスを使用する問い合わせ応答メッセージの送信失敗時に,メッセージ送信をリトライする間隔を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
message_retryオペランドの指定を省略した場合は,HAモニタが3秒間隔でメッセージ送信をリトライします。
リトライは,送信が成功するまで続けます。系間の監視中(aliveメッセージの監視中)でない場合,HAモニタは,60秒を超えても問い合わせ応答メッセージの送信が成功しなければ系障害が発生したと判断します。なお,message_retryオペランドに60秒以上を指定した場合は,指定した時間までメッセージの受信を待ってから系障害と判断します。
問い合わせ応答メッセージのリトライについては,「(4) 問い合わせ応答メッセージのリトライ」を参照してください。
(f) connect_retry
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
接続間隔:符号なし整数 |
5〜60 (単位:秒) |
可 |
5 |
接続回数:符号なし整数 |
1〜9999 (単位:回) |
可 |
200 |
説明
HAモニタ間で接続処理をする間隔と回数を,":"で区切って指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
接続されているHAモニタが多い場合は,HAモニタ間が接続しなくなることがあるため,必ず指定してください。このオペランドはHAモニタの接続構成設定ファイルが作成されている場合に有効となります。
-
接続間隔
HAモニタ間での接続処理の間隔を指定します。間隔が短いとHAモニタの性能に影響し,長いとHAモニタ間の接続が遅れる場合があります。目安として,接続されているHAモニタの数が10以上の場合は,10秒以上を指定してください。
-
接続回数
HAモニタ間での接続処理のリトライ回数を指定します。9999を指定すると,すべてのHAモニタと接続するまで接続処理を繰り返します。
回数が少ないとHAモニタ間の接続ができない場合があり,多いとHAモニタの性能に影響します。したがって,通常はデフォルト値を指定しておき,HAモニタ間の接続ができないことがある場合だけ,回数を増やして指定してください。
なお,この回数を超えても接続できなかった場合は,メッセージKAMN176-Eを出力します。
(g) monbegin_restart
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
use |
説明
次の場合に,自動でモニタモードのサーバ起動コマンド(monbeginコマンド)を実行して,モニタモードのサーバを起動するかどうかを指定します。
-
系障害によって系切り替えしたあと,障害となった系のHAモニタが再起動した場合
-
待機サーバが稼働している系のHAモニタが再起動した場合
系切り替え構成内のすべての系で同じ値を指定してください。
-
use:モニタモードのサーバを自動で起動します。JP1などの運用管理ソフトウェアを使用して自動でサーバを起動しない場合は,useを指定することをお勧めします。
-
nouse:モニタモードのサーバを自動で起動しません。JP1などの運用管理を使用して自動でサーバを起動する場合は,nouseを指定してください。
(h) netmask
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
byte|bit |
-- (単位:--) |
可 |
byte |
説明
監視パスとして使用するLANインタフェースに設定したネットマスクを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。また,LANが同一ネットワーク番号で複数のサブネットとして構成されているネットワークでは,同じネットマスクを設定してください。ネットマスクの設定については,「5.4.2 必要なIPアドレスとポート番号」を参照してください。
netmaskオペランドの設定およびネットマスクの設定を誤ると,他系のHAモニタと通信ができないなど,HAモニタが誤動作します。
-
byte:ネットマスクが10進表現で255,0の値の場合にだけ指定します。次に例を示します。
255.255.0.0
-
bit:ネットマスクが10進表現で255,0以外の値がある場合に指定します。次に例を示します。
255.255.255.192
netmaskオペランドにbitを指定する場合,ネットマスクの設定では,次の制限があります。
IPアドレスとネットマスクの組み合わせによって認識されるネットワークアドレスの部分(ネットワーク番号の部分とサブネット番号の部分)は,各クラスで決められているネットワーク番号の部分をすべて含んでいる必要があります。例えば,クラスBのネットワークに対して"255.254.0.0"というネットマスクは設定できません。
ネットマスクの値は,OSのifconfigコマンドで確認できます。ネットマスクおよびifconfigコマンドの詳細については,OSのマニュアルを参照してください。
(i) usrcommand
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
1〜1000文字のパス名 |
-- (単位:--) |
可 |
-- |
説明
HAモニタに自動発行させるユーザコマンドの絶対パス名を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
ユーザコマンドの作成方法やコーディング例については,「6.12 ユーザコマンドの作成」を参照してください。
(j) resetpatrol
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜60 (単位:分) |
可 |
2 |
説明
リセットパスのヘルスチェック間隔を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
リセットパスのヘルスチェック間隔は,接続するHAモニタの数によって異なります。指定する値は,次の計算式を満たすようにしてください。
リセットパスのヘルスチェック間隔×60 > ホスト数×20
(k) resetpath_retry
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
use |
説明
リセットパスのヘルスチェックで異常を検知したあと,リセットパスの回復のためにリセットパスの状態を再チェックするかどうかを指定します。
系切り替え構成内のすべての系で同じ値を設定してください。この機能を使用すると,系切替機構の再起動などで一時的なリセットパス障害が発生した場合に,リセットパス障害から復旧後に自動的にリセットできる状態に回復できます。リセットパスが回復するとメッセージKAMN646-Iを出力します。
-
use:HAモニタが自動でリセットパスの状態を回復します。
-
nouse:HAモニタが自動でリセットパスの状態を回復しません。
(l) resetpath_inter
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
10〜1440 (単位:分) |
可 |
60 |
説明
リセットパスのヘルスチェックで異常を検知したあと,リセットパスの復旧のためにリセットパスの状態を再チェックする間隔を,10〜1440分の範囲で指定します。
このオペランドはresetpath_retryオペランドを省略するか,またはresetpath_retryオペランドにuseを指定した場合だけ有効です。resetpath_retryオペランドにnouseを指定した場合,このオペランドの指定は無視されます。
(m) multistandby
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
nouse |
説明
一つの実行サーバに対して複数の待機サーバを定義できる,マルチスタンバイ機能を使用するかどうかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。マルチスタンバイ機能の詳細については,「4.5 マルチスタンバイ機能を使用する場合のサーバと系の管理」を参照してください。
-
use:マルチスタンバイ機能を使用します。
-
nouse:マルチスタンバイ機能を使用しません。
(n) deviceoff_order
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
order|reverse |
-- (単位:--) |
可 |
order |
説明
共有リソースの切り離しをする順序を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。このオペランドの指定は,HAモニタに定義されているサーバすべてに適用されます。
また,サーバごとに共有リソースの切り離しをする順序を指定することもできます。サーバごとに指定する方法については,「8.4.1 サーバ対応の環境設定(servers)」を参照してください。また,共有リソースの切り離しをする順序の詳細については,「4.7.7 共有リソースの切り離しを接続時と逆順にする場合の処理の流れ」を参照してください。
-
order:接続時と同じ順番で共有リソースの切り離しをします。
-
reverse:接続時と逆の順番で共有リソースの切り離しをします。
(o) reset_type
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
server|host |
-- (単位:--) |
可 |
server |
説明
リセット発行系の決定方法を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。HAモニタの環境設定のmultistandbyオペランドにuseを指定した場合は,このオペランドの設定に関係なく,hostが仮定されます。
-
server:リセット発行系とリセット優先系の決定手順に従い,リセット発行系を決定します。
-
host:リセット発行系決定時のリセット優先系を,リセット優先度に基づいて決定します。リセット優先度は,HAモニタの環境設定のaddressオペランドに指定したホストアドレスが小さい系ほど,高くなります。
(p) jp1_event
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
nouse |
説明
JP1のイベント通知機能を使用するかどうかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。JP1のイベント通知機能を使用するには,システムに物理ホスト環境のJP1/Baseが必要です。
jp1_eventオペランドにuseを指定すると,HAモニタがJP1のイベントを発行します。jp1_eventオペランドを省略した場合,HAモニタではJP1のイベントを発行しません。
-
use:JP1のイベント通知機能を使用します。
-
nouse:JP1のイベント通知機能を使用しません。
(q) ph_log_size
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1024〜10485760 (単位:バイト) |
可 |
-- |
説明
サーバや系に発生したスローダウンの情報を監視履歴として記録する監視履歴ファイルのサイズを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
このオペランドを指定しておくと,HAモニタ起動時に指定したサイズで監視履歴ファイルが作成され,サーバや系の監視履歴を取得できます。監視履歴ファイル内の空白がなくなると監視履歴ファイルの内容はラップアラウンドされ,バックアップファイルに書き換えられます。監視履歴ファイルのサイズを見積もるための計算式を,次に示します。
監視履歴を取得するサーバや系の起動回数×180+監視履歴ファイルに記録させたいスローダウンの回数×90
(r) ph_threshold
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
5〜559 (単位:秒) |
可 |
--※ |
注※ このオペランドを省略した場合,系の監視履歴は取得しません。
説明
自系・他系に発生したスローダウンの情報を監視履歴として取得する場合に,aliveメッセージが途絶してから監視履歴を取得するまでの時間(系監視履歴取得時間)を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。系監視履歴取得時間は,HAモニタの環境設定のpatrolオペランドで指定した系障害監視時間よりも小さい値になるように指定する必要があります。
このオペランドを指定して系の監視履歴を取得する場合,必ずph_log_sizeオペランドも指定してください。
(s) termcmd_at_abort
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
nouse |
説明
サーバの起動コマンドの失敗によるサーバの起動中止,およびサーバ障害時に系切り替えまたは連動系切り替えをする場合に,サーバの停止コマンドであと処理ができるようにするかどうかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
-
use:サーバの停止コマンドによるあと処理をできるようにします。
サーバの起動コマンドの失敗によるサーバの起動中止の場合,およびサーバ障害時に系切り替えまたは連動系切り替えをする場合,サーバの停止コマンドを引数"-c"で実行します。
サーバの停止コマンドが引数"-c"で実行された場合にあと処理をするように,サーバの停止コマンドを作成してください。
-
nouse:サーバの停止コマンドによるあと処理はできません。
サーバの起動コマンドの失敗によるサーバの起動中止の場合,サーバの停止コマンドを実行しません。
サーバ障害時に系切り替えまたは連動系切り替えをする場合,サーバの停止コマンドを実行しますが,サーバの正常停止などと同様に引数"-w"または"-e"で実行します。
サーバの停止コマンドについては,「6.9.2 サーバの停止コマンドの作成」を参照してください。
(t) disk_ptrl
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
nouse |
説明
システムディスクを監視するかどうかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
-
use:システムディスクを監視します。
-
nouse:システムディスクを監視しません。
このオペランドにuseを指定した場合には,システムディスクの監視定義ファイルを設定してください。システムディスクの監視定義ファイルの設定については,「6.13.1 ディスクの監視に必要なファイルの設定」の「(1) システムディスクの監視に必要なファイルの設定」を参照してください。
また,必要に応じて,HAモニタの環境設定の次のオペランドを指定してください。
-
disk_ptrl_inter
-
disk_ptrl_retry
-
disk_log_size
(u) disk_ptrl_inter
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
3〜3600 (単位:秒) |
可 |
120 |
説明
システムディスクの監視間隔を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
このオペランドの指定値は,HAモニタの環境設定のdisk_ptrl_retryオペランドで指定する次の項目を考慮する必要があります。
-
システムディスクの監視のリトライ間隔
-
システムディスクの監視のリトライ回数
次に示す計算式を満たすように指定してください。
システムディスクの監視間隔 ≧ システムディスクの監視のリトライ間隔×(システムディスクの監視のリトライ回数+1)
(v) disk_ptrl_retry
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
システムディスクの監視のリトライ間隔:符号なし整数 |
1〜3600 (単位:秒) |
可 |
60 |
システムディスクの監視のリトライ回数:符号なし整数 |
0〜60 (単位:回) |
可 |
1 |
説明
システムディスクへのアクセスに失敗した場合に,システムディスクの監視のリトライ間隔と回数を,":"で区切って指定します。指定した回数を超えてシステムディスクへのアクセスに失敗した場合は,システムディスクの障害と判断します。
系切り替え構成内のすべての系で同じ値を指定してください。
-
システムディスクの監視のリトライ間隔
システムディスクの監視のリトライ間隔を指定します。リトライ間隔は,ディスクのI/Oタイムアウト以上の値を設定してください。ディスクのI/Oタイムアウトとは,ドライバの設定,OSのカーネルパラメタ,マルチパスソフトウェアの設定で決まる,アプリケーションがI/Oを要求してから応答が返ってくるまでの待ち時間です。
-
システムディスクの監視のリトライ回数
システムディスクの監視のリトライ回数を指定します。0を指定すると,システムディスクの監視をリトライしません。
(w) disk_log_size
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
65535〜10485760 (単位:バイト) |
可 |
1048576 |
説明
ディスクの監視について,ログファイルの最大サイズをバイト数で指定します。このオペランドは,次の両方のログファイルに適用されます。
-
システムディスクの監視
-
業務ディスクの監視
系切り替え構成内のすべての系で同じ値を指定してください。
通常,このオペランドの指定値を変更する必要はありません。
(x) suppress_reset
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜32 (単位:--) |
可 |
--※ |
注※ このオペランドを省略した場合は,系のリセットを抑止しません。
説明
系のリセットを抑止する場合に,リセットを抑止する基準となる最少稼働ホスト数を指定します。
最少稼働ホスト数は,システムを構成する系の総数の半数よりも大きい値(最少稼働ホスト数>システム全体の系の数/2)で,かつhostmaxオペランドの指定値以下の値を指定します。系切り替え構成内のすべての系で同じ値を指定してください。
系のリセットの抑止については,「3.3.4 マルチスタンバイ機能使用時の系のリセットの抑止」を参照してください。
(y) exitcode
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
type1|type2 |
-- (単位:--) |
可 |
type1 |
説明
HAモニタのコマンドが返すリターンコードを指定します。
-
type1:「9. コマンド」に記載されているリターンコードを返します。
-
type2:HAモニタの01-26以前のバージョンのリターンコードを返します。
(z) fence_scsi
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
nouse |
説明
ハイブリッドフェンシングを使用するかどうかを指定します。ハイブリッドフェンシングを使用する場合,系のリセットに失敗しても,共有ディスクのSCSIリザーブをして,系切り替えを続行します。
系切り替え構成内のすべての系で同じ値を指定してください。
-
use:ハイブリッドフェンシングを使用します。
-
nouse:ハイブリッドフェンシングを使用しません。
(aa) scsi_check
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜600 (単位:秒) |
可 |
5 |
説明
ハイブリッドフェンシングを使用する場合に,実行系からの共有ディスクのリザーブ状況を監視する間隔を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
fence_scsiオペランドを省略するか,またはnouseを指定した場合,このオペランドは無視されます。
(ab) scsi_pathcheck
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜60 (単位:分) |
可 |
1 |
説明
ハイブリッドフェンシングを使用する場合に,待機系からの共有ディスクパスの状況を監視する間隔を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
fence_scsiオペランドを省略するか,またはnouseを指定した場合,このオペランドは無視されます。
(ac) scsi_timeout
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜3600 (単位:秒) |
可 |
30 |
説明
ハイブリッドフェンシングを使用する場合に,物理デバイスに対して発行するSCSIコマンドの応答待ち時間を指定します。
コントローラとSCSIサブシステム間のタイムアウト値やブロックデバイスのタイムアウトの値など,OSの設定などでI/Oのタイムアウト値を設定する場合があります。この場合は,scsi_timeoutオペランドにはこの指定値よりも大きな値を指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
fence_scsiオペランドを省略するか,またはnouseを指定した場合,このオペランドは無視されます。
(ad) scsi_retry
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
符号なし整数 |
1〜60 (単位:回) |
可 |
2 |
説明
ハイブリッドフェンシングを使用する場合に,物理デバイスに対して発行するSCSIコマンドが失敗,またはタイムアウトしたときに,SCSIコマンドをリトライする回数を指定します。
このオペランドを省略した場合は,2回が仮定されます。最初にSCSIコマンドを実行し,そのあとに2回リトライするため,合計3回SCSIコマンドを実行することになります。
系切り替え構成内のすべての系で同じ値を指定してください。
fence_scsiオペランドを省略するか,またはnouseを指定した場合,このオペランドは無視されます。
(ae) notswitch_notify
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
use |
説明
系切り替えができない状態の場合に,1時間おきに繰り返し警告メッセージを出力して通知するかどうかを指定します。
-
use:繰り返し警告メッセージを出力して通知します。
-
nouse:通知しません。
このオペランドにuseを指定すると,系切り替えができない状態を事前に認識できます。
警告メッセージを出力する系切り替えができない状態と警告メッセージのIDを次の表に示します。
警告メッセージを出力する系切り替えができない状態 |
警告メッセージのID |
---|---|
実行サーバが起動完了しているが,系切り替えできる状態になっていない場合 |
KAMN288-W |
系の稼働数が最少稼働ホスト数以下である場合※ |
KAMN447-W |
サーバの監視が一時停止中の場合 |
KAMN521-W |
システムディスクの監視が一時停止中の場合 |
KAMN540-W |
リセットパスのヘルスチェックで異常を検知している場合 |
KAMN644-W |
ハイブリッドフェンシング使用時,待機系からの共有ディスクのパスの状況のチェックで,ディスクパスの異常を検知している場合 |
KAMN729-W |
- 注※
-
サーバを起動していないHAモニタも含みます。
(3) options定義文
HAモニタの動作オプションを定義します。定義は任意です。定義していない場合は,仮定値が設定されます。options定義文のオペランドを,次に示します。
(a) dfp
ユーザ指定値
値の種別 |
数値の範囲 |
値の省略 |
指定を省略したときの仮定値 |
---|---|---|---|
use|nouse |
-- (単位:--) |
可 |
use |
説明
他系のOSパニック検知機能を使用するかどうかを指定します。
系切り替え構成内のすべての系で同じ値を指定してください。
-
use:他系のOSパニック検知機能を使用します。
-
nouse:他系のOSパニック検知機能を使用しません。
他系のOSパニック検知機能については,「3.3.6 他系のOSパニック検知」を参照してください。