9.2.17 システム監視に関するオペランド
- ◆ pd_utl_exec_time = ユティリティの実行監視時間
-
〜<符号なし整数>((0〜35791394))(単位:分)
次に示すユティリティの実行時間を監視する場合,その監視時間を分単位で指定します。
-
データベース作成ユティリティ(pdloadコマンド)
-
データベース再編成ユティリティ(pdrorgコマンド)
-
空きページ解放ユティリティ(pdreclaimコマンド)
-
グローバルバッファ常駐化ユティリティ(pdpgbfonコマンド)
このオペランドで指定した監視時間を超えてもユティリティが終了しない場合,実行中のユティリティを強制終了して,無応答原因の調査用に次に示す障害情報を出力します。
取得する障害情報
出力先
-
コアファイル
-
.debファイル
ユティリティが動作したサーバマシンの%PDDIR%\spool\save下に出力されます。
-
pdls -d rpc -aコマンドの実行結果
-
pdls -d lckコマンドの実行結果
ユティリティのコマンドを入力したサーバマシンの,pd_tmp_directoryオペランドで指定したディレクトリ下に出力されます。pd_tmp_directoryオペランドの指定を省略した場合は,システム環境変数のTMPに指定したディレクトリ下に出力されます。システム環境変数のTMPの指定も省略した場合は,%PDDIR%\tmp下に出力されます。
ただし,HiRDB管理者がコマンドを実行した場合は,%PDDIR%\spool\save下にも出力されます。ファイル名称は次のとおりです。
コマンド名YYYYMMDDHHMMSSpid.txt
-
pidはプロセスIDです。
-
pdreclaimコマンド又はpdpgbfonコマンドを実行した場合,内部的にHiRDBがpdrorgコマンドを実行するため,ファイル名に付けられるコマンド名がpdrorgになります。
- 《利点》
-
夜間バッチジョブなどでユティリティ実行中に何らかの障害(通信障害又はディスク障害など)が発生し,ユティリティが無応答状態になっても,後続のジョブの停滞を防止できます。
- 《指定値の目安》
-
-
このオペランドは無応答障害の対処を目的とし,長大トランザクションの監視を目的としていません。したがって,このオペランドの指定値にはユティリティ実行時間の実績値の最大値に余裕を持たせた値を指定してください。例えば,データベース作成ユティリティの最大実行時間が60分程度で,データベース再編成ユティリティの最大実行時間が90分程度の場合,pd_utl_exec_time=120と余裕を持った値を指定してください。これは,通常90分で終了する処理が30分過ぎても応答が返ってこないのは無応答障害のおそれがあると判断しています。
-
ユティリティの実行時間を監視しない場合,次に示すような障害が発生するとユティリティが無応答状態になることがあります。したがって,0以外の値を指定してください。
・サーバ間の通信障害(一時的な障害を含む)
・ディスク障害などによるプロセスの沈み込み
-
- 《オペランドの規則》
-
-
このオペランドを省略すると,システム共通定義のpd_cmd_exec_timeオペランドの指定値が有効になります。pd_cmd_exec_timeオペランドも省略すると0が仮定されます。
-
このオペランドに0を指定した場合は,ユティリティの実行時間を監視しません。
-
各ユティリティのoption制御文のexectimeオペランドに監視時間を指定した場合は,exectimeオペランドの指定が優先されます。
-
- 《ほかのオペランドとの関連》
-
-
このオペランドはpd_cmd_exec_timeオペランドと関連があります。
-
-
- ◆ pd_cmd_exec_time = 運用コマンド及びユティリティの実行監視時間
-
〜<符号なし整数>((0〜3600))《0》(単位:分)
通信障害又はCPU利用率の高騰や,ディスク入出力の無反応となったときに,運用コマンドやユティリティが無応答状態になることがあります。無制限に無応答となってしまうことを避けるために,このオペランドを指定します。
このオペランドによって実行時間を監視できる運用コマンド及びユティリティを次の表に示します。このオペランドは,システム共通定義のpd_utl_exec_timeオペランドよりも多くの運用コマンド及びユティリティを対象としています。実行時間を監視する場合,監視の開始時と終了時に,次の表に示すメッセージを出力します。また,監視開始メッセージ出力後から監視時間が経過しても運用コマンド又はユティリティが終了しない場合は,タイムアウト検知メッセージを出力後,実行中の運用コマンド又はユティリティを強制終了します。
表9‒3 pd_cmd_exec_timeオペランドの対象となる運用コマンド及びユティリティ 項番
運用コマンド,ユティリティ名
監視開始メッセージ
監視終了メッセージ
タイムアウト検知メッセージ
タイムアウト検知アボートコード
1
pdacunlck
KFPD00041-I
KFPD00042-I
KFPD00043-E
Pd00009
2
pdbufls
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
3
pdbufmod
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
4
pdclose
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
5
pdcopy
KFPR26092-I
KFPR26093-I
KFPR26091-E
Pra0001
6
pddbfrz
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
7
pddbls
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
8
pddbst
KFPK10452-I
KFPK10453-I
KFPK10021-E
Pu02004
9
pdexp
KFPX28414-I
KFPX28415-I
KFPX28416-E
Pu02004
10
pdgetcst
KFPN00500-I
KFPN00501-I
KFPN00502-E
Pu02004
11
pdhold
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
12
pdlistls
KFPD00041-I
KFPD00042-I
KFPD00043-E
Pd00009
13
pdload
KFPL00901-I
KFPL00902-I
KFPL24511-E
Pu02004
14
pdmemdb
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
15
pdmod
KFPS05629-I
KFPS05630-I
KFPS05631-E
Pscm271
16
pdopen
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
17
pdparaload
KFPL00901-I
KFPL00902-I
KFPL24511-E
Pu02004
18
pdpgbfon
KFPL00901-I
KFPL00902-I
KFPL24511-E
Pu02004
19
pdrbal
KFPL00901-I
KFPL00902-I
KFPL24512-E
Pu02004
20
pdreclaim
KFPL00901-I
KFPL00902-I
KFPL24511-E
Pu02004
21
pdrels
KFPH27067-I
KFPH27068-I
KFPH27069-E
Phu0009
22
pdrorg
KFPL00901-I
KFPL00902-I
KFPL24511-E
Pu02004
23
pdrstr
KFPR26292-I
KFPR26293-I
KFPR26291-E
Pra0001
24
pdchpathn
KFPD00041-I
KFPD00042-I
KFPD00043-E
Pd00009
このオペランドに指定した時間以内に運用コマンド又はユティリティの処理が終了しなかった場合は,タイムアウト発生を示すメッセージを出力し,次の障害情報を取得後に強制終了します。
項番
取得情報
出力先
1
ダンプファイル
ユティリティが使用したプロセスがあるサーバの%PDDIR%\spool\save下に出力されます。
2
.debファイル
- 《オペランドの規則》
-
-
このオペランドを省略,又は0を指定した場合は,運用コマンド及びユティリティの実行時間を監視しません。
-
次に示すユティリティのoption制御文のexectimeオペランドに監視時間を指定した場合は,exectimeオペランドの指定が優先されます。また,exectimeオペランドを省略して,かつシステム共通定義のpd_utl_exec_timeオペランドに監視時間を指定した場合は,pd_utl_exec_timeオペランドの指定が優先されます。
・データベース作成ユティリティ(pdloadコマンド)
・データベース再編成ユティリティ(pdrorgコマンド)
・空きページ解放ユティリティ(pdreclaimコマンド)
・グローバルバッファ常駐化ユティリティ(pdpgbfonコマンド)
運用コマンド及び上記以外のユティリティの-Wオプションに監視時間を指定した場合は,-Wオプションの指定が優先されます。
-
- 《指定値の目安》
-
このオペランドは,運用コマンド及びユティリティが長時間無応答となることを防ぐために指定するものです。したがって,運用上許容できる運用コマンド又はユティリティの実行時間を指定してください。
(例1)
このオペランドで監視できる運用コマンド及びユティリティの中で最大実行時間が90分程度であれば,「通常90分で終了する処理が更に30分過ぎても応答が返ってこないのは無応答障害である。」と判断して,pd_cmd_exec_timeに120と余裕を持った値を指定してください。
(例2)
複数の運用コマンド及びユティリティで構成する夜間バッチジョブ全体に許容できる実行時間が5時間である場合を例にして説明します。全体方針で,各コマンドを実行するのに許容できる時間が30分である場合,pd_cmd_exec_timeに30を指定します。個別のコマンドで,許容できる実行時間が全体方針と異なる時間で監視したい場合は,コマンドごとの実行監視時間を指定するオプションを使用し,個別に指定する必要があります。例を次の図に示します。
図9‒1 複数の運用コマンド及びユティリティを実行する場合の例 この場合は,pdholdとpdrelsの4コマンドの実行許容時間が30分のため,pd_cmd_exec_timeに30を指定します。pdcopyは,2時間50分まで許容できるため,pdcopyの実行監視時間を指定するオプションに170を指定します。また,pddblsは,10分までしか許容できないため,pddblsコマンドの実行監視時間を指定するオプションに10を指定します。このように監視値(30+170+10+30=240=4時間)を設定することで,全体で許容できる実行時間の5時間に対し,1時間余裕を持って実行時間を監視します。
- 《注意事項》
-
コマンドの監視開始メッセージ出力前,又はコマンドの監視終了メッセージ出力後に,障害によって無応答となった場合,コマンドは自動で終了しないため,コマンドプロセスを手動でキャンセルしてください。
- 《ほかのオペランドとの関連》
-
このオペランドはpd_utl_exec_timeオペランドと関連があります。
- ◆ pd_queue_watch_time = メッセージキュー監視時間
-
〜<符号なし整数>(( 0〜3600))《600》(単位:秒)
このオペランドは,HiRDBのサーバプロセスの沈み込みを防止することを目的としています。サーバプロセスの沈み込みについては,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
- 参考
-
HiRDBサーバプロセス数は次に示すオペランドで制限されています。
-
pd_max_server_process
ユニット内で稼働するサーバ数が多い場合は,このオペランドの指定値を詳細に見積もってください。また,スタンバイレス型系切り替え機能を使用する場合は,系切り替えが発生したときを想定した見積もりが必要になります。
-
pd_max_bes_process
マルチフロントエンドサーバ,又は1:1スタンバイレス型系切り替え機能を使用する場合は,このオペランドの指定値を詳細に見積もってください。
-
pd_max_dic_process
マルチフロントエンドサーバを使用する場合は,このオペランドの指定値を詳細に見積もってください。
-
pd_ha_max_server_process
影響分散スタンバイレス型系切り替え機能を使用する場合は,このオペランドの指定値を詳細に見積もってください。
-
pd_max_users
同時接続数が多い場合は,適切な値を指定する必要があります。
-
HiRDBでは,サーバプロセスの割り当て処理でメッセージキューを使用しています。サーバプロセスの沈み込みが発生すると,メッセージキューからメッセージを取り出せなくなります。メッセージキュー中のメッセージが,このオペランドに指定した時間(メッセージキュー監視時間)を過ぎても取り出されない場合,警告メッセージ又はエラーメッセージ(KFPS00888-W又はKFPS00889-E)を出力します。この機能をメッセージキュー監視機能といいます。このメッセージが出力されると,サーバプロセスが沈み込んでいるおそれがあります。
なお,このオペランドに0を指定した場合はメッセージキューを監視しません。
メッセージキュー監視機能については,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
- 《オペランドの規則》
-
メッセージキューの監視は10秒単位で行われるため,このオペランドには10秒単位の時間(100秒,110秒など)を指定してください。10秒単位で指定しない場合,下一けたを切り上げます。例えば,105秒と指定した場合,110秒が仮定されます。
- 《ほかのオペランドとの関連》
-
このオペランドはpd_queue_watch_timeover_actionオペランドと関連があります。
- ◆ pd_queue_watch_timeover_action = continue|stop
-
メッセージキュー監視時間を超えても,メッセージキュー中のメッセージが取り出されない場合のHiRDBの処理を指定します。
- continue:
-
警告メッセージ(KFPS00888-W)を出力します。
- stop:
-
警告メッセージ及びエラーメッセージ(KFPS00888-W及びKFPS00889-E)を出力して,該当するメッセージキューがあるユニットは異常終了します。
- 《指定値の目安》
-
-
通常はstopを指定します(又はこのオペランドを指定しません)。メッセージキュー監視時間を超えても,メッセージキュー中のメッセージが取り出されない場合,HiRDBのサーバプロセスが沈み込んでいるおそれがあります。サーバプロセスの沈み込みが発生したユニットを再開始すると,サーバプロセスの沈み込みを解決できることがあります。
-
HiRDBを停止したくない場合はcontinueを指定します。この場合,サーバプロセスの沈み込みが発生したサーバではトランザクションを実行できません。それ以外のサーバではトランザクションを実行できます。サーバプロセスの沈み込みを解決するには,サーバプロセスの沈み込みが発生したサーバで実行中のトランザクションをpdcancelコマンドなどで終了させてください。その後,サーバプロセスの沈み込み要因を特定して対策してください。また,トランザクションが発生していない場合には,サーバプロセスの沈み込みが発生したサーバをpdkillコマンドなどで終了させた後,沈み込み要因を特定して対策してください。サーバプロセスの沈み込み要因及び対策については,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
-
- ◆ pd_cmd_process_conwaittime = 運用コマンド・ユティリティ実行におけるプロセス割り当て監視時間
-
〜<符号なし整数>((0,16〜4000))《60》(単位:秒)
運用コマンド及びユティリティ実行時に,プロセスを割り当てるまでの監視時間を指定します。
このオペランドに0を指定した場合,プロセスを割り当てるまでの時間を監視しません。
1〜15を指定した場合,プロセスを割り当てるまでの監視時間を16秒とします。
- 《指定値の目安》
-
通常,このオペランドを指定する必要はありません。
このオペランドは,サーバプロセスの割り当て処理でメッセージキューからメッセージを取り出すサーバプロセス数が不足したことによってKFPS00358-Eメッセージが出力され,運用コマンド又はユティリティが異常終了した場合,KFPS00358-Eメッセージの対策に従って指定してください。
- 《注意事項》
-
監視時間内にプロセスの割り当てが完了しない場合,KFPS00358-Eメッセージを出力し,運用コマンド又はユティリティが異常終了します。
- 《備考》
-
運用コマンド及びユティリティは,ユーザサーバプロセス,ユティリティサーバプロセスを割り当ててから,処理を実行します。このオペランドは,ユーザサーバプロセス,ユティリティサーバプロセスを割り当てるまでの時間を監視します。
このオペランドの監視対象を次の図に示します。
図9‒2 このオペランドの監視対象 また,適用する運用コマンド及びユティリティを次の表に示します。
表9‒4 この機能を適用する運用コマンド及びユティリティ 項番
運用コマンド及びユティリティ
1
pdacunlck(連続認証失敗アカウントロック状態の解除)
2
pdclose(RDエリアのクローズ)
3
pdconstck(整合性チェックユティリティ)
4
pdcopy(データベース複写ユティリティ)
5
pddbfrz(ユーザLOB用RDエリアの満杯HiRDBファイルの更新凍結)
6
pddbls(RDエリアの状態表示)
7
pddbst(データベース状態解析ユティリティ)
8
pddefrev(定義系SQLの生成)
9
pdexp(ディクショナリ搬出入ユティリティ)
10
pdbufls(グローバルバッファ情報の表示)
11
pdbufmod(グローバルバッファの動的変更)
12
pdgetcst(最適化情報収集ユティリティ)
13
pdhold(RDエリアの閉塞)
14
pdinit(データベース初期設定ユティリティ)
15
pdload(データベース作成ユティリティ)
16
pdmod(データベース構成変更ユティリティ)
17
pdopen(RDエリアのオープン)
18
pdparaload(パラレルローディング)
19
pdrbal(リバランスユティリティ)
20
pdrels(RDエリアの閉塞解除)
21
pdrorg(データベース再編成ユティリティ)
22
pdreclaim(空きページ解放ユティリティ)
23
pdpgbfon(グローバルバッファ常駐化ユティリティ)
24
pdrstr(データベース回復ユティリティ)
25
pdvrup(HiRDBバージョンアップ)
26
pdlistls(リスト定義情報の表示)
27
pdmemdb(インメモリデータ処理に関するコマンド)
28
pdreginit(レジストリ機能初期設定ユティリティ)
29
pdchpathn(ファイルパス変更オンラインコマンド)
- ◆ pd_down_watch_proc = サーバプロセスの異常終了回数の上限値〔,監視間隔〕
-
このオペランドは,HiRDBのサーバプロセスの異常終了回数を監視するオペランドです。PDCWAITTIMEオーバ,又はアボートによって異常終了するプロセスを監視対象とします。
サーバプロセスの異常終了が多発すると,新たなサービスを受け付けられないことがあります。しかし,サーバプロセスの異常終了ではHiRDBは異常終了しないため,実質オンライン停止状態になります。このオペランドを指定すると,HiRDBの再開始によってこの状態を抜け出せます。
- サーバプロセスの異常終了回数の上限値:〜<符号なし整数>((0〜65535))《0》
-
サーバプロセスの異常終了回数がこのオペランドに指定した値を超えた場合,HiRDB(HiRDB/パラレルサーバの場合は該当するユニット)を異常終了させます。これをプロセスの異常終了回数監視機能といいます。プロセスの異常終了回数監視機能については,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
HiRDB/シングルサーバの場合は,シングルサーバプロセスの異常終了回数がカウントされます。HiRDB/パラレルサーバの場合は,ユニット内のフロントエンドサーバ,バックエンドサーバ,及びディクショナリサーバプロセスの異常終了回数の合計値がカウントされます。
なお,0を指定すると,サーバプロセスの異常終了回数を監視しません。
- 監視間隔:〜<符号なし整数>((10〜3600))《600》(単位:秒)
-
サーバプロセスの異常終了回数を監視する時間を秒単位で指定します。
例えば,100を指定すると,100秒間隔でサーバプロセスの異常終了回数を監視します。
- 《利点》
-
-
HiRDBの再開始によってメモリ及びリソース状態がリフレッシュされて処理効率が向上します。
-
サーバプロセスの異常終了が多発した場合,HiRDBが異常終了するため,すぐに系を切り替えられます。
-
- 《注意事項》
-
-
異常終了が許されないシステムの場合は,このオペランドを適用しないでください。
-
サーバプロセスが異常終了すると,KFPS01820-Eメッセージが出力されます。pdcancelコマンドでサーバプロセスが異常終了したときにもKFPS01820-Eメッセージが出力されますが,これは異常終了回数のカウントに含まれません。
-
相互系切り替え構成の場合,系が切り替わると同一サーバマシンで複数のHiRDBを稼働するため,逆にトラフィックが上昇して効果が得られないことがあります。このオペランドを指定する場合は,異常終了した系でHiRDBを再開始する運用をお勧めします。
-
HiRDBサーバプロセスが異常終了を繰り返すと,トラブルシュート情報が大量に出力されるため,HiRDB運用ディレクトリへの入出力が多くなったり,ディスク容量が満杯になったりすることがあります。
-
- 《備考》
-
-
プロセスの異常終了回数監視機能によってHiRDBが異常終了する場合,KFPS01821-E及びKFPS00729-Eメッセージを出力します。
-
サーバプロセスが異常終了する要因と異常終了回数のカウント対象を次に示します。
サーバプロセスが
異常終了する要因
異常終了回数のカウント対象
シングルサーバプロセス
フロントエンドサーバプロセス
ディクショナリサーバプロセス
バックエンドサーバプロセス
クライアント環境定義のPDCWAITTIMEオペランドの値を超えた
○
○
×※1
×※1
pdcancelコマンド
×
×※2
×
×
内部強制終了(HiRDBが内部的にSIGKILLを発行してプロセスを終了させる場合)
○※3
○※3
×※1
×※1
アボート
○
○
○
○
OLTPシステムのトランザクション回復処理によるサーバプロセスの異常終了
○
○
×
×
上記以外のプロセス異常終了
○
○
○
○
-
- (凡例)
-
○:プロセスの異常終了回数にカウントされます。
×:プロセスの異常終了回数にカウントされません。
- 注※1
-
トランザクションブランチが発生した状態で障害を検知した場合,同一トランザクションブランチから発生したフロントエンドサーバプロセスの異常終了がカウントの対象になります。
- 注※2
-
pdcancelコマンドでバックエンドサーバプロセス又はディクショナリサーバプロセスを強制終了すると,フロントエンドサーバプロセスを内部的に強制終了します。この場合,フロントエンドサーバプロセスの異常終了がカウントされることがあります。
- 注※3
-
OLTPシステムによるグローバルトランザクションが発生した状態で障害を検知した場合,同一グローバルトランザクションから発生したシングルサーバプロセス又はフロントエンドサーバプロセスの異常終了がカウントの対象になります。
- ◆ pd_host_watch_interval = ホスト間監視時間間隔
-
〜<符号なし整数>((1〜180))《10》(単位:秒)
ほかのホスト(サーバマシン)の稼働状態を監視するために,問い合わせをする時間間隔を秒単位で指定します。
- 《指定値の目安》
-
通常,このオペランドは省略してください。
- 《注意事項》
-
-
このオペランドは,HiRDB/シングルサーバの場合,及びHiRDB/パラレルサーバでも1ユニットの場合は,無効になります。
-
この値が大き過ぎると,ほかのホストの異常を検出しにくくなります。
-
この値が小さ過ぎると,ユニット数の多いシステムの場合,稼働状態を監視するための通信が多量に発生するため,ネットワークに負荷を与えます。
-
- 《ほかのオペランドとの関連》
-
このオペランドはpd_ipc_conn_nblock_timeオペランドと関連があります。
- ◆ pd_watch_pc_client_time = クライアントからの要求間隔監視時間
-
〜<符号なし整数>((0〜65535))《3600》(単位:秒)
Windows版のHiRDBクライアントからの要求に対する応答をHiRDBサーバが返してから,次にHiRDBクライアントからの要求があるまでの最大待ち時間(サーバ側の最大待ち時間)を秒単位で指定します。
指定した時間内にHiRDBクライアントから全く要求がない場合には,クライアントに異常が発生したものとして,強制的にサーバとクライアントとの接続を切り離します。この時にHiRDBクライアントに対しては,接続の切り離しについての通知はしません。
時間監視の対象となるのは,CONNECTからDISCONNECTまでの間で,非トランザクション状態(SQLの実行を開始してからCOMMIT又はROLLBACKまでの間以外)の間です。
- 《注意事項》
-
-
0を指定した場合には,HiRDBクライアントからの次の要求を無限に待ち続けます。
-
このオペランドの指定値を小さい値(1〜600程度)にした場合には,HiRDBクライアントが,SQL実行時にサーバダウンを検知するなど,不当に異常終了することがあります。
-
UNIX版のHiRDBクライアント(Linux版のHiRDBクライアントも含む)の場合は,このオペランドの指定に関係なく時間を監視しません。UNIX版のHiRDBクライアントに対して時間監視をする場合は,HiRDBクライアントのクライアント環境定義PDSWATCHTIMEを指定してください。
-
- 《クライアント環境定義との関連》
-
このオペランドの値はクライアントごとに変更できます。クライアントごとに変更する場合は,クライアント環境定義のPDSWATCHTIMEオペランドを指定してください。
PDSWATCHTIMEオペランドについては,マニュアル「HiRDB Version 9 UAP開発ガイド」を参照してください。
- ◆ pd_spd_syncpoint_skip_limit = シンクポイントダンプ有効化処理のスキップ回数上限値
-
〜<符号なし整数>((0,2〜100000))
UAPの無限ループなどが発生すると,シンクポイントダンプの有効化処理ができずにスキップされることがあります。シンクポイントダンプの有効化処理が連続してスキップされると,上書きできない状態のシステムログファイルが増えます。このため,システムログファイルの容量不足などが発生し,ユニットが異常終了する場合があります。
また,上書きできない状態のシステムログファイルが,全システムログファイルの半分以上になったときにHiRDBが異常終了,又は強制終了すると,HiRDBを再開始するときのロールバック処理でシステムログファイルが不足します。この場合,システムログファイルを新規追加しないと,HiRDBを再開始できません。そして,この再開始処理に要する時間も長くなります。
このオペランドでは,シンクポイントダンプの有効化処理がスキップされる回数(1トランザクション中のスキップ回数)の上限値を指定します。シンクポイントダンプの有効化処理がスキップされた回数がこのオペランドで指定した値に達すると,対象トランザクションを強制的に中断してロールバックをします。これをシンクポイントダンプ有効化のスキップ回数監視機能といいます。
シンクポイントダンプ有効化のスキップ回数監視機能については,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
- 《利点》
-
このオペランドを指定すると,UAPの無限ループなどを防止できます。
- 《指定値の目安》
-
-
シンクポイントダンプ有効化のスキップ回数監視機能を使用する場合は,0を指定してください。この機能を使用しない場合は,pd_spd_syncpoint_skip_limitオペランドを省略してください。
-
0を指定すると,スキップ回数の上限値をHiRDBが計算します。0を指定して不都合が発生した場合,又はKFPS02101-Iメッセージが出力された場合に,このオペランドの値を変更してください。そのときの指定値の目安については,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
-
指定値が大き過ぎると,すべてのシステムログファイルが上書きできない状態になる可能性があります。この場合,HiRDBが異常終了します。
-
指定値が小さ過ぎると,強制的にロールバックされるトランザクションが増える可能性があります。
-
pd_log_sdintervalの指定値と,実行時間又はログ出力量が最大のトランザクション実行時のシンクポイント取得回数を考慮して指定してください。
-
- 《オペランドの省略値》
-
このオペランドを省略すると,シンクポイントダンプ有効化のスキップ回数監視機能を使用しません。
- 《注意事項》
-
-
このオペランドを指定すると,ログレスモードで実行しているUAPも監視対象になります。ログレスモードで実行しているUAPの処理が中断すると,データベースを自動回復できないためRDエリアを障害閉塞します。このため,上限値の設定に際しては,ログレスモードで実行するUAPのトランザクション処理中に,該当するサーバ内のほかのトランザクションから出力されるシステムログ量も考慮に入れてください。
-
高い負荷が掛かってトランザクションが遅延した場合,遅延したトランザクションが完了するまでシンクポイントダンプを有効化できないため,スキップ回数が増えます。
-
スキップ回数が上限値を超えると,トランザクション実行中のプロセスは強制終了されます。このとき,強制終了後にも,そのトランザクションで出力されたログと同等のロールバックログが出力されます。
-
pdload,pdmod,pdrorg,pdexp,pddbst,pdgetcst,pdrbal,pdvrup,pdmemdb,pdextfunc,pdconstck,pdreclaim,pdpgbfon,pdparaload,pddefrev,及びプラグインが提供するコマンドはこの機能の監視対象外になります。
-
- ◆ pd_dfw_syncpoint_skip_limit = デファードライト処理によるシンクポイントダンプ取得遅延に伴うシンクポイントダンプ有効化処理のスキップ回数上限値
-
〜<符号なし整数>((0〜100000))《0》
シンクポイントダンプの取得間隔内でデファードライト処理が終了する前にシンクポイントになると,シンクポイントダンプの有効化処理ができずにスキップされます。これは,デファードライト処理によってシンクポイントダンプの取得が遅れることで,シンクポイントで出力される更新バッファ数がシンクポイントダンプの取得間隔内で出力できる更新バッファ数を超えるためです。
シンクポイントダンプの有効化処理が連続してスキップされると,上書きできない状態のシステムログファイルが増えます。このため,システムログファイルの容量不足などが発生し,ユニットが異常終了する場合があります。
このオペランドでは,デファードライト処理によってシンクポイントダンプの取得が遅れた場合に,シンクポイントダンプの有効化処理がスキップされる回数(1トランザクション中のスキップ回数)の上限値を指定します。
デファードライト処理によってシンクポイントダンプの有効化処理がスキップされた回数がこのオペランドで指定した値に達すると,シンクポイントダンプの取得間隔内でシンクポイントダンプの取得が完了するように,HiRDBが更新バッファ数の上限値を決定します。そして,更新バッファ数が上限値を超えた時点で最も古い更新バッファを出力して,シンクポイント時の更新バッファ総量を制限します。これを更新バッファ量抑制機能といいます。
- 《利点》
-
シンクポイントダンプの取得間隔内でデファードライト処理が終了する前にシンクポイントになることで発生する,ユニット異常終了を回避できます。
- 《指定値の目安》
-
通常はこのオペランドを省略してください。更新処理のスループットを低下させてでも,シンクポイントダンプの取得間隔内でデファードライト処理が終了する前にシンクポイントになることで発生するユニット異常終了を回避したい場合に,1を指定します。
許容できるシンクポイントダンプの有効化処理のスキップ回数がログ容量などから分かる場合は,その回数を指定します。
- 《オペランドの規則》
-
このオペランドに0を指定すると,更新バッファ量抑制機能を使用しません。
- 《注意事項》
-
更新バッファ量抑制機能の有効期間について,注意事項を次に示します。なお,更新バッファ量抑制機能の有効期間とは,KFPH23035-Iメッセージが出力されてからKFPH23036-Iメッセージが出力されるまでの間です。
-
更新バッファ数が,HiRDBが決定した更新バッファの上限値を超えている場合,更新処理の実行後に更新バッファを出力するため,更新処理のスループットが低下します。HiRDBが決定する更新バッファの上限値は,次の計算式で求められます。
(シンクポイントインターバル時間÷WRITE単価※) ×(1−(前回のシンクポイントからプレシンクまでのログ出力量÷シンクポイント間のログ出力量) ×(バッファプールのバッファ面数÷シンクポイントで更新があったバッファプールの総バッファ面数)
注※ WRITE単価についての詳細は,マニュアル「HiRDB Version 9 システム運用ガイド」を参照してください。
-
pd_dbbuff_rate_updpageオペランド,又はpdbuffer -yオペランドによってデファードライトトリガのトリガ契機を指定している場合,それぞれの指定値が,HiRDBが決定した更新バッファの上限値より大きくなると,HiRDBが決定した更新バッファの上限値をデファードライトトリガのトリガ契機となる更新バッファ数に変更します。
また,pdbuffer -wオペランドの値は,各バッファの更新バッファ上限値まで出力されるように自動調整されます。
-
シンクポイントダンプの有効化処理がスキップした場合,シンクポイント時の更新バッファ出力処理中に検知されます。そのため,更新バッファ量抑制機能が有効となる時期は,シンクポイントダンプの有効化処理がスキップされ,エラーメッセージが出力されるときよりも後になる場合があります。
-
通常,並列write機能使用時のシンクポイント処理では各デファードライト処理用並列WRITEプロセスに対する出力要求はシンクポイントごとに1回ですが,更新バッファ量抑制機能使用時はシンクポイントスキップの検出を早めるため複数回に分割して行われます。
-
- ◆ pd_watch_resource = MANUAL|AUTO|DEFAULT
-
-
0904互換モードの場合:《MANUAL》
リソースの使用率が80%以上になった場合に,警告メッセージを出力するかどうかを指定します。
MANUAL:警告メッセージを出力しません。
AUTO又はDEFAULT:警告メッセージを出力します。
監視対象のリソースを次に示します。
監視対象のリソース
出力されるメッセージ
pd_max_usersオペランドで指定した最大同時接続数※
KFPS05123-W
pd_max_access_tablesオペランドで指定した同時アクセス可能実表数
pd_max_rdarea_noオペランドで指定したRDエリアの最大数
pd_max_file_noオペランドで指定したRDエリアを構成するHiRDBファイルの最大数
pdworkオペランドで指定した作業表用ファイル用のHiRDBファイルシステム領域
pd_max_list_usersで指定したリスト作成ユーザ数
pd_max_list_countで指定した1ユーザ当たりのリスト作成数
スワップ先にできない監査証跡ファイル数
サーバ内のリスト作成数
KFPH22023-W
注※ DEFAULTの場合は警告メッセージを出力しません。
- 《ほかのオペランドとの関連》
-
このオペランドにAUTO又はDEFAULTを指定すると,次に示すオペランドの省略値に80が設定されます。したがって,AUTO又はDEFAULTを指定すると,次に示すオペランドを各々指定する必要がなくなります。ただし,各オペランドの値を80から変更したい場合は,次に示す各オペランドで変更してください。
-
pd_max_users_wrn_pnt※1,※2
-
pd_max_access_tables_wrn_pnt
-
pd_max_rdarea_no_wrn_pnt
-
pd_max_file_no_wrn_pnt
-
pdwork_wrn_pnt
-
pd_max_list_users_wrn_pnt
-
pd_max_list_count_wrn_pnt
-
pd_aud_file_wrn_pnt※1
-
pd_rdarea_list_no_wrn_pnt※1
注※1 警告メッセージの出力済み状態のリセット契機には50が設定されます。
注※2 DEFAULTの場合は除きます。
-
- 《留意点》
-
バージョンアップ時に,監視できるリソースの対象が増えることがあります(前記以外のオペランドが増えることがあります)。したがって,常に現状と同じ監視体制にしておきたい場合は,このオペランドを指定しないで,前記のオペランドで項目ごとにリソース監視を実施してください。
-
- ◆ pd_max_users_wrn_pnt = HiRDBサーバへの接続数に関する警告メッセージの出力契機〔,警告メッセージの出力済み状態のリセット契機〕
-
HiRDBサーバへの接続数に関する警告メッセージの出力契機:〜<符号なし整数>((0〜100))《0又は80》(単位:%)
HiRDBサーバへの接続数がある一定の比率(pd_max_usersオペランドで指定した最大同時接続数に対する比率)以上になったとき,警告メッセージを出力する比率を%単位で指定します。例えば,pd_max_usersオペランドに200を指定し,このオペランドに90を指定すると,HiRDBサーバへの接続数が180以上になると警告メッセージKFPS05123-Wが出力されます。
- 《留意点》
-
-
このオペランドに0を指定すると,警告メッセージを出力しません。
-
pd_max_usersオペランドの指定値が9以下の場合,このオペランドの指定は無効になります。
-
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUAL又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTOを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
警告メッセージの出力済み状態のリセット契機:〜<符号なし整数>((0〜99))(単位:%)
警告メッセージの出力済み状態のリセット契機を指定します。警告メッセージ(KFPS05123-W)が出力されると,HiRDBは警告メッセージ出力済み状態となります。警告メッセージ出力済み状態となると,HiRDBサーバへの接続数がもう一度警告メッセージの出力契機の値以上になっても警告メッセージが出力されません。しかし,ここで指定する警告メッセージの出力済み状態のリセット契機をHiRDBサーバへの接続数が下回ると,警告メッセージの出力済み状態が解除されます。
例えば,pd_max_users_wrn_pnt=90,70と指定すると,HiRDBサーバへの接続数が最大同時接続数の90%以上になると警告メッセージが出力されます。この後,HiRDBサーバへの接続数が最大同時接続数の70%を下回るまで警告メッセージは出力されません。一度70%を下回り,再度90%以上になったときに警告メッセージが出力されます。
- 《注意事項》
-
-
この指定を省略すると,「警告メッセージの出力契機−30」の値が仮定されます。その値がマイナスになる場合は,0が仮定されます。
-
警告メッセージの出力契機より大きい値を指定すると,その指定は無効になり,警告メッセージの出力契機の指定値と同じ値が仮定されます。
-
- ◆ pd_max_access_tables_wrn_pnt = 同時アクセス可能実表数に関する警告メッセージの出力契機
-
〜<符号なし整数>((0〜100))《0又は80》(単位:%)
同時にアクセスする表数と順序数生成子数の合計が,ある一定の比率(pd_max_access_tablesオペランドで指定した同時アクセス可能実表数に対する比率)以上になった場合,警告メッセージを出力するときにその比率を%単位で指定します。例えば,pd_max_access_tablesオペランドに200を指定し,このオペランドに90を指定すると,同時にアクセスする表数と順序数生成子数の合計が180以上になると警告メッセージKFPS05123-Wが出力されます。
- 《留意点》
-
このオペランドに0を指定すると,警告メッセージを出力しません。
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
- ◆ pd_max_rdarea_no_wrn_pnt = RDエリア数に関する警告メッセージの出力契機
-
〜<符号なし整数>((0〜100))《0又は80》(単位:%)
RDエリア数が,ある一定の比率(pd_max_rdarea_noオペランドで指定したRDエリアの最大数に対する比率)以上になった場合,警告メッセージを出力するときにその比率を%単位で指定します。例えば,pd_max_rdarea_noオペランドに200を指定し,このオペランドに90を指定すると,RDエリア数が180以上になると警告メッセージKFPS05123-Wが出力されます。
- 《留意点》
-
このオペランドに0を指定すると,警告メッセージを出力しません。
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
- ◆ pd_max_file_no_wrn_pnt = HiRDBファイル数に関する警告メッセージの出力契機
-
〜<符号なし整数>((0〜100))《0又は80》(単位:%)
RDエリアを構成するHiRDBファイル数が,ある一定の比率(pd_max_file_noオペランドで指定したRDエリアを構成するHiRDBファイルの最大数に対する比率)以上になった場合,警告メッセージを出力するときにその比率を%単位で指定します。例えば,pd_max_file_noオペランドに200を指定し,このオペランドに90を指定すると,RDエリアを構成するHiRDBファイル数が180以上になると警告メッセージKFPS05123-Wが出力されます。
- 《留意点》
-
このオペランドに0を指定すると,警告メッセージを出力しません。
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
- ◆ pdwork_wrn_pnt = 作業表用ファイルに関する警告メッセージの出力契機
-
〜<符号なし整数>((0〜100))《0又は80》(単位:%)
作業表用ファイル用のHiRDBファイルシステム領域(pdworkオペランドで指定した作業表用ファイル用のHiRDBファイルシステム領域)の使用率※が,ある一定の比率以上になった場合,警告メッセージを出力するときにその比率を%単位で指定します。例えば,このオペランドに90を指定すると,作業表用ファイル用のHiRDBファイルシステム領域の使用率が90%以上になると警告メッセージKFPS05123-Wが出力されます。
- 注※
-
pdfmkfsコマンドでHiRDBファイルシステム領域を作成するときに指定する次の項目の使用率を示しています。次に示す項目ごとにそれぞれ警告メッセージが出力されます。
-
容量に対する使用率
-
最大ファイル数に対する使用率
-
最大増分回数に対する使用率
-
- 《留意点》
-
このオペランドに0を指定すると,警告メッセージを出力しません。
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
- ◆ pd_max_list_users_wrn_pnt = リスト作成ユーザ数に関する警告メッセージの出力契機
-
〜<符号なし整数>((0〜100))《0又は80》(単位:%)
リストを使用するユーザ数がある一定の比率(pd_max_list_usersオペランドで指定したリスト作成ユーザ数に対する比率)以上になった場合,警告メッセージを出力するときにその比率を%単位で指定します。例えば,pd_max_list_usersオペランドに200を指定し,このオペランドに90を指定すると,リストを使用するユーザ数が180以上になると警告メッセージKFPS05123-Wが出力されます。
- 《留意点》
-
-
このオペランドに0を指定すると,警告メッセージを出力しません。
-
警告メッセージは1回しか出力されません。ただし,警告メッセージ出力後に対応するサーバを開始し直すと,再度使用率のチェックが実行され,警告メッセージが出力されます。
-
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
- ◆ pd_max_list_count_wrn_pnt = 1ユーザ当たりのリスト作成数に関する警告メッセージの出力契機
-
〜<符号なし整数>((0〜100))《0又は80》(単位:%)
1ユーザ当たりのリスト作成数がある一定の比率(pd_max_list_countオペランドで指定した1ユーザ当たりのリスト作成数に対する比率)以上になった場合,警告メッセージを出力するときにその比率を%単位で指定します。例えば,pd_max_list_countオペランドに200を指定し,このオペランドに90を指定すると,あるユーザのリスト作成数が180以上になると警告メッセージKFPS05123-Wが出力されます。
- 《留意点》
-
-
このオペランドに0を指定すると,警告メッセージを出力しません。
-
警告メッセージは1回しか出力されません。ただし,警告メッセージ出力後に対応するサーバを開始し直すと,再度使用率のチェックが実行され,警告メッセージが出力されます。
-
複数のユーザが同時にリストを作成している場合,タイミングによっては一つのサーバで警告メッセージが2回以上出力されることがあります。
-
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
- ◆ pd_rdarea_list_no_wrn_pnt = サーバ内のリスト作成数に関する警告メッセージの出力契機〔,警告メッセージの出力済み状態のリセット契機〕
-
サーバ内のリスト作成数に関する警告メッセージの出力契機:〜<符号なし整数>((0〜100))《0又は80》(単位:%)
サーバ内のリスト作成数がリスト作成可能数に対してある一定の比率以上になったとき,警告メッセージを出力する比率を%単位で指定します。例えば,サーバ内のリスト作成可能数が1000の場合,このオペランドに90を指定すると,リスト作成数が900以上になると警告メッセージKFPH22023-Wが出力されます。
- 《留意点》
-
このオペランドに0を指定すると,警告メッセージを出力しません。
- 《ほかのオペランドとの関連》
-
-
pd_watch_resourceオペランドにMANUALを指定して,かつこのオペランドを省略すると,このオペランドの値に0が仮定されます。すなわち,警告メッセージが出力されません。
-
pd_watch_resourceオペランドにAUTO又はDEFAULTを指定して,かつこのオペランドを省略すると,このオペランドの値に80が仮定されます。すなわち,80%以上になると警告メッセージが出力されます。
-
警告メッセージの出力済み状態のリセット契機:〜<符号なし整数>((0〜99))(単位:%)
警告メッセージの出力済み状態のリセット契機を指定します。
警告メッセージ(KFPH22023-W)が出力されると,HiRDBは警告メッセージ出力済み状態となります。警告メッセージ出力済み状態となると,リスト作成数がもう一度警告メッセージの出力契機の値以上になっても警告メッセージが出力されません。しかし,ここで指定する警告メッセージの出力済み状態のリセット契機をリスト作成数が下回ると,警告メッセージの出力済み状態が解除されます。
例えば,pd_rdarea_list_no_wrn_pnt=90,70と指定すると,リスト作成数がリスト作成可能数の90%以上になると警告メッセージが出力されます。この後,リスト作成数がリスト作成可能数の70%を下回るまで警告メッセージは出力されません。一度70%を下回り,再度90%以上になったときに警告メッセージが出力されます。
- 《注意事項》
-
-
この指定を省略すると,「警告メッセージの出力契機−30」の値が仮定されます。その値がマイナスになる場合は,0が仮定されます。
-
警告メッセージの出力契機より大きい値を指定すると,その指定は無効になり,警告メッセージの出力契機の指定値と同じ値が仮定されます。
-