スケーラブルデータベースサーバ HiRDB Version 8 システム運用ガイド(UNIX(R)用)

[目次][索引][前へ][次へ]

8.13 サーバプロセスの異常終了回数の監視プロセスの異常終了回数監視機能

サーバプロセスの異常終了が多発すると,新たなサービスを受け付けられないことがあります。しかし,サーバプロセスの異常終了ではHiRDBを異常終了しないため,実質オンライン停止状態になります。この実質オンライン停止状態を防ぐためにプロセスの異常終了回数監視機能があります。

<この節の構成>
(1) プロセスの異常終了回数監視機能とは
(2) プロセスの異常終了回数監視機能の適用範囲
(3) プロセスの異常終了回数監視機能の指定方法
(4) 備考

(1) プロセスの異常終了回数監視機能とは

サーバプロセスの異常終了回数が一定時間内にpd_down_watch_procオペランドの値を超えた場合,HiRDB(HiRDB/パラレルサーバの場合は該当するユニット)を異常終了します。これをプロセスの異常終了回数監視機能といいます。

この機能は系切り替え機能を使用する場合に使用することをお勧めします。サーバプロセスの異常終了が多発した場合にHiRDBを異常終了するため,すぐに系を切り替えられます。この機能を使用しないとHiRDBが異常終了しないため,系が切り替わりません。

また,系切り替え機能を使用しない場合でも,HiRDBの再開始によってメモリ及びリソース状態がリフレッシュされて処理効率が向上します。

なお,プロセスの異常終了回数監視機能によってHiRDBが異常終了する場合,KFPS01821-E及びKFPS00729-Eメッセージが出力されます。

(2) プロセスの異常終了回数監視機能の適用範囲

この機能では,PDCWAITTIMEオーバ,又はアボートによって異常終了するサーバプロセスを監視対象とします。HiRDB/シングルサーバの場合は,シングルサーバプロセスの異常終了回数がカウントされます。HiRDB/パラレルサーバの場合は,ユニット内のフロントエンドサーバ,バックエンドサーバ,及びディクショナリサーバプロセスの異常終了回数の合計値がカウントされます。サーバプロセスが異常終了する要因と異常終了回数のカウント対象を次の表に示します。

表8-13 サーバプロセスが異常終了する要因と異常終了回数のカウント対象

サーバプロセスが
異常終了する要因
異常終了回数のカウント対象
シングルサーバプロセス フロントエンドサーバプロセス ディクショナリサーバプロセス バックエンドサーバプロセス
クライアント環境定義のPDCWAITTIMEオペランドの値を超えた ×※1 ×※1
pdcancelコマンド × ×※2 × ×
内部強制終了(HiRDBが内部的にSIGKILLを発行してサーバプロセスを終了させる場合) ※3 ※3 ×※1 ×※1
アボート
XA接続のUAPでロールバックが発生した × ×
上記以外のサーバプロセス異常終了

(凡例)
○:サーバプロセスの異常終了回数にカウントされます。
×:サーバプロセスの異常終了回数にカウントされません。

注※1
トランザクションブランチが発生した状態で障害を検知した場合,同一トランザクションブランチから発生したフロントエンドサーバプロセスの異常終了がカウントの対象になります。

注※2
pdcancelコマンドでバックエンドサーバプロセス又はディクショナリサーバプロセスを強制終了すると,フロントエンドサーバプロセスを内部的に強制終了します。この場合,フロントエンドサーバプロセスの異常終了がカウントされることがあります。

注※3
OLTPシステムによるグローバルトランザクションが発生した状態で障害を検知した場合,同一グローバルトランザクションから発生したシングルサーバプロセス又はフロントエンドサーバプロセスの異常終了がカウントの対象になります。

(3) プロセスの異常終了回数監視機能の指定方法

pd_down_watch_procオペランドで,サーバプロセスの異常終了回数を監視する時間と異常終了回数の上限を指定します。

(例)pd_down_watch_proc = 1000,60
この場合,60秒間隔でサーバプロセスの異常終了回数を監視します。60秒以内にサーバプロセスの異常終了回数が1000を超えると,HiRDBを異常終了します。

(4) 備考