Hitachi

ノンストップデータベース HiRDB Version 10 システム運用ガイド(UNIX(R)用)


20.1.3 障害が発生したときのHiRDBの処理

障害が発生したときのHiRDBの処理概要について説明します。

〈この項の構成〉

(1) 障害が発生したときの影響範囲

ハードウェア及びソフトウェアの障害によって,HiRDBの異常終了につながる障害が発生した場合,HiRDB/パラレルサーバは一部の例外を除いてその影響範囲をユニット単位に局所化し,HiRDBを構成するすべてのユニットが全面停止しないで,ユニット単位で異常終了します。HiRDB/シングルサーバの場合,一つのユニットから構成されているため,ユニットの異常終了はHiRDBの全面停止につながります。

(2) HiRDBが異常終了したときのシステムの回復

HiRDBが異常終了した場合,障害の原因を取り除いた後にHiRDBを再開始すると,HiRDBはシステムの状態を障害発生時点に回復します。

(3) 連続して異常終了したときの処理

HiRDBが異常終了しても,システム共通定義のpd_mode_confオペランドの指定によっては,HiRDBは自動的にユニットを再開始します。ただし,3回連続して異常終了すると,自動的に再開始しなくなります。

この場合,HiRDB管理者は障害の原因を対策した後,pdstartコマンドでHiRDBを再開始してください。

注※

pd_term_watch_countオペランドの指定でこの回数を変更できます。例えば,pd_term_watch_countオペランドに2を指定した場合,2回連続して異常終了すると,自動的に再開始しなくなります。

このとき,HiRDBはPAUSE状態になります。PAUSE状態になると,pdstartコマンドが実行できないため,HiRDBを再開始できません。PAUSE状態になっているかどうかは,pdls -d ustコマンドで確認できます。PAUSE状態を解除するには,KFPS00715-Eメッセージの付加情報に従って異常終了の原因を取り除いた後に,pdrpauseコマンドを実行してください。なお,HiRDB/パラレルサーバの場合は,PAUSE状態のユニットでpdrpauseコマンドを実行してください。