ノンストップデータベース HiRDB Version 9 システム運用ガイド(UNIX(R)用)

[目次][索引][前へ][次へ]

15.12 物理エラー検知時ユニットダウン機能

ここでは,物理エラー検知時ユニットダウン機能を使用する方法について説明します。なお,ここでいう物理エラーとは,RDエリアに対するアクセスで入出力エラー,ファイルオープンエラーが発生し,KFPH00306-Eメッセージの閉塞理由にi/o error occurred,又はopen error occurredが出力されるエラーのことです。

<この節の構成>
(1) 物理エラー検知時ユニットダウン機能とは
(2) 注意事項
(3) 準備作業
(4) 物理エラーが発生した場合の対処方法

(1) 物理エラー検知時ユニットダウン機能とは

HiRDBは,稼働中にRDエリアに障害が発生すると,障害が発生したRDエリアを障害閉塞させることで影響範囲を局所化して,処理を続行します。しかし,RDエリアが少ないシステムの場合,障害が発生したRDエリアだけを障害閉塞させても業務全体が停止することがあります。この場合,業務を再開するには障害閉塞したRDエリアを回復する必要があります。

物理エラー検知時ユニットダウン機能を使用すると,障害が発生したRDエリアを障害閉塞しないで,ユニットダウンさせることができます(ただし,マスタディレクトリ用RDエリアの場合は,物理エラー検知時ユニットダウン機能を使用していなくても障害閉塞しないでユニットダウンします)。ユニットダウンすることで,ユニットを再開始する前に物理エラーによる障害閉塞の要因を取り除くことができ,RDエリアが障害閉塞することによる回復作業を回避できます。

(2) 注意事項

この機能を使用するときは,次の点に注意してください。

(3) 準備作業

この機能を使用するには,システム共通定義(pdsys)を次のように指定してください。

  1. pd_db_hold_actionオペランドにunitdownを指定します。
    この値を指定すると,物理エラーを検知した場合,KFPH23047-Iメッセージを出力し,ユニットダウンします。このとき,RDエリアの障害閉塞は発生しません。
  2. pd_mode_confオペランドにMANUAL2を指定します。
    この値を指定すると,ユニットダウン後にHiRDB(ユニット)を自動開始しないようにできます。
    なお,AUTO又はMANUAL1を指定した場合,物理エラー検知時ユニットダウン機能でユニットダウンしても,要因を取り除く前にHiRDB(ユニット)が自動的に再開始してしまうおそれがあります。この場合,再び物理エラーを検知してしまい,ユニットダウンと再開始が繰り返されますので注意してください。

(4) 物理エラーが発生した場合の対処方法

物理エラー検知時ユニットダウン機能を使用していてユニットダウンが発生した場合,HiRDB管理者は次の図に示す手順に従って対処してください。

図15-11 物理エラーが発生した場合の対処方法

[図データ]

注※
物理エラーの要因に対処できない場合,ユニットを再開始しても再度同じ要因でユニットダウンを繰り返すことになります。そのときは,システム共通定義のpd_db_hold_actionオペランドにdbholdを指定して,物理エラー検知時ユニットダウン機能を使用しないように変更してください。