Hitachi

ノンストップデータベース HiRDB Version 10 システム運用ガイド(UNIX(R)用)


29.6.1 障害発生時のシステム状況別の対処方法

拡張ユニットを使用する場合,発生した障害によっては,システムマネジャが管理する状態と拡張ユニットが管理する状態が不一致になることがあります。そのような場合,再開始時に拡張ユニットが自動起動されないなど影響があるため,対処が必要になります。

ここでは,障害発生時のシステムの状態と状況,対処について説明します。ここで説明するケース以外のデータベースの障害回復については,「障害が発生したときの対処方法」を参照してください。

表29‒2 障害発生時のシステムの状態,状況,及び対処

障害発生時のシステムの状態

状況

対処方法の参照先

HiRDB開始時(KFPS01800-IからKFPS05271-Iの間)

システムマネジャがあるユニットが異常終了し,KFPS05276-Eが出力された場合

対処方法1

システムマネジャがあるユニットが異常終了し,KFPS04695-Iが出力され,KFPS05273-Iが出力されていない場合

対処方法2

HiRDB正常終了時(KFPS05220-IからKFPS01850-Iの間)

KFPS05275-W及びKFPS01850-Iが出力されている場合

対処方法3

KFPS05275-Wが出力され,KFPS01850-Iが出力されていない場合

対処方法4

システムマネジャがあるユニットが異常終了した場合

対処方法5

拡張ユニット開始時(KFPS1800-IからKFPS05273-Iの間)

KFPS05275-Wが出力されている場合

対処方法6

システムマネジャがあるユニットが異常終了した場合

対処方法7

システムマネジャがあるユニットが系切り替えした場合

対処方法8

拡張ユニット終了時(KFPS01840-IからKFPS05274-Iの間)

KFPS5275-Wが出力されている場合

対処方法9

システムマネジャのあるユニットが異常終了した場合

対処方法10

拡張ユニット稼働中

HiRDBが異常終了し,再開始する際,拡張ユニットがあるサーバマシンにハードウェア障害などが発生して開始できない場合

対処方法11

〈この項の構成〉

(1) 対処方法1

対処手順を次に示します。

〈手順〉
  1. KFPS05276-Eメッセージに従って,障害を回復します。

  2. すべての基本ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。ユニットの状態がSTARTING(開始途中)の場合は,pdstop -zコマンドでそのユニットを終了します。

  3. pdstartコマンドを再度実行して,HiRDBを開始します。

(2) 対処方法2

対処手順を次に示します。

〈手順〉
  1. KFPS04695-Iメッセージに表示される拡張ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。

  2. ユニットの状態がSTARTING(開始途中),又はONLINE(稼働状態)の場合は,いったんpdstop -zコマンドでそのユニットを終了してからpdstart -qコマンドを実行してユニットを開始します。

(3) 対処方法3

KFPS05275-Wメッセージの前に出力されているメッセージを参照して障害を取り除いてください。拡張ユニットの状態は正しく管理されています。拡張ユニットに対する処置は不要です。

(4) 対処方法4

対処手順を次に示します。

〈手順〉
  1. KFPS05275-Wメッセージの前に出力されているメッセージを参照して障害を取り除きます。

  2. KFPS05275-Wメッセージに表示された拡張ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。

  3. 拡張ユニットの状態がONLINE(稼働状態),又はSTOPPING(停止途中)の場合は,いったんpdstop -zコマンドでそのユニットを終了してからpdstart -qコマンドを実行してユニットを開始します。

なお,次回HiRDB開始時にKFPS05275-Wメッセージに表示された拡張ユニットが開始する可能性があります。次回HiRDB開始時に拡張ユニットが開始した場合は,pdstop -uコマンドで拡張ユニットを終了してください。

(5) 対処方法5

対処手順を次に示します。

〈手順〉
  1. KFPS01840-Iメッセージに表示された拡張ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。

  2. 拡張ユニットの状態がONLINE(稼働状態),又はSTOPPING(停止途中)の場合は,いったんpdstop -zコマンドでそのユニットを終了してからpdstart -qコマンドを実行してユニットを開始します。

なお,次回HiRDB開始時にKFPS01840-Iメッセージに表示された拡張ユニットが開始する可能性があります。次回HiRDB開始時に拡張ユニットが開始した場合は,pdstop -uコマンドで拡張ユニットを終了してください。

(6) 対処方法6

対処手順を次に示します。

〈手順〉
  1. KFPS05275-Wメッセージの前に出力されているメッセージを参照して障害を取り除きます。

  2. KFPS05275-Wメッセージに表示された拡張ユニットをいったんpdstop -uコマンドで終了し,pdstart -uコマンドで開始してください。

(7) 対処方法7

対処手順を次に示します。

〈手順〉
  1. KFPS01800-Iメッセージに表示された拡張ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。

  2. 拡張ユニットの状態がSTARTING(開始途中),又はONLINE(稼働状態)の場合は,いったんpdstop -zコマンドでそのユニットを終了してからpdstart -qコマンドを実行してユニットを開始します。

なお,次回HiRDB開始時にKFPS01800-Iメッセージに表示された拡張ユニットが開始しない可能性があります。次回HiRDB開始時に拡張ユニットが開始しない場合は,pdstart -uコマンドで拡張ユニットを開始してください。

(8) 対処方法8

対処手順を次に示します。

〈手順〉
  1. KFPS01800-Iメッセージに表示された拡張ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。

  2. 拡張ユニットの状態がSTARTING(開始途中),又はONLINE(稼働状態)の場合は,いったんpdstop -zコマンドでそのユニットを終了してからpdstart -qコマンドを実行してユニットを開始します。

(9) 対処方法9

対処手順を次に示します。

〈手順〉
  1. KFPS05275-Wメッセージの前に出力されているメッセージを参照して障害を取り除きます。

  2. KFPS05275-Wメッセージに表示された拡張ユニットをいったんpdstart -uコマンドで開始し,pdstop -uコマンドで終了してください。

(10) 対処方法10

対処手順を次に示します。

〈手順〉
  1. KFPS01840-Iメッセージに表示された拡張ユニットでpdls -d ustコマンドを実行し,そのユニットの稼働状態を確認します。

  2. 拡張ユニットの状態がONLINE(稼働状態),又はSTOPPING(停止途中)の場合は,いったんpdstop -zコマンドでそのユニットを終了してからpdstart -qコマンドを実行してユニットを開始します。

なお,次回HiRDB開始時にKFPS01840-Iメッセージに表示された拡張ユニットが開始する可能性があります。次回HiRDB開始時に拡張ユニットが開始した場合は,pdstop -uコマンドで拡張ユニットを終了してください。

(11) 対処方法11

拡張ユニットの稼働中にHiRDBが異常終了し,再開始する場合,前回稼働していた拡張ユニットも開始します。その際,ハードウェア障害などの何らかの原因で拡張ユニットが開始しないと,HiRDBが開始できません。このような場合,縮退起動機能を使用することで,拡張ユニットが開始しないときでもHiRDBを開始できます。

ただし,拡張ユニットと縮退起動を併用した場合,次の表に示すように,HiRDBの開始処理完了時点と縮退起動完了時点が異なります。それぞれの場合の処理完了時点に留意し,運用してください。

注※

pd_start_skip_unitオペランド及びpd_system_expand_unitオペランドに同じユニットを指定した場合です。

表29‒3 pdstartコマンド実行時に開始するユニットと,開始処理及び縮退起動完了時点

前回の拡張ユニットの終了状態

開始するユニット

HiRDBの開始処理が完了する時点

(KFPS05210-I出力)

縮退起動が完了する時点

(KFPS05217-I出力)

正常終了

pd_start_skip_unitオペランドに指定しているユニット以外のすべての基本ユニット

すべての基本ユニットの開始処理完了時点

次のどちらか早い方です。

  • pd_start_skip_unitオペランドに指定しているユニット以外のすべての基本ユニットの開始処理完了時点

  • pd_reduced_check_timeオペランドに指定した値を経過した時点

計画停止

強制終了

異常終了

pd_start_skip_unitオペランドに指定しているユニット以外のすべての基本ユニット,及び拡張ユニット

すべての基本ユニット,及び拡張ユニットの開始処理完了時点

次のどちらか早い方です。

  • pd_start_skip_unitオペランドに指定しているユニット以外のすべての基本ユニット,及び拡張ユニットの開始処理完了時点

  • pd_reduced_check_timeオペランドに指定した値を経過した時点

注※

前回の拡張ユニットの終了状態は,KFPS05274-Iメッセージの出力有無で分かります。このメッセージが出力されている場合は正常終了,出力されていない場合は計画停止,強制終了,又は異常終了のどれかになります。