スケーラブルデータベースサーバ HiRDB Version 8 システム運用ガイド(UNIX(R)用)

[目次][索引][前へ][次へ]

23.11 自動データロード機能適用中に障害が発生したときの対処方法

<この節の構成>
(1) 自動データロード実行中に障害が発生した場合
(2) 自動データロード機能適用中にHiRDBで障害が発生した場合

(1) 自動データロード実行中に障害が発生した場合

自動データロード実行中に障害が発生した場合のHiRDBの動作と,HiRDB管理者又は監査人の取る対処方法を次の表に示します。

表23-36 自動データロード実行中の障害内容と対処方法

障害内容 障害原因 HiRDBの動作 機能の継続 HiRDB管理者又は監査人の対処方法
監査証跡表が存在しない場合 監査証跡表を作成する前に,監査証跡ファイルのスワップが発生しました。 KFPL15029-Eメッセージを出力し,データロードを中止します。 × 【管理者】
pdmodコマンドを実行し,監査証跡表を作成してください。
pdloadの最大同時実行数が超過した場合 pd_utl_exec_modeに0を指定している場合,自動データロード以外で実行しているpdloadコマンドが32個を超えました。 実行中のpdloadコマンドが終了した後に,データロードを開始します。 【管理者】
pdloadコマンドの最大同時実行数を見直し,必要であればpd_utl_exec_modeの値を1に変更してください。
pdloadの最大同時接続数が超過した場合 pdloadコマンドの最大同時接続数が,pd_max_usersで指定している値を超えました。 KFPA11932-Eメッセージを出力します。データロードはいったん中止しますが,時間を置いて再実行します。 【管理者】
pdloadコマンドの最大同時接続数を見直し,必要であればpd_max_usersの値を大きくしてください。
排他確保エラーが発生した場合 監査証跡表をNOWAIT検索以外の方法で参照しているUAPが存在しています。 KFPA11770-Iメッセージを出力し,データロードを中止します。 【監査人】
監査証跡表の参照に時間が必要な場合は,pdaudatld -tコマンドで一時的に自動データロード機能を停止するか,NOWAIT検索による参照を検討してください。
RDエリアへアクセスできない場合 監査証跡表を格納したRDエリアが閉塞又はクローズしています。 KFPL23500-Eメッセージを出力し,データロードを中止します。 × 【管理者】
監査証跡表が格納されているRDエリアの状態をオープンにしてください。
監査証跡ファイルの読み込みエラーが発生した場合 監査証跡ファイル(HiRDBファイル)の内容を読み込みできません。 KFPS05704-Eメッセージを出力し,データロードをロールバックして処理を中止します。 × 【管理者】
メッセージの内容を参照して,障害を取り除いてください。
監査証跡ファイルの書き込みエラーが発生した場合※3 監査証跡ファイルのステータス変更(データロード済み状態への変更)に失敗しました。 KFPS05704-Eメッセージを出力し,データロードをロールバックして処理を中止します。 × 【監査人】
次の手順で対処してください。
1. syslogfileを参照し,自動データロード中に異常終了した監査証跡ファイルを特定します※1
2. 1.で特定したファイル名を指定し,pdloadコマンドを手動で実行します※2
3. pdaudatld -bコマンドを実行して,自動データロード機能を再開始します。
データロード待ち状態の監査証跡ファイルが存在しない場合 監査人が監査証跡表へのデータロードを手動で行いました。 KFPL23201-Wメッセージを出力します。 対策は不要です。
RDエリアの容量が不足している場合 監査証跡表のデータを退避又は削除しなかったため,RDエリアの容量が不足しました。 KFPA11756-Eメッセージを出力し,データロードをロールバックして処理を中止します。 × 【監査人】
監査証跡表に不要なデータがある場合は,削除してください。又は,HiRDB管理者にRDエリアの拡張を依頼してください。
【管理者】
監査人から依頼があった場合,RDエリアを拡張してください。
監査証跡表が更新できない場合 監査証跡表にデータロードできません。 障害の原因をSQLメッセージに出力し,データロードをロールバックして処理を中止します。 × 【管理者】
SQLメッセージの内容を参照して,障害を取り除いてください。
通信エラー(サーバ起動)が発生した場合 pdloadからのサーバ起動ができません。サーバやユニットがダウンしているおそれがあります。 KFPL20000-Eメッセージを出力し,データロードを中止します。 × 【管理者】
メッセージの内容を参照して,障害を取り除いてください。
通信エラー(データ送受信)が発生した場合 監査証跡ファイルのあるユニットから,監査証跡表のあるユニットにデータが送信できません。 KFPL20000-Eメッセージを出力してアボートします。これに伴いデータロードをロールバックして,処理を中止します。 × 【管理者】
メッセージの内容を参照して,障害を取り除いてください。
プロセスがダウンした場合※3 自動データロードを行うpdloadがキャンセルされたか,サーバがダウンしました。 KFPS01820-Eメッセージを出力してアボートします。 × 【管理者】
自動データロードを行うpdloadのプロセスに対して,pdcancelコマンドを実行しないでください。
上記の要因に当てはまらない場合は,メッセージの内容を参照して,障害を取り除いてください。対処できない場合は,保守員に連絡してください。

(凡例)
○:自動データロード機能は停止しません。
×:自動データロード機能は停止します。障害の原因を取り除いた後,pdaudatld -b コマンドで機能を再開始する必要があります。
【管理者】:HiRDB管理者が行う対処方法
【監査人】:監査人が行う対処方法

注※1
ユニットダウンでsyslogfileが参照できない場合は,監査証跡表に対してデータベース状態解析ユティリティ(pddbst)をDBA権限所有者に実行してもらい,その実行結果から特定してください。

注※2
ここで実行するpdloadコマンドは,監査証跡ファイルの状態をデータロード済みに変更する処理を行うだけで,データロードは行いません。

注※3
監査証跡ファイルの状態を「データロード済み」に変更できなかった場合に発生する障害です。

(2) 自動データロード機能適用中にHiRDBで障害が発生した場合

自動データロード機能を適用中にHiRDBで障害が発生した場合のHiRDBの動作と,対処方法を次の表に示します。HiRDB管理者は,対処方法の内容を基に,障害原因に応じた対処をしてください。

表23-37 自動データロード機能適用中のHiRDBの障害内容と,対処方法

障害内容 障害原因 HiRDBの動作 機能の継続 HiRDB管理者の対処方法
監査証跡ファイルにスワップが発生した時,MGRユニットへの通信が失敗した場合
  • 原因1:MGRユニットが停止しています。
  • 原因2:MGRユニットと,スワップした監査証跡ファイルのある非MGRユニットの間で,通信障害が発生しています。

  • KFPS05193-Eメッセージを表示します。
    ただし,次に示す通信障害の場合は,メッセージが表示されません。
    ・電文送信と同時にMGRユニットとの間で通信障害が発生した場合
    ・電文送信先のプロセスにスレッドを受け付ける余裕がない場合
  • 自動データロード処理は,障害が解消した後,監査証跡ファイルのスワップが発生した時に実行します。

  • 原因1:pdstart -qコマンドでMGRユニットを再開始してください。
  • 原因2:原因を調査し,MGRユニットと非MGRユニット間の通信障害を解消してください。
監査証跡ファイルにスワップが発生したのに,自動データロード対象にならない場合 MGRユニットと,スワップした監査証跡ファイルのある非MGRユニットの間で,通信障害が発生しています。 原因を調査し,MGRユニットと非MGRユニット間の通信障害を解消してください。
自動データロードで,pdloadの起動に失敗した場合
  • 原因1:システム内の最大プロセス数が限界に達しています。
  • 原因2:メモリ不足が発生しているため,プロセスが生成できません。

  • KFPS05717-Wメッセージを表示します。
  • 自動データロードは,一定時間経過後に再実行します。

  • 原因1:MGRユニットが動作するサーバマシンの最大プロセス数を見直してください。
  • 原因2:MGRユニットが動作するサーバマシンのメモリ使用量を減らしてください。
自動データロード対象のファイルが存在するのに,自動データロードが実行されない場合
  • 原因1:自動データロード対象の監査証跡ファイルがあるユニットが停止しています。
  • 原因2:MGRユニットと自動データロード対象の非MGRユニットの間で,通信障害が発生しています。
  • 原因3:自動データロード機能が停止しています。
  • 原因4:HiRDBの停止処理を実行しています。

  • KFPS05718-Wメッセージを表示します。
  • 自動データロード対象の監査証跡ファイルが別のユニットにある場合は,その監査証跡ファイルを先にデータロードします。
  • 原因1〜3で,障害が解消した場合,先行の自動データロードが完了した後に,該当する監査証跡ファイルの自動データロードを開始します。

  • 原因1:自動データロード対象の監査証跡ファイルがあるユニットを,pdstart -qコマンドで起動してください。
  • 原因2:原因を調査し,MGRユニットと非MGRユニット間の通信障害を解消してください。
  • 原因3:監査人がpdaudatld -tコマンドで明示的に自動データロード機能を停止していなかった場合は,機能が停止した原因を調査し,対策してください。
  • 原因4:次回HiRDBを起動した時に再度自動データロード対象になるので,対処は不要です。
ユニットダウンにより,自動データロードがエラー終了した場合 自動データロード中の監査証跡ファイル又は監査証跡表のある非MGRユニットが,強制停止,異常終了,又は系切り替えを行いました。 KFPS05713-Eメッセージを表示します。 × pdstart -qで非MGRユニットを再開始してください。
MGRユニットが強制停止,異常終了,又は系切り替えを行いました。
  • MGRユニットの停止と同時に,自動データロードも停止します。
  • 自動データロードは,MGRユニット再開始後に行います。
pdstart -qでMGRユニットを再開始してください。

(凡例)
○:自動データロード機能は停止しません。
×:自動データロード機能は停止します。障害の原因を取り除いた後,pdaudatld -b で機能を再開始する必要があります。
MGRユニット:システムマネジャがあるユニット
非MGRユニット:システムマネジャがないユニット