Hitachi

HiRDB データ連動機能 HiRDB Datareplicator Version 10


9.1.2 エラーの対処方法

抽出側システムのエラーの原因と対処方法を次の表に示します。なお,障害が発生して抽出側DBと反映側DBの不整合が発生した場合は,抽出側Datareplicator及び反映側Datareplicatorを初期化する必要があります。初期化手順の詳細については,「9.4 障害回復時の初期化手順」を参照してください。

表9‒1 エラーの原因と対処方法

エラーの原因の種類

エラーの対処方法

メモリ不足(ローカルメモリ)

  • 動作中の不要なプロセスを終了してください。

  • メモリを増設してください。

メモリ不足(共用メモリ)

  • 共用メモリを使っている,動作中の不要なプロセスを終了してください。

  • メモリを増設してください。

ファイルディスクリプタ不足

  • 不要なファイルをクローズしてください。

  • システムパラメタ(ファイルディスクリプタ数の上限値)を調整してください。

ソケット確立不可

システムコールからの詳細コードを基にエラーの原因を取り除いてください。

ポートチェックエラー

詳細コードを基にエラーの原因を取り除いてください。

通信回線切断

通信回線を再接続してください。

ファイル容量不足

抽出情報キューファイル

抽出情報キューファイルに格納してあるすべての更新情報を反映側システムに送信し終わってから,hdestopコマンドで抽出側Datareplicatorを終了してください。その後,ファイルの数を増やす又は容量を拡張した後,hdestart -iコマンドでファイルを初期化して,hdestartコマンドで再起動してください。

詳細は,「抽出情報キューファイル満杯時の運用手順」のフローチャートに従って対処してください。

抽出時のステータスファイル

抽出情報キューファイルに格納されているすべての更新情報を反映側システムに送信し終わってから,hdestopコマンドで抽出側Datareplicatorを終了してください。その後,ファイルの容量を拡張した後,hdestart -iコマンドでファイルを初期化して,hdestartコマンドで再起動してください。

媒体不正

抽出情報キューファイル

抽出情報キューファイルにだけ障害が発生した場合

エラーの原因を取り除いた後,抽出情報キューファイル回復機能を使用して,抽出情報キューファイルを回復してください。抽出情報キューファイル回復機能については,「9.7 抽出情報キューファイル回復機能」を参照してください。

抽出情報キューファイル以外にも障害が発生した場合

エラーの原因を取り除いた後,抽出側と反映側の両方のデータ連動の環境を同期を取って初期化して,抽出側DBを基に反映側DBを再作成してください。

抽出時のステータスファイル

エラーの原因を取り除いた後,抽出側と反映側の両方のデータ連動の環境を同期を取って初期化して,抽出側DBを基に反映側DBを再作成してください。

データ連動用連絡ファイル

システムログファイル

抽出側DB

抽出側DBのバックアップとバックアップ取得以降のログを基にして,データベース回復ユティリティ(pdrstr)で回復してください。それ以外の方法で回復した場合は,抽出側と反映側の両方のデータ連動の環境を同期を取って初期化して,抽出側DBを基に反映側DBを再作成してください。

抽出情報キューファイルの満杯

hdestateコマンドで送信プロセスの状態を確認して,正常に稼働していない場合は,エラー原因を取り除いた後,エラーが発生している送信プロセスを再起動してください。

送信プロセスでのエラーが取り除けない場合などに,データ連動を中止するときは,抽出側Datareplicatorを強制停止してください。その後,抽出側と反映側の両方のデータ連動の環境を同期を取って初期化して,抽出側DBを基に反映側DBを再作成してください。

詳細は,「抽出情報キューファイル満杯時の運用手順」のフローチャートに従って対処してください。

抽出情報キューファイルの満杯時に縮退対象になった送信先がある場合の処置については,「9.1.4 反映側システムでエラーが発生したときの対処」を参照してください。

更新情報不正

更新情報の不正が起こった直後に抽出したステータスファイルと抽出情報キューファイルを保存して保守員に連絡してください。

エラーの原因を取り除いた後,抽出側と反映側の両方のデータ連動の環境を同期を取って初期化して,抽出側DBを基に反映側DBを再作成してください。

定義情報不正

抽出側システム又は抽出側Datareplicatorの定義を修正してください。

SQLエラー

SQLCODEを基にエラーの原因を取り除いてください。

内部矛盾

保守員に連絡してください。

マシン電源切断

マシンを再起動してください。

バスエラー

保守員に連絡してください。

不正シグナル受信(sigkill)

UNIX版Datareplicatorの場合

不正シグナルを受信した場合は,hdeshmcleanコマンドを実行してください。

Windows版Datareplicatorの場合

マシンを再起動してください。

注※

二重化している場合は,両系障害が発生したとき。

抽出情報キューファイル満杯時の運用手順

抽出情報キューファイルが満杯になると,エラーメッセージが出力されます。出力されるメッセージと出力するプロセスとの関係を次に示します。

これらのメッセージが出力された場合の運用手順を次に示します。

[図データ]

注※1

hdestateコマンドを実行して,送信処理が動作中かどうかを確認します。

注※2

必要に応じて停止した要因を取り除いて,hdestart -sコマンドで送信処理を開始します。

注※3

hdestateコマンドの実行結果から,抽出情報キューファイルが幾つ割り当てられているかを確認します。

注※4

抽出情報キューファイルの追加登録に失敗したときのために,バックアップを取得してください。バックアップ方法については,「6.4.2(7)(b) 抽出サーバステータスファイルのバックアップ」を参照してください。

注※5

抽出情報キューファイルは,hdemodqコマンドで追加登録できます。hdemodqコマンドについては,「6.4.2(6)(b) 抽出情報キューファイルの構成を変更するコマンド(hdemodqコマンド)」又は「7. コマンドの文法」のhdemodqコマンドの文法の説明を参照してください。

注※6

抽出情報キューファイル全体を読み込むのに必要な時間(目安として1MB当たり1秒)が経過した後,送信間隔(指定値が0の場合は1分)ごとに数回hdestateコマンドを実行して抽出情報キューファイルへの処理状態を確認します。「Queue read position」が「Queue write position」の次の抽出情報キューファイル示しているときは満杯状態が解消されていないため,抽出情報キューファイルを追加します。

注※7

送信間隔(指定値が0の場合は1分)が経過した後,送信間隔ごとに数回hdestateコマンドを実行して抽出情報キューに対する処理状態を確認します。「Queue read position」が「Queue write position」の次の抽出情報キューファイル示しているときは満杯状態が解消されていないため,抽出情報キューファイルを追加します。