Hitachi

OpenTP1 Version 7 分散トランザクション処理機能 TP1/Financial Service Platform 使用の手引


26.7.1 障害が発生した場合のシステムの動作とユーザの対処方法

OBMの機能で障害が発生した場合のシステムの動作とユーザの対処方法について説明します。

次の4つに分けて説明します。

〈この項の構成〉

(1) TP1/EE開始からネゴシエーション完了

図26‒8 TP1/EE開始からネゴシエーション完了で発生する障害と対処方法

[図データ]

TP1/EE開始からネゴシエーション完了で発生する障害と対処方法を次の表に示します。表の項番は,図26-8の番号に対応します。

表26‒5 TP1/EE開始からネゴシエーション完了で発生する障害と対処方法

項番

障害

システムの動作

対処方法

1.

定義不正

TP1/EEプロセスダウン。

  • 定義ファイルを見直します。

メモリ不足

TP1/EEプロセスダウン。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

2.

ロット構成オブジェクトIOエラー

TP1/EEプロセスダウン。

  • ファイルの格納ディレクトリ,アクセス権限を見直します。

メモリ不足

TP1/EEプロセスダウン。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

ロット構成オブジェクトと定義の関係不正

TP1/EEプロセスダウン。

  • TP1/EE定義とロット構成定義を見直します。

3.

SQLエラー

表,列,行がない

TP1/EEプロセスダウン。

  • TP1/EE定義を見直します。

  • OBM管理表を再作成します。

排他待ち

一定回数リトライする。リトライしてもSQLエラーとなる場合はTP1/EEプロセスダウン。

  • HiRDBが動作しているか確認します。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

表の構成不正

TP1/EEプロセスダウン。

  • OBM管理表を再作成します。

4.

通信エラー

ネゴシエーションをリトライする。一定回数リトライしても通信障害となる場合は,BCSのTP1/EEをオンライン状態にしてからリトライするか,BCSのTP1/EEをプロセスダウンする。

  • BCSのTP1/EE定義を見直します。

  • BCMのTP1/EEが動作しているか確認します。

  • ネットワークの状態を確認します。

BCM,BCSのTP1/EEバージョン不一致

BCSのTP1/EEでOBMの機能の一部を縮退して続行する。

  • BCM,BCSのTP1/EEバージョンを統一します。

BCM,BCSの定義不一致

BCSのTP1/EEでOBMの機能を停止して続行するか,BCSのTP1/EEをプロセスダウンする。

  • BCSのTP1/EE定義を見直します。

5.

SQLエラー

表,列,行がない

BCSのTP1/EEプロセスダウン。

  • OBM管理表を再作成します。

排他待ち

ネゴシエーションをリトライする。一定回数リトライしても通信障害となる場合は,BCSのTP1/EEをオンライン状態にしてからリトライするか,BCSのTP1/EEをプロセスダウンする。

  • HiRDBが動作しているか確認します。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

BCM,BCSの定義不一致

BCSのTP1/EEでOBMの機能を停止して続行するか,BCSのTP1/EEをプロセスダウンする。

  • BCSのTP1/EE定義を見直します。

(2) OBM実行中

図26‒9 OBM実行中の障害発生契機

[図データ]

OBM実行中の障害時動作と対処方法を次の表に示します。表の項番は,図26-9の番号に対応します。

表26‒6 OBM実行中の障害時動作と対処方法

項番

障害

システムの動作

障害後の

OBM状態

対処方法

1.

通信エラー

  • OBM開始コマンド異常終了。

開始コマンド実行前のまま

(未実行/計画停止/強制停止)

  • BCMのTP1/EEの動作状況を確認します。

  • OBM開始コマンドの定義を見直します。

メモリ不足

  • OBM開始コマンド異常終了。

  • OSのパラメタを見直します。

2.

メモリ不足

  • OBM開始コマンド異常終了。

開始コマンド実行前のまま

(未実行/計画停止/強制停止)

  • メモリ関連定義を見直します。

  • ロット構成定義の実行用ロットプール数を見直します。

  • OSのパラメタを見直します。

UOCエラーリターン

  • OBM開始コマンド異常終了。

  • UOCがエラーリターンした原因を調査します。

UOCでスレッドダウン

  • BCMのTP1/EEプロセスダウン。

  • UOCがスレッドダウンした原因を調査します。

SQLエラー

OBM管理表

表,列,行がない

  • BCMのTP1/EEプロセスダウン。

  • OBM管理表を再作成します。

RDエリア不足

  • OBM開始コマンド異常終了。

  • RDエリアを追加,拡張します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達するとOBM開始コマンドが異常終了する。

  • しばらく待ってからOBM開始コマンドを再実行します。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

バッチデータ

表,列がない

  • OBM開始コマンド異常終了。

  • バッチデータを再作成します。

  • ロット構成定義のバッチデータのテーブル名,列名を見直します。

その他

  • リトライする。

  • リトライ回数が上限に達するとOBM開始コマンドが異常終了する。

  • HiRDBが動作しているか確認します。

表構成不正

OBM管理表

  • BCMのTP1/EEプロセスダウン。

  • OBM管理表を再作成します。

バッチデータ

  • OBM開始コマンド異常終了。

  • バッチデータを再作成します。

  • ロット構成定義のバッチデータのテーブル名,列名を見直します。

トランザクションがロールバック決着

  • リトライする。

  • リトライ回数が上限に達するとOBM開始コマンドが異常終了する。

  • HiRDBが動作しているか確認します。

3.

通信障害

  • 終了UOCを起動する。

初期化中→未実行

または

再開始処理中→強制停止

  • BCSのTP1/EEの動作状況を確認します。

メモリ不足

  • 終了UOCを起動する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

4.

トランザクションレベル名不正

  • 終了UOCを起動する。

初期化中→未実行

または

再開始処理中→強制停止

  • OBMのトランザクションレベル名判定UOCを見直します。

UOCでスレッドダウン

  • BCSのTP1/EEプロセスダウン。

  • 終了UOCを起動する。

5.

SQLエラー

OBM管理表

表,列,行がない

  • BCMのTP1/EEプロセスダウン。

初期化中→未実行

または再開始処理中→強制停止

  • OBM管理表を再作成します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達すると終了UOCを起動する。

  • BCSでERを起動する。

  • しばらく待ってからOBM開始コマンドを再実行します。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

オープントランザクション異常終了

  • リトライする。

  • リトライ回数が上限に達すると終了UOCを起動する。

  • 障害の原因によってBCSでER/ESを起動する。

  • トランザクションが異常終了した原因を調査します。

オープントランザクション実行中にBCSのTP1/EEがプロセスダウン

  • 終了UOCを起動する。

  • TP1/EEがプロセスダウンした原因を調査します。

オープントランザクション正常終了後にBCSのTP1/EEがプロセスダウン

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • TP1/EEがプロセスダウンした原因を調査します。

6.

通信障害

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • 通信障害の原因を調査します。

  • BCMのTP1/EEの動作状況を調査します。

メモリ不足

  • クローズトランザクションを起動する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

7.

SQLエラー

バッチデータ

表,列がない

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • バッチデータを再作成します。

その他

  • リトライする。

  • リトライ回数が上限に達するとクローズトランザクションを起動する。

  • HiRDBが動作しているか確認します。

8.

通信障害

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • BCSのTP1/EEの動作状況を確認します。

メモリ不足

  • クローズトランザクションを起動する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

9.

サービス名不正

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • サービス名決定UOCを見直します。

  • バッチデータを見直します。

UOCでスレッドダウン

  • BCSのTP1/EEプロセスダウン。

  • クローズトランザクションを起動する。

  • サービス名決定UOCを見直します。

10.

トランザクションレベル名不正

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • OBMのトランザクションレベル名判定UOCを見直します。

  • バッチデータを見直します。

UOCでスレッドダウン

  • BCSのTP1/EEプロセスダウン。

  • クローズトランザクションを起動する。

  • OBMのトランザクションレベル名判定UOCを見直します。

11.

SQLエラー

OBM管理表

表,列,行がない

  • BCMのTP1/EEプロセスダウン。

実行中→クローズ中→停止処理中→強制停止

  • OBM管理表を再作成します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達するとクローズトランザクションを起動する。

  • BCSでERを起動する。

  • しばらく待ってからOBM開始コマンドを再実行します。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

ノーマルトランザクション異常終了

  • リトライする。

  • リトライ回数が上限に達するとクローズトランザクションを起動する。

  • 障害の原因によってBCSでER/ESを起動する。

  • トランザクションが異常終了した原因を調査します。

BCSのTP1/EEがプロセスダウン

  • クローズトランザクションを起動する。

  • TP1/EEがプロセスダウンした原因を調査します。

12.

通信障害

  • クローズトランザクションを起動する。

実行中→クローズ中→停止処理中→強制停止

  • 通信障害の原因を調査します。

  • BCMのTP1/EEの動作状況を調査します。

メモリ不足

  • クローズトランザクションを起動する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

13.

SQLエラー

OBM管理表

表,列,行がない

  • BCMのTP1/EEプロセスダウン。

一時休止

  • OBM管理表を再作成します。

排他待ち

  • 一時休止する。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

14.

通信障害

  • 別のBCS,またはBCMでクローズトランザクションを起動する。

  • クローズトランザクションを起動できなければ終了UOCを起動する。

クローズ中→停止処理中→強制停止

  • BCSのTP1/EEの動作状況を確認します。

メモリ不足

  • 別のBCS,またはBCMでクローズトランザクションを起動する。

  • クローズトランザクションを起動できるサーバがなければ終了UOCを起動する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

15.

トランザクションレベル名不正

  • 終了UOCを起動する。

停止処理中→強制停止

  • OBMのトランザクションレベル名判定UOCを見直します。

UOCでスレッドダウン

  • BCSのTP1/EEプロセスダウン。

  • 終了UOCを起動する。

16.

SQLエラー

OBM管理表

表,列,行がない

  • BCMのTP1/EEプロセスダウン。

前の状態のまま

  • OBM管理表を再作成します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達すると一時休止。

  • BCSでERを起動する。

停止処理中→強制停止

  • しばらく待ってからOBM開始コマンドを再実行します。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

クローズトランザクション異常終了

  • リトライする。

  • リトライ回数が上限に達すると終了UOCを起動する。

  • 障害の原因によってBCSでER/ESを起動する。

  • トランザクションが異常終了した原因を調査します。

クローズトランザクション実行中にBCSのTP1/EEがプロセスダウン

  • 終了UOCを起動する。

停止処理中→強制停止

  • TP1/EEがプロセスダウンした原因を調査します。

クローズトランザクション正常終了後にBCSがプロセスダウン

  • 終了UOCを起動する。

終了中,または停止処理中

  • TP1/EEがプロセスダウンした原因を調査します。

17.

通信障害

  • 終了UOCを起動する。

終了中,または停止処理中

  • BCMのTP1/EEの動作状況を確認します。

メモリ不足

  • 終了UOCを起動する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

18.

メモリ不足

強制停止。

強制停止

  • メモリ関連定義を見直します。

  • ロット構成定義の実行用ロットプール数を見直します。

  • OSのパラメタを見直します。

UOCエラーリターン

  • UOCがエラーリターンした原因を調査します。

UOCでスレッドダウン

  • BCMのTP1/EEプロセスダウン。

前の状態のまま

  • UOCがスレッドダウンした原因を調査します。

SQLエラー

OBM管理表

表,列,行がない

  • OBMのTP1/EEプロセスダウン

  • OBM管理表を再作成します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達すると一時休止。

一時休止

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

バッチデータ

表,列,行がない

  • UOCを呼び出さないで強制停止。

強制停止

  • バッチデータを再作成します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達するとUOCを呼び出さないで強制停止。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

表構成不正

OBM管理表

  • BCMのTP1/EEプロセスダウン。

前の状態のまま

  • OBM管理表を再作成します。

トランザクションがロールバック決着

  • リトライする。

  • リトライ回数が上限に達すると一時休止。

一時休止

  • HiRDBが動作しているか確認します。

19.

通信障害

  • OBM開始コマンドが異常終了する。

未実行,強制停止,

または計画停止

  • OBMの状態を確認します。

  • 未実行状態の場合は,OBM実行結果ファイルで結果を確認します。

メモリ不足

  • OBM開始コマンドが異常終了する。

20.

BCMのTP1/EEプロセスダウン

  • OBM開始コマンドが異常終了する。

  • OBMのトランザクション実行中のBCSは,仕掛かり中のトランザクション終了後に,新たなトランザクションの起動をしない。

前の状態のまま(BCMのTP1/EE再開始時に強制停止状態にする)

  • TP1/EEがプロセスダウンした原因を調査します。

21.

OBM開始コマンドプロセスダウン

  • OBMを強制停止する。ただし,OBMを停止/終了するトランザクションが正常終了している場合は,停止/終了処理を続行する。

未実行,強制停止,または計画停止

  • OBMの状態を確認します。

  • 未実行状態の場合は,OBM実行結果ファイルで結果を確認します。

注※

一時休止の解除監視の対象外です。一時休止の解除監視は,HiRDBダウンを想定し,(HAモニタを使用した系切り替えなどによって)HiRDBが再開始されたら自動的に一時休止を解除するのが目的です。ユーザ運用ミスによってバッチデータを削除した場合は,自動的に回復することはあり得ないため,監視の対象外とします。

(3) TP1/EE処理終了中(BCMの終了中)

図26‒10 BCM終了中に発生する障害と対処方法

[図データ]

TP1/EE処理終了中(BCMの終了中)で発生する障害と対処方法を次の表に示します。表の項番は,図26-10の番号に対応します。

表26‒7 BCM終了時に発生する障害と対処方法

項番

障害

システムの動作

対処方法

1.

通信エラー

  • オンライン終了処理を続行する。

  • BCSのTP1/EEの動作状況を確認します。

メモリ不足

  • オンライン終了処理を続行する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。

2.

SQLエラー

OBM管理表

表,列,行がない

  • OBMのTP1/EEプロセスダウン。

  • OBM管理表を再作成します。

排他待ち

  • リトライする。

  • リトライ回数が上限に達するとオンライン終了処理を続行する。

  • OBM管理表に排他を持ったままのトランザクションがないか確認します。

その他

  • HiRDBが動作しているか確認します。

表構成不正

OBM管理表

  • BCMのTP1/EEプロセスダウン。

  • OBM管理表を再作成します。

(4) TP1/EE処理終了中(BCSの終了中)

図26‒11 BCS終了中に発生する障害と対処方法

[図データ]

TP1/EE処理終了中(BCSの終了中)で発生する障害と対処方法を次の表に示します。表の項番は,図26-11の番号に対応します。

表26‒8 BCS終了時に発生する障害と対処方法

項番

障害

システムの動作

対処方法

1.

通信エラー

  • オンライン終了処理を続行する。

  • BCMのTP1/EEの動作状況を確認します。

メモリ不足

  • オンライン終了処理を続行する。

  • メモリ関連定義を見直します。

  • OSのパラメタを見直します。