1.3.2 UAP稼働状況の監視
必要なリソースを確保できない状況でUAPが動作した場合やトランザクション連携先のデータベースシステムなどに異常が発生した場合,次に示す問題が起こるおそれがあります。
-
OS,OpenTP1,データベースなどの提供関数の応答時間の遅延に伴って,UAPのサービス処理時間が長くなることによるスループットの低下,およびRPCタイムアウトの発生。
-
OS,OpenTP1,データベースなどの提供関数がエラーリターンすることによるトランザクションのロールバック,またはUAPの異常終了。
このため,OpenTP1上で動作するUAPの稼働状況を監視することは重要です。UAPが正常に稼働しているかどうかは,次に示す項目を監視することで確認できます。
-
サービス処理時間
-
RPCタイムアウト回数
-
異常終了回数
-
トランザクションロールバック回数
- 〈この項の構成〉
(1) 関連する監視テンプレート
OpenTP1上で動作するUAPの稼働状況を監視するために使用できる監視テンプレートを次の表に示します。
アラーム |
使用レコード |
使用フィールド |
異常条件 |
警告条件 |
---|---|---|---|---|
Rollbacks |
PI |
ロールバック決着回数 |
Rollbacks > 2 |
Rollbacks > 1 |
RPC Time Out |
PI |
RPCタイムアウト件数(サービス単位) |
RPC Time Out > 50 |
RPC Time Out > 10 |
RTS Branch Time |
PI_RTSS |
トランザクションブランチ実行時間(サービス単位) |
Event ID = 1906 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Average ≧ 2,000,000 |
Event ID = 1906 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Average ≧ 1,000,000 |
RTS Rollbacks |
PI_RTSS |
ロールバック決着回数(サービス単位) |
Event ID = 1901 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Counts ≧ 2 |
Event ID = 1901 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Counts ≧ 1 |
RTS RPC Time Out |
PI_RTSS |
RPCタイムアウト件数(サービス単位) |
Event ID = 1731 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Counts ≧ 50 |
Event ID = 1731 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Counts ≧ 10 |
RTS SCD Waits |
PI_RTSS |
スケジュール待ち数(サーバ単位) |
Event ID = 1800 AND Sv Name = "basespp"※1 AND Svc Name = "_SERVER ONLY" AND Average ≧ 600 |
Event ID = 1800 AND Sv Name = "basespp"※1 AND Svc Name = "_SERVER ONLY" AND Average ≧ 400 |
RTS SCD Stay Time |
PI_RTSS |
スケジュール滞留時間(サーバ単位) |
Event ID = 1804 AND Sv Name = "basespp"※1 AND Svc Name = "_SERVER ONLY" AND Average ≧ 2,000,000 |
Event ID = 1804 AND Sv Name = "basespp"※1 AND Svc Name = "_SERVER ONLY" AND Average ≧ 1,000,000 |
RTS Svc Time |
PI_RTSS |
ユーザーサービス実行時間(サービス単位) |
Event ID = 1730 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Average ≧ 2,000,000 |
Event ID = 1730 AND Sv Name = "basespp"※1 AND Svc Name = "update"※2 AND Average ≧ 1,000,000 |
RTS UAP Terminates |
PI_RTSS |
UAP異常終了回数(サーバ単位) |
Event ID = 1501 AND Sv Name = "basespp"※1 AND Svc Name = "_SERVER ONLY" AND Counts ≧ 3 |
Event ID = 1501 AND Sv Name = "basespp"※1 AND Svc Name = "_SERVER ONLY" AND Counts ≧ 2 |
UAP Terminates |
PI |
UAP異常終了回数 |
UAP Terminates > 3 |
UAP Terminates > 2 |
- 注※1
-
ご使用の環境の監視対象のサーバ名に変更してください。
- 注※2
-
ご使用の環境の監視対象のサービス名に変更してください。
(2) 監視方法
- サービス処理時間の監視
-
特定のサービスの処理時間は,RTS Svc Timeアラームを使用して監視できます。スケジュール待ち数,スケジュール滞留時間,トランザクションブランチ実行時間などを監視することで,さらに詳細に監視できます。これらは次に示すアラームを使用して監視します。
-
スケジュール待ち数の監視
スケジュール待ち数を監視する場合,RTS SCD Waitsアラームを使用します。特定のUAPのスケジュールキューに滞留されたサービス要求数を監視できます。
-
スケジュール滞留時間の監視
スケジュール滞留時間を監視する場合,RTS SCD Stay Timeアラームを使用します。サービス要求が特定のUAPのスケジュールキューに滞留されてから取り出されるまでの時間を監視できます。
-
トランザクションブランチ実行時間の監視
トランザクションブランチ実行時間を監視する場合,RTS Branch Timeアラームを使用します。特定のUAPのサービスをトランザクションとして開始してから,同期点処理が完了するまでの時間を監視できます。
-
- RPCタイムアウト回数の監視
-
OpenTP1システム全体でのRPCタイムアウト回数は,RPC Time Outアラームを使用して監視できます。また,特定のサービスで発生したRPCタイムアウト回数は,RTS RPC Time Outアラームを使用することで監視できます。
- 異常終了回数の監視
-
OpenTP1システム全体でのUAP異常終了回数は,UAP Terminatesアラームを使用して監視できます。また,特定のUAPの異常終了回数は,RTS UAP Terminatesアラームを使用することで監視できます。
- トランザクションロールバック回数の監視
-
OpenTP1システム全体でのトランザクションロールバック回数は,Rollbacksアラームを使用して監視できます。また,特定のサービスのトランザクションロールバック回数は,RTS Rollbacksアラームを使用することで監視できます。
ここで説明したアラームによって異常を検知した場合,次に示す監視テンプレートを使用することでUAPの状況を確認できます。
-
Message Logレポート
Message Logレポートによって,OpenTP1の出力メッセージを表示させて,異常が発生したUAP,要因などを確認できます。
-
Process Detailレポート
Process Detailレポートによって,UAPプロセスの稼働状況を確認できます。
-
Schedule Detailレポート
スケジュールキューの状態,サービス要求の滞留数,UAPの異常終了などに伴うサービスグループの閉塞状況を確認できます。
-
Transaction Detailレポート
トランザクション状況を確認できます。
さらに詳細な状況や原因を調査したい場合は,OpenTP1やOSが出力するログ,提供コマンドなどを使用してください。