Hitachi

JP1 Version 12 JP1/Performance Management - Agent Option for OpenTP1


1.3.2 UAP稼働状況の監視

必要なリソースを確保できない状況でUAPが動作した場合やトランザクション連携先のデータベースシステムなどに異常が発生した場合,次に示す問題が起こるおそれがあります。

このため,OpenTP1上で動作するUAPの稼働状況を監視することは重要です。UAPが正常に稼働しているかどうかは,次に示す項目を監視することで確認できます。

〈この項の構成〉

(1) 関連する監視テンプレート

OpenTP1上で動作するUAPの稼働状況を監視するために使用できる監視テンプレートを次の表に示します。

表1‒1 UAP稼働状況の監視で使用できる監視テンプレート

アラーム

使用レコード

使用フィールド

異常条件

警告条件

Rollbacks

PI

ロールバック決着回数

Rollbacks > 2

Rollbacks > 1

RPC Time Out

PI

RPCタイムアウト件数(サービス単位)

RPC Time Out > 50

RPC Time Out > 10

RTS Branch Time

PI_RTSS

トランザクションブランチ実行時間(サービス単位)

Event ID = 1906

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Average ≧ 2,000,000

Event ID = 1906

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Average ≧ 1,000,000

RTS Rollbacks

PI_RTSS

ロールバック決着回数(サービス単位)

Event ID = 1901

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Counts ≧ 2

Event ID = 1901

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Counts ≧ 1

RTS RPC Time Out

PI_RTSS

RPCタイムアウト件数(サービス単位)

Event ID = 1731

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Counts ≧ 50

Event ID = 1731

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Counts ≧ 10

RTS SCD Waits

PI_RTSS

スケジュール待ち数(サーバ単位)

Event ID = 1800

AND Sv Name = "basespp"※1

AND Svc Name = "_SERVER ONLY"

AND Average ≧ 600

Event ID = 1800

AND Sv Name = "basespp"※1

AND Svc Name = "_SERVER ONLY"

AND Average ≧ 400

RTS SCD Stay Time

PI_RTSS

スケジュール滞留時間(サーバ単位)

Event ID = 1804

AND Sv Name = "basespp"※1

AND Svc Name = "_SERVER ONLY"

AND Average ≧ 2,000,000

Event ID = 1804

AND Sv Name = "basespp"※1

AND Svc Name = "_SERVER ONLY"

AND Average ≧ 1,000,000

RTS Svc Time

PI_RTSS

ユーザーサービス実行時間(サービス単位)

Event ID = 1730

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Average ≧ 2,000,000

Event ID = 1730

AND Sv Name = "basespp"※1

AND Svc Name = "update"※2

AND Average ≧ 1,000,000

RTS UAP Terminates

PI_RTSS

UAP異常終了回数(サーバ単位)

Event ID = 1501

AND Sv Name = "basespp"※1

AND Svc Name = "_SERVER ONLY"

AND Counts ≧ 3

Event ID = 1501

AND Sv Name = "basespp"※1

AND Svc Name = "_SERVER ONLY"

AND Counts ≧ 2

UAP Terminates

PI

UAP異常終了回数

UAP Terminates > 3

UAP Terminates > 2

注※1

ご使用の環境の監視対象のサーバ名に変更してください。

注※2

ご使用の環境の監視対象のサービス名に変更してください。

(2) 監視方法

サービス処理時間の監視

特定のサービスの処理時間は,RTS Svc Timeアラームを使用して監視できます。スケジュール待ち数,スケジュール滞留時間,トランザクションブランチ実行時間などを監視することで,さらに詳細に監視できます。これらは次に示すアラームを使用して監視します。

  • スケジュール待ち数の監視

    スケジュール待ち数を監視する場合,RTS SCD Waitsアラームを使用します。特定のUAPのスケジュールキューに滞留されたサービス要求数を監視できます。

  • スケジュール滞留時間の監視

    スケジュール滞留時間を監視する場合,RTS SCD Stay Timeアラームを使用します。サービス要求が特定のUAPのスケジュールキューに滞留されてから取り出されるまでの時間を監視できます。

  • トランザクションブランチ実行時間の監視

    トランザクションブランチ実行時間を監視する場合,RTS Branch Timeアラームを使用します。特定のUAPのサービスをトランザクションとして開始してから,同期点処理が完了するまでの時間を監視できます。

RPCタイムアウト回数の監視

OpenTP1システム全体でのRPCタイムアウト回数は,RPC Time Outアラームを使用して監視できます。また,特定のサービスで発生したRPCタイムアウト回数は,RTS RPC Time Outアラームを使用することで監視できます。

異常終了回数の監視

OpenTP1システム全体でのUAP異常終了回数は,UAP Terminatesアラームを使用して監視できます。また,特定のUAPの異常終了回数は,RTS UAP Terminatesアラームを使用することで監視できます。

トランザクションロールバック回数の監視

OpenTP1システム全体でのトランザクションロールバック回数は,Rollbacksアラームを使用して監視できます。また,特定のサービスのトランザクションロールバック回数は,RTS Rollbacksアラームを使用することで監視できます。

ここで説明したアラームによって異常を検知した場合,次に示す監視テンプレートを使用することでUAPの状況を確認できます。

さらに詳細な状況や原因を調査したい場合は,OpenTP1やOSが出力するログ,提供コマンドなどを使用してください。