付録E.1 システム統計情報
システム統計情報の詳細を次の表に示します。
統計情報種別 |
事象(取得値) |
詳細内容 |
dcreport編集用ID※1 |
jnlsttsコマンド出力メッセージ(イベント(取得値))※2 |
---|---|---|---|---|
RPC情報 |
RPCコール (レスポンスタイム) |
クライアント側でdc_rpc_callおよびdc_rpc_call_to内でサーバに要求を送信してからサーバから応答を受け取るまでの時間。 dc_rpc_callおよびdc_rpc_call_toが成功した場合に取得します。
<発生件数> dc_rpc_callおよびdc_rpc_call_to発行回数 |
1 |
rpcコール(レスポンスタイム) |
ユーザサービス実行 (実行時間) |
dc_rpc_callおよびdc_rpc_call_toで要求したサービス関数の実行開始から,サービス関数でreturnを発行するまでの時間。 dc_rpc_mainloopの中で取得します。 <発生件数> dc_rpc_callおよびdc_rpc_call_to発行回数 |
2 |
ユーザサービス実行(実行時間) |
|
RPCタイムアウト |
RPCの応答待ちの処理で発生したタイムアウトエラー。 <発生件数> 上記タイムアウトエラーの発生件数 |
3 |
rpcタイムアウト |
|
RPC障害 |
RPCの処理の内部で発生した障害。 <発生件数> 上記障害の発生件数 |
4 |
rpc障害 |
|
スケジュール情報 |
スケジュール待ち (待ち行列長) |
該当するユーザサーバ(SPP/MHP)のスケジュールキューに滞留したサービス要求数。 この値が大きい場合は,ユーザサービス定義のparallel_countオペランドに指定する常駐プロセス数を大きくします。また,非常駐プロセスがある場合は,必要に応じてbalance_countオペランドの指定値を小さくして非常駐プロセスを起動しやすくします。 この値が小さい場合は,必要であればユーザサービス定義のparallel_countオペランドに指定する常駐プロセス数を小さくします。また,非常駐プロセスがある場合は,必要に応じてbalance_countオペランドの指定値を大きくして非常駐プロセスを起動しにくくします。平均値と最大値に差がある場合はparallel_countオペランドに指定する常駐プロセス数と非常駐プロセス数の比率や最大プロセス数を調整します。 <発生件数> SPPの場合:クライアントが該当するユーザサーバに対して行ったサービス要求(dc_rpc_call)の回数 MHPの場合:MCFがMHPに対して行った起動要求の回数 |
11 |
スケジュール待ち |
スケジュール (メッセージサイズ) |
該当するユーザサーバ(SPP/MHP)が受信したサービス要求メッセージ長。 メッセージ長にはシステムが付加する制御情報(512バイト)が加算されています。 ユーザサービス定義のmessage_buflenオペランドにはメッセージサイズ(最大)の値を指定することをお勧めします。 ユーザサービス定義のmessage_store_buflenオペランドには,下記の範囲の値を指定することをお勧めします。 メッセージサイズ(平均)×待ち行列長(最大) ≦ message_store_buflen ≦ メッセージサイズ(最大)×待ち行列長(最大) <発生件数> SPPの場合:クライアントが該当するユーザサーバに対して行ったサービス要求(dc_rpc_call)の回数 MHPの場合:MCFがMHPに対して行った起動要求の回数 |
12 |
スケジュール(メッセージサイズ) |
|
メッセージ格納バッファプールの使用中サイズ |
該当するユーザサーバ(SPP/MHP)のメッセージ格納バッファプールの使用中サイズ長。ただし,メッセージ格納バッファプールを共用している場合は所属しているスケジュールバッファグループの共用メッセージ格納バッファプールの値となります。 <発生件数> SPPの場合:クライアントが該当するユーザサーバに対して行ったサービス要求(dc_rpc_call)の回数 MHPの場合:MCFがMHPに対して行った起動要求の回数 |
13 |
使用中バッファサイズ |
|
メッセージ格納バッファプール不足によってスケジュールできなかったメッセージサイズ |
該当するユーザサーバ(SPP/MHP)へのサービス要求のうち,メッセージ格納バッファプール不足によって,スケジュールできなかったサービス要求メッセージ長。 <発生件数> SPPの場合:クライアントが該当するユーザサーバに対して行ったサービス要求(dc_rpc_call)のうち,メッセージ格納バッファプール不足でスケジュールできなかったサービス要求の回数 MHPの場合:MCFがMHPに対して行った起動要求のうち,メッセージ格納バッファプール不足でスケジュールできなかったサービス要求の回数 |
14 |
バッファ不足メッセージサイズ |
|
ロック情報 |
ロック取得(待ち時間) |
ロック待ちが発生した時の待ち状態になってから待ち状態が解除されるまでの時間。 ここでいうロックとは,dc_lck_getと,DAM,TAM,およびMQAが発行するロックサービスの内部ロックを指します。 <発生件数> ロック待ちの発生件数 |
21 |
ロック取得(待ち時間) |
ロック待ち (待ち行列長) |
ロック待ちが発生した時の待ち行列長。 <発生件数> ロック待ちの発生件数 |
22 |
ロック待ち(待ち行列長) |
|
デッドロック |
デッドロックの発生件数。 <発生件数> 上記に同じ |
23 |
デッドロック |
|
DAM情報 |
read(入力長) |
dc_dam_readを発行した単位でのDAMファイルのデータの入力長。 <発生件数> dc_dam_read発行回数 |
31 |
read(入力長) |
readエラー |
dc_dam_readの中でOSとのインタフェース部分で発生した障害。API引数不正などのエラーは発生件数としてカウントされません。 <発生件数> 上記の障害発生件数 |
32 |
readエラー |
|
write(出力長) |
dc_dam_writeまたはdc_dam_rewriteを発行した単位でのDAMファイルのデータの出力長。 <発生件数> dc_dam_write,dc_dam_rewrite発行回数 |
33 |
write(出力長) |
|
writeエラー |
実際のディスクとのI/O時に発生した出力障害。API引数不正などのエラーは発生件数としてカウントされません。 <発生件数> 上記の発生件数 |
34 |
writeエラー |
|
更新バッファ使用(更新サイズ) |
回復用ジャーナル(FJ)のジャーナル量。DAMを使用した際のジャーナル量を計算することでジャーナルファイルの大きさ,数をチューニングします。 <発生件数> 上記ジャーナルの取得回数 |
35 |
更新バッファ使用(更新サイズ) |
|
トランザクションブランチ内最初のDAM API発行(全トランザクションブランチ数) |
DAMを使用するトランザクション数。この最大値はDAMを使用するトランザクションのピークに当たります。この最大値をDAMサービス定義のdam_tran_process_countに指定すると,トランザクション用メモリ(TP1/Server Baseの動的共用メモリ量)が最適になります。 <発生件数> 取得しません。 |
36 |
全トランザクションブランチ数 |
|
共用メモリキャッシュブロック確保要求 |
リソースマネジャ用共用メモリプール内に確保するDAMファイルのデータ用ブロックを確保した回数。 <発生件数> 上記の発生件数 |
38 |
キャッシュブロック確保要求数 |
|
共用メモリ確保 (共用メモリプール使用率) |
定期的にリソースマネジャ用共用メモリプールの使用率を取得。この値を参考にリソースマネジャ用共用メモリのサイズ(DAMサービス定義のdam_cache_size)を決定することをお勧めします。ただし,この統計情報は,ディファード更新指定のDAMファイルを更新するトランザクションだけを出力します。 最大値が100%に近くなるとUAPがダウンすることが多くなるため,その時はdam_cache_sizeを大きくする必要があります。 <発生件数> ディファード更新指定のDAMファイルを更新したトランザクション数を10で割った回数 |
39 |
共用メモリプール使用率 |
|
プロセス情報 |
UAP異常終了 |
UAPプロセスの異常終了。 <発生件数> 異常終了したUAPプロセスの累積値 |
41 |
uapダウン |
システムサーバ異常終了 |
システムサービスプロセスの異常終了。 <発生件数> 異常終了したシステムサービスプロセスの累積値 |
42 |
システムサーバダウン |
|
プロセス生成 (全プロセス数) |
一定間隔でのOpenTP1システムで起動されているシステムサービスとUAPプロセス数。 <発生件数> 取得しません。 |
43 |
プロセス生成(全プロセス数) |
|
TAM情報 |
TAMファイル実更新 (書き込みバイト数) |
オンライン中にTAMファイルに対して実更新したデータのバイト数(通算値)。 1回当たりの平均実更新バイト数は次の式で求めます。
前回取得データがない場合は,次の式で求めます。
<発生件数> TAMファイルにデータを更新した回数の総和。TAMファイルに実更新を行う契機はタイマ起動,cpd,tamholdなどがあります。 |
51 |
テーブルファイル実更新 |
コミット,ロールバック (レコード参照件数) |
1回のトランザクションで参照したレコード数。この値はTAMサーバコミット処理で統計出力しているため,dc_tam_readの発行有無にかかわらず発生件数はカウントされます。したがって,dc_tam_readを発行しないシステムでは発生件数だけカウントされ,最大値,最小値,および平均値は0となります。 <発生件数> TAMに関するコミット,ロールバックの回数 |
55 |
tamレコード参照回数 |
|
コミット,ロールバック (レコード更新件数) |
1回のトランザクションで更新したレコード数。この値はTAMサーバコミット処理で統計出力しているため,dc_tam_writeの発行有無にかかわらず発生件数はカウントされます。したがって,dc_tam_writeを発行しないシステムでは発生件数だけカウントされ,最大値,最小値,および平均値は0となります。 <発生件数> TAMに関するコミット,ロールバックの回数 |
56 |
tamレコード更新回数 |
|
トランザクション情報 |
コミット |
トランザクションのコミット決着。 <発生件数> トランザクションのコミット決着回数 |
61 |
コミット |
ロールバック |
トランザクションのロールバック決着。 <発生件数> トランザクションのロールバック決着回数 |
62 |
ロールバック |
|
ネーム情報 |
キャッシュヒット |
サービス情報キャッシュ領域に設定されたサービス情報のそのノードでの参照回数。 サービス情報キャッシュ領域とはネームサービスと異なったノードで起動されたサーバとのサービス情報を設定している領域をいい,サーバとのRPCに必要なアドレス情報をサービス情報といいます。 クライアントからサービス情報の参照が要求され,かつクライアントと同じノードのネームサービスにサービスの情報が設定されていなかった場合に設定されます。 <発生件数> 上記の情報の参照回数 |
71 |
キャッシュヒット |
ローカルヒット |
サービス情報ローカル領域に設定されたサービス情報のそのノードでの参照回数。 サービス情報ローカル領域とはネームサービスと同一のノードで起動されたサーバのサービス情報を設定している領域をいいます。サーバが起動された場合に設定されます。 <発生件数> 上記の情報の参照回数 |
72 |
ローカルヒット |
|
lookup |
そのノードでのサービス情報の参照要求。 サービス情報ローカル領域,サービス情報キャッシュ領域のどちらの場合も,どの領域にもサービス情報が設定されていない場合もカウントされます。 <発生件数> 上記の参照要求回数 |
73 |
lookup |
|
チェックポイントダンプ情報 |
チェックポイントダンプ取得 (取得間隔) |
チェックポイント契機間隔。前回のチェックポイントから今回のチェックポイントまでの時間間隔をいいます。 チェックポイントは,一定のジャーナルブロックの出力数によって発生するため,その頻度を時間で評価します。 <発生件数> チェックポイントダンプ契機数 |
81 |
cpd取得(取得間隔) |
チェックポイントダンプ有効化 (取得時間) |
チェックポイントダンプ取得契機発生から有効化までの時間。チェックポイントダンプ取得契機が発生し,各システムサーバで取得処理を開始してから有効化が完了するまでの時間をいいます。 <発生件数> チェックポイントダンプ契機数 |
82 |
cpd有効化(取得時間) |
|
メッセージキュー情報 |
readメッセージ (入力長) |
キューファイルから読み込んだメッセージ長。 <発生件数> 読み込んだメッセージ長 |
91 |
readメッセージ(入力長) |
writeメッセージ (出力長) |
キューファイルに書き込んだメッセージ長。 <発生件数> 書き込んだメッセージ長 |
92 |
writeメッセージ(出力長) |
|
readエラー |
物理ファイルからの入力でのFILサーバでの障害(異常ケース)。 <発生件数> 上記の障害発生件数 |
93 |
readエラー |
|
writeエラー |
物理ファイルへの出力でのFILサーバでの障害(異常ケース)。 <発生件数> 上記の障害発生件数 |
94 |
writeエラー |
|
空きバッファ待ち |
該当するキューファイルに要求が集中し,必要な入出力バッファが不足した回数。この値によってメッセージキューサービス定義の入出力バッファ数を見直してください。 <発生件数> 上記の発生件数 |
95 |
空きバッファ待ち |
|
実read |
メッセージが入出力バッファにない場合の物理ファイルからの入力。この値を少なくするには,メッセージキューサービス定義の入出力バッファ数を大きくしてください。 <発生件数> 上記の入力回数 |
96 |
実read |
|
実write |
物理ファイルへの出力。 この値と上記のwriteメッセージの回数を比較すると,write要求がどれだけまとめてI/Oされたかがわかります。 I/O回数を少なくする場合は,メッセージキューサービス定義の入出力バッファ数を大きくしてください。 遅延書き込み機能使用時は,物理ファイルへの出力は「遅延書き込み(実write回数)」でカウントされるため,この件数は0にすることが理想的です。 <発生件数> 上記の出力回数 |
97 |
実write |
|
遅延書き込み (実write回数) |
遅延書き込み機能使用時の遅延書き込みによる物理ファイルへの出力。 <発生件数> 上記の出力回数 |
99 |
遅延書き込み回数 |
|
物理ファイル単位の遅延書き込み (遅延書き込み対象となったレコード数) |
メッセージキューサービス定義の入出力バッファ数 (quegrp -nオプション)チューニング用取得値。 <発生件数> 遅延書き込み対象となったレコード数 |
151 |
遅延書き込みレコード数 |
|
物理ファイル単位の遅延書き込み (遅延書き込み対象となったメッセージの割合) |
メッセージキューサービス定義の入出力バッファ数 (quegrp -nオプション)チューニング用取得値。 <発生件数> 遅延書き込み対象となったメッセージの割合 |
152 |
遅延書き込みレコード割合 |
|
ジャーナル情報 |
バッファ満杯 |
システムでジャーナルバッファは並列ディスクアクセス数×2+1あり,この内1面がカレントバッファに当たります。 ジャーナルレコードをこのカレントバッファにバッファリングしようとした時にバッファの空きエリアが小さく,該当するバッファにバッファリングできない状態をいいます。 <発生件数> 上記事象の発生件数 |
102 |
バッファ満杯 |
空きバッファ待ち |
ジャーナルバッファがすべて満杯,または出力中の場合にジャーナルレコードをすぐにはバッファリングできないで,バッファが空くのを待っている状態。 <発生件数> 上記事象の発生件数 |
103 |
空きバッファ待ち |
|
ジャーナル出力 (ブロック長) |
ジャーナルブロックのデータ長。 この値から単位時間に発生したジャーナル量の目安を得ることができます。 <発生件数> ジャーナルブロックの出力回数 |
104 |
ジャーナル出力(ブロック長) |
|
ジャーナル出力 (非バス部分データ長) |
OpenTP1内部情報。 <発生件数> 上記事象の発生回数 |
105 |
非バス部分データ長 |
|
入出力待ち (待ちバッファ面数) |
ジャーナル出力完了時に出力待ちをしているバッファ面数。ただし,平均値の小数点以下が切り捨てられないように,100倍した値を出力しています。 <発生件数> ジャーナル出力完了回数 |
107 |
I/O待ち(待ちバッファ面数) |
|
write |
ジャーナルデータだけでなく,ジャーナルスワップ時のファイル管理情報も含めたシステムの内部的な出力回数。 <発生件数> 上記の出力回数 |
108 |
write |
|
writeエラー |
ジャーナルファイルへの出力時に起きた障害。 <発生件数> 上記の障害発生回数 |
109 |
writeエラー |
|
スワップ(スワップ時間) |
ジャーナルファイルをスワップする際のオーバヘッド時間。 <発生件数> ジャーナルファイルをスワップした回数 |
110 |
スワップ(スワップ時間) |
|
ジャーナル入力 (データ長) |
ジャーナルファイルから入力したデータ長。 <発生件数> ジャーナルファイルからデータを入力した回数 |
111 |
ジャーナル入力(データ長) |
|
read |
ジャーナルデータだけでなく,ジャーナルスワップ時のファイル管理情報も含めたシステムの内部的な入力回数。 <発生件数> 上記の入力回数 |
113 |
read |
|
readエラー |
ジャーナルファイルからの入力時に起きた障害。 <発生件数> 上記の障害発生回数 |
114 |
readエラー |
|
MCF情報 |
メモリキューへのメッセージ入力 |
OpenTP1ノード内のメモリキューに対するメッセージ書き込み。 <発生件数> 上記のメッセージ書き込み回数 |
121 |
メッセージ入力(メモリ) |
ディスクキューへのメッセージ入力 |
OpenTP1ノード内のディスクキューに対するメッセージ書き込み。 <発生件数> 上記のメッセージ書き込み回数 |
122 |
メッセージ入力(ディスク) |
|
メモリキューからのメッセージ出力 |
OpenTP1ノード内のメモリキューからのメッセージ取り出し。 <発生件数> 上記のメッセージ取り出し回数 |
123 |
メッセージ出力(メモリ) |
|
ディスクキューからのメッセージ出力 |
OpenTP1ノード内のディスクキューからのメッセージ取り出し。 <発生件数> 上記のメッセージ取り出し回数 |
124 |
メッセージ出力(ディスク) |
|
コネクション障害によるコネクション切断 |
OpenTP1ノード内で発生したコネクション障害。 <発生件数> 上記障害の発生件数 |
125 |
コネクション障害 |
|
共用メモリ管理情報 |
静的共用メモリ使用サイズ |
静的共用メモリブロックの確保・解放処理後の静的共用メモリブロックの総使用サイズ。 <発生件数> 編集対象時間内に取得した統計情報ジャーナルの件数+静的共用メモリ確保・解放関数発行回数 |
131 |
静的共用メモリ(取得サイズ) |
静的共用メモリプール必要最大サイズ |
静的共用メモリブロックの使用サイズの最大値。ブロックの確保・解放処理後にそれ以前のプールサイズを更新した場合に取得します。プールサイズとは,いったん確保した共用メモリを解放したことによってプール内が断片化した場合のこの断片部分を含めた使用中共用メモリのサイズの合計です。 したがって,システム環境定義のstatic_shmpool_sizeに設定する値はこの値以上にしてください。 <発生件数> 静的共用メモリ使用サイズと同じ(ただし,それ以前のプールサイズを更新した場合) |
132 |
静的共用メモリ(プールサイズ) |
|
動的共用メモリ使用サイズ |
動的共用メモリブロックの確保・解放処理後の動的共用メモリブロックの総使用サイズ。 <発生件数> 編集対象時間内に取得した統計情報ジャーナルの件数+動的共用メモリ確保・解放関数発行回数 |
133 |
動的共用メモリ(取得サイズ) |
|
動的共用メモリプール必要最大サイズ |
動的共用メモリブロックの使用サイズの最大値。 ブロックの確保・解放処理後にそれ以前のプールサイズを更新した場合に取得します。プールサイズとは,いったん確保した共用メモリを解放したことによってプール内が断片化した場合のこの断片部分を含めた使用中共用メモリのサイズの合計です。 したがって,システム環境定義のdynamic_shmpool_sizeに設定する値はこの値以上にしてください。 <発生件数> 動的共用メモリ使用サイズと同じ(ただし,それ以前のプールサイズを更新した場合) |
134 |
動的共用メモリ(プールサイズ) |
|
MQAサービス情報 |
getメッセージ(入力長) |
アプリケーションがキューから読み込んだメッセージ長。 <発生件数> 下記事象の発生回数
|
161 |
getメッセージ(入力長) |
putメッセージ(出力長) |
アプリケーションおよびMQTサーバがキューに登録したメッセージ長。 <発生件数> APおよびMQTサーバのキューへのメッセージ登録回数 |
162 |
putメッセージ(出力長) |
|
readエラー |
メッセージをファイルから入力したときのI/Oエラー。 <発生件数> 上記エラーの発生回数 |
163 |
readエラー |
|
writeエラー |
メッセージをファイルに出力するときのI/Oエラー。 <発生件数> 上記エラーの発生回数 |
164 |
writeエラー |
|
空きバッファ待ち |
バッファ不足発生回数。 この値がカウントされている場合は入出力バッファ数を大きくしてください。 <発生件数> 上記事象の発生回数 |
165 |
空きバッファ待ち |
|
実read |
メッセージをファイルから読み込んだI/O。 この値がカウントされている場合は入出力バッファを大きくし,メッセージGET時,I/Oを減らしてください。 <発生件数> 上記事象の発生回数 |
166 |
実read |
|
実write |
メッセージをファイルに書き込んだI/O。 <発生件数> 上記事象の発生回数 |
167 |
実write |
|
書き込み依頼時間 |
メッセージをファイルに書き込む時の書き込み処理時間(I/O時間+MQAI/Oプロセスへの依頼処理)。 <発生件数> メッセージのファイル書き込み依頼回数 |
169 |
書き込み依頼時間 |
|
1回のトリガ契機の起動メッセージ数 |
トリガ生成時,キューにたまっていたメッセージ数。 <発生件数> トリガメッセージ生成回数 |
170 |
1回のトリガ契機のメッセージ数 |
|
メッセージ転送開始待ち時間 |
MQPUTを発行してから,メッセージの転送を開始するまでの時間。 <発生件数> 転送メッセージ数 |
171 |
メッセージ転送開始待ち時間 |
|
メッセージ到着待ち時間 |
MQPUTを発行してから,メッセージの転送が完了するまでの時間。 <発生件数> 転送メッセージ数 |
172 |
メッセージ到着待ち時間 |
|
ISTサービス情報 |
入力長 |
dc_ist_readを発行した単位でのISTテーブルのデータ入力長についての情報。 <発生件数> dc_ist_read発行回数 |
191 |
入力バッファ長 |
出力長 |
dc_ist_writeを発行した単位でのISTテーブルのデータ出力長についての情報。 <発生件数> dc_ist_write発行回数 |
192 |
出力バッファ長 |
|
ほかのノードからの更新を受けた回数 |
ほかのノードが行ったISTテーブルに対する更新を,自ノードに反映させるための更新メッセージを受け取った回数。 <発生件数> 上記発生件数 |
193 |
更新伝播受信回数 |
|
ほかのノードへ更新した回数 |
ISTテーブルを更新してほかのノードへ更新の伝播を行った回数。 <発生件数> 上記発生件数 |
194 |
更新伝播発信回数 |
|
XATMIサービス情報 |
XATMIコール (レスポンスタイム) |
XATMIインタフェースを使用したOSI TP通信で,クライアント側でサービス要求を送信してから応答を受信するまでの時間。
<発生件数> tpcallまたはtpacall発行回数。ただし,サービス要求送信前にエラーリターンした場合は含みません。 |
211 |
XATMIコールレスポンスタイム |
XATMIユーザサービス実行時間 |
XATMIインタフェースを使用したOSI TP通信で,サーバ側でサービス関数の実行開始からサービス関数でreturnを発行するまでの時間。 <発生件数> ユーザサービス実行回数 |
212 |
XATMIユーザサービス実行時間 |
|
XATMIサービス障害回数 |
XATMIインタフェースを使用したOSI TP通信で発生した障害の件数。
<発生件数> 上記障害の発生件数 |
213 |
XATMIサービス障害回数 |
システム統計情報の編集内容を次の表に示します。
表中の「単位」は事象の発生件数(取得値がある場合は取得値の単位)です。なお,システム統計情報の発生件数が0の場合,編集値は意味のない値になります。