ストリームデータ処理基盤 uCosminexus Stream Data Platform - Application Framework システム構築・運用ガイド
ここでは,トラブル発生時に採取が必要な資料について説明します。次のような事象が発生したときに,資料を採取してください。
発生した事象ごとに採取が必要な資料を次の表に示します。
表6-1 発生した事象ごとに採取が必要な資料
項番 | 資料 | 発生した事象 | ||
---|---|---|---|---|
不正なタイムアウト発生時 | サーバ異常停止時 | サーバプロセスダウン発生時 | ||
1 | 標準出力,標準エラー出力 | ○ | ○ | ○ |
2 | エラーリポートファイル | − | − | ○ |
3 | SDPサーバ用定義ファイル | ○ | ○ | ○ |
4 | アダプター用定義ファイル | ○ | ○ | ○ |
5 | ログファイル | ○ | ○ | ○ |
6 | 外部定義関数定義ファイル | ○ | ○ | ○ |
7 | トレースファイル | ○※1 | ○ | ○ |
8 | アダプタートレース | ○※2 | ○ | ○ |
9 | タプルログ | ○※3 | ○ | ○ |
10 | スレッドダンプ | ○ | ○ | ○ |
11 | OSの状態 | ○ | − | − |
12 | OSの統計情報 | ○ | ○ | ○ |
13 | Hitachi Web Serverのエラーログファイル※4 | ○ | ○ | ○ |
それぞれの資料の採取方法について,以降で説明します。
標準出力,標準エラー出力で出力されたメッセージを控えておいてください。
なお,SDPサーバ,およびアダプターの起動・停止に関するすべてのメッセージは,標準出力または標準エラー出力に出力されます。これらのメッセージには,ログファイルに出力されるメッセージと出力されないメッセージがあります。
エラーリポートファイルとは,JavaVMが異常終了した場合に出力されるファイルです。プロセスダウン時のダウン位置や要因などを調査できます。
次のファイルを採取してください。
<運用ディレクトリ>\hs_err_pid<プロセスID>.log
SDPサーバ用定義ファイルとは,次のファイルを指します。
次に示すディレクトリ下のファイルを採取してください。
<運用ディレクトリ>\conf\
なお,上記のディレクトリ下にRMI連携用JavaVMオプションファイルを格納していない場合は,あわせて採取してください。
アダプター用定義ファイルとは,次のファイルを指します。
次に示すディレクトリ下のファイルを採取してください。
<運用ディレクトリ>\conf\xml\
ログファイルとは,次のファイルを指します。
次に示すディレクトリ下のすべてのファイルを採取してください。
<運用ディレクトリ>\logs\
メッセージログ,およびトレースログについては,「6.3.1 ログファイルの詳細」を参照してください。
日立JavaVMログファイルは,標準のJavaVMに日立が追加した拡張オプションを使用して取得できる,日立固有のJavaVMログが出力されたファイルです。標準のJavaVMよりも多くのトラブルシュート情報が取得できます。
外部定義関数定義ファイルとは,次のファイルを指します。
次に示すディレクトリ下のファイルを採取してください。
<運用ディレクトリ>\conf\xml\
トレースファイルとは,APIトレースなどの各種トレースファイルです。
次に示すディレクトリ下のすべてのファイルを採取してください。
<運用ディレクトリ>\trc\
APIトレースについては,「6.3.2 APIトレースの詳細」を参照してください。
アダプタートレースとは,アダプターの処理状況が出力されるトレースファイルです。
次のディレクトリ下のファイルを採取してください。
<運用ディレクトリ>\trc\adaptor\
アダプタートレースについては,「6.3.3 アダプタートレースの詳細」を参照してください。
タプルログとは,入力タプルおよび出力タプルの情報が出力されるログファイルです。
次のディレクトリ下のファイルを採取してください。
<運用ディレクトリ>\trc\tuplelog\
タプルログについては,「6.3.4 タプルログの詳細」を参照してください。
スレッドダンプとは,Javaのプロセス内で動作しているスレッドの情報が出力されるファイルです。
スレッドダンプは,jheapprofコマンドを実行して採取します。
スレッドダンプの採取手順,およびjheapprofコマンドについては,「6.3.5 スレッドダンプの詳細」を参照してください。
OSの状態として,ネットワークの情報や環境変数を採取します。次のように,netstatコマンドを実行して採取してください。
netstat -e > netstat_e.txt netstat -s > netstat_s.txt netstat -an > netstat_an.txt set > set.txt
OSの統計情報とは,システムの負荷やパフォーマンスなどの状態を確認できる情報です。OSのパフォーマンスモニターによって採取します。
SDPサーバの実行中に,次の表に示すパフォーマンスモニターのログを一定間隔で採取します。
表6-2 パフォーマンスモニターのログ
オブジェクト | インスタンス | カウンタ |
---|---|---|
Processor | _Total | %Processor Time |
%Privileged Time | ||
%User Time | ||
Memory | − | Cache Bytes |
Cache Faults/sec | ||
Page Faults/sec | ||
Transition Faults/sec | ||
Transition Faults/sec | ||
Process | _Total | Handle Count |
Page Faults/sec | ||
Private Bytes | ||
Virtual Bytes | ||
Working Set Bytes | ||
java※ | %Processor Time | |
%Privileged Time | ||
%User Time | ||
Page Faults/sec | ||
Thread Count | ||
Private Bytes | ||
Virtual Bytes | ||
Working Set Bytes |
ログの採取間隔は,60秒間隔を推奨しますが,ディスク容量に応じて決めてください。採取間隔を長くすると,OSの統計情報の採取による性能劣化を少なくできますが,OSの統計情報の精度が悪化することがあります。
具体的な設定方法については,OSのマニュアルなどを参照してください。
Hitachi Web Serverのエラーログファイルとは,Webコンテナの動作状況を確認および監視するためのログファイルです。エラー,警告,インフォメーションの各メッセージが出力されます。
標準提供アダプターを使用して,ストリームデータの集計・分析結果をダッシュボードに出力している場合,Dashboard Serverでエラーが発生したときに,次のログファイルを採取してください。なお,ログファイル名の?には,1または2の整数が入ります。
<インストールディレクトリ>\psb\CC\web\containers\uCSDPAF_Server\logs\user_err?.log
All Rights Reserved. Copyright (C) 2010, 2014, Hitachi, Ltd.