uCosminexus Batch Job Execution Server ログビューア 導入・運用ガイド
バッチジョブ実行サーバの稼働中に次の事象が発生すると,BJEXの実行ログおよびsyslogのログ情報の収集が中断されます。
- Log Managerの停止
- Log Agentの停止
- Log ManagerおよびLog Agentの停止
- 作業ディレクトリの上限を超える量のログ情報の出力
- Log Managerでのログ情報の蓄積の失敗
このようなときは,収集が中断された間のログ情報を再収集する必要があります。ログ情報の再収集の概要を次の図に示します。
図6-1 ログ情報の再収集の概要
ログ情報の再収集手順,およびログ情報の再収集時の注意事項について説明します。
- <この節の構成>
- (1) Log Managerが停止したときのログ情報の再収集
- (2) Log Agentが停止したときのログ情報の再収集
- (3) ログ情報の出力量が作業ディレクトリの上限を超えたときのログ情報の再収集
- (4) Log Managerでログ情報の蓄積に失敗したときのログ情報の再収集
- (5) 注意事項
(1) Log Managerが停止したときのログ情報の再収集
Log Managerの停止によってログ情報の収集が中断した場合は,Log Managerが停止した日時,およびLog Managerが再起動した日時を確認したあと,コマンドでログ情報を再収集します。
手順を次に示します。
- Log Viewerで検索を実行して,バッチジョブ実行サーバから最後にログ情報が転送された年月日・時刻を確認します。
[検索条件]画面で,検索条件に次の項目を指定して検索します。出力元,メッセージIDおよびメッセージテキストの指定は不要です。
検索結果には,Log Managerのマシンで最後に蓄積したログ情報が表示されます。その年月日・時刻を出力元ごとに記録しておきます。
- 開始日時および終了日時:Log Managerが停止した前後の年月日・時刻
Log Viewerでのログの検索手順については,マニュアル「uCosminexus Batch Job Execution Server ログビューア 操作ガイド」を参照してください。
- Log Viewerで検索を実行して,Log Managerを再起動したあと最初にログ情報が転送された年月日・時刻を確認します。
[検索条件]画面で,検索条件に次の項目を指定して検索します。出力元,メッセージIDおよびメッセージテキストの指定は不要です。
検索結果には,Log Managerを再起動したあと,最初に蓄積したログ情報が表示されます。その年月日・時刻を出力元ごとに記録しておきます。
- 開始日時および終了日時:Log Managerを再起動した前後の年月日・時刻
- 停止したLog Managerに接続するバッチジョブ実行サーバで,recollect(ログ情報の再収集コマンド)を実行して,ログ情報をファイルに出力します。
実行するコマンドの形式を次に示します。斜体で示す部分を手順1および手順2の結果に合わせて変更します。
コマンドに指定する引数を次に示します。
recollect {bjexexec|syslog} -s 再収集開始年月日・時刻 -e 再収集終了年月日・時刻 -o 出力ディレクトリ
recollect(ログ情報の再収集コマンド)の詳細は,「8.4.2 recollect(ログ情報の再収集コマンド)」を参照してください。
- {bjexexec|syslog}
再収集するログ情報の種類として,次のどちらかを指定します。
・bjexexec:BJEXの実行ログのログ情報を再収集します。
・syslog:syslogのログ情報を再収集します。ただし,Windowsの場合は指定できません。
- -s 再収集開始年月日・時刻
手順1で記録した年月日・時刻をyyyymmddHHMMSSの形式で指定します。yyyyは西暦年,mmは月,ddは日,HHは時,MMは分,SSは秒を示します。
- -e 再収集終了年月日・時刻
手順2で記録した年月日・時刻をyyyymmddHHMMSSの形式で指定します。yyyyは西暦年,mmは月,ddは日,HHは時,MMは分,SSは秒を示します。
- -o 出力ディレクトリ
再収集したログ情報を出力する任意のディレクトリを指定します。指定したディレクトリの下位に次のログ情報の蓄積ファイルが出力されます。
・index
・bjexexec.n(BJEXの実行ログの場合)またはsyslog.n(syslogの場合)
nは1〜2147483646の整数です。
続いて,ログ情報の蓄積ファイルの移動先を決めます。
- 引数-oのディレクトリに出力されたindexを確認します。
indexをテキストエディターなどで開き,次の項目を確認します。
例えば,indexに「20081031205950△20081031205959△bjexexec.1」と記述されている場合,ファイル名は「bjexexec.1」,ログ情報が出力された年月日は「2008年10月31日」と解釈します(△:半角スペース)。
- ファイル名
- ログ情報が出力された年月日
indexの見方については,「2.3.2(2) ファイルへのログ情報の蓄積」を参照してください。
- 手順4で確認した年月日を基に,ログ情報の蓄積ファイルの移動先を決めます。
ログ情報の蓄積ファイルは,ログ収集サーバのログ収集ディレクトリ直下にある,名前が「マシン名/yyyymmdd」(マシン名はrecollectコマンドを実行したマシンの名称,yyyyは西暦年,mmは月,ddは日)のディレクトリに移動する必要があります。そのため,手順4で確認した年月日を基に,ファイルの移動先のディレクトリを決めます。
例えば,手順4の確認で,「bjexexec.1」には2008年10月1日に出力されたログ情報が蓄積されていることがわかったとします。このとき,ファイルの移動先は,Log Managerのログ収集ディレクトリ下の「マシン名/20081001/bjexexec」ディレクトリになります。
ログ収集ディレクトリの詳細は,「2.3.2(1) ディレクトリによるログ情報の分類」を参照してください。
移動先のディレクトリが存在しない場合,ディレクトリを作成します。ディレクトリの作成後,手順9に進んでください。
- 移動先のディレクトリにあるindexを基に,ファイルの挿入位置を決めます。
移動先のディレクトリにあるindexをテキストエディターなどで開きます。
indexには,ログ情報の出力年月日・時刻とファイル名の対応が時系列の順で記述されています。そのため,すでにあるファイルと移動するファイルが時系列で並ぶように,挿入位置を決めてください。
- 移動先のディレクトリにあるindexを修正します。
手順6で決めた挿入位置に,手順4で確認したindexの内容を追加します。
また,再収集したログ情報のファイル名がすでにあるファイルの名前と重複している場合は,再収集したログ情報のファイル名を重複しない名前に書き換えます。
- ■indexの修正例
- indexの修正例を次の図に示します。
- 移動するファイルをリネームします。
手順7で修正したindexに合わせて,再収集したログ情報のファイル名をリネームします。
- ファイルを移動します。
再収集したログ情報のファイルを手順5で決めたディレクトリに移動します。
- 停止したLog Managerに接続するバッチジョブ実行サーバで,手順3〜手順9を繰り返します。
以上で,ログを再収集する手順は終了です。
Log Agentの停止によってログ情報の収集が中断した場合は,Log Agentが停止した日時,およびLog Agentが再起動した日時を確認したあと,コマンドでログ情報を再収集します。
手順を次に示します。
- Log Viewerで検索を実行して,バッチジョブ実行サーバから最後にログ情報が転送された年月日・時刻を確認します。
[検索条件]画面で,検索条件に次の項目を指定して検索します。メッセージIDおよびメッセージテキストの指定は不要です。
検索結果には,該当のマシンから最後に転送されたログ情報が表示されます。その年月日・時刻を記録しておきます。
- 開始日時および終了日時:Log Agentが停止した前後の年月日・時刻
- 出力元:Log Agentが停止したマシン
Log Viewerでのログの検索手順については,マニュアル「uCosminexus Batch Job Execution Server ログビューア 操作ガイド」を参照してください。
- Log Viewerで検索を実行して,Log Agentを再起動したあと最初にログ情報が転送された年月日・時刻を確認します。
[検索条件]画面で,検索条件に次の項目を指定して検索します。メッセージIDおよびメッセージテキストの指定は不要です。
検索結果には,Log Agentを再起動したあと,該当のマシンから最初に転送されたログ情報が表示されます。その年月日・時刻を記録しておきます。
- 開始日時および終了日時:Log Agentを再起動した前後の年月日・時刻
- 出力元:Log Agentが停止したマシン
- Log Agentが停止したマシンで,recollect(ログ情報の再収集コマンド)を実行して,ログ情報をファイルに出力します。
実行するコマンドの形式を次に示します。斜体で示す部分を手順1および手順2の結果に合わせて変更します。
コマンドに指定する引数を次に示します。
recollect {bjexexec|syslog} -s 再収集開始年月日・時刻 -e 再収集終了年月日・時刻 -o 出力ディレクトリ
recollect(ログ情報の再収集コマンド)の詳細は,「8.4.2 recollect(ログ情報の再収集コマンド)」を参照してください。
- {bjexexec|syslog}
再収集するログ情報の種類として,次のどちらかを指定します。
・bjexexec:BJEXの実行ログのログ情報を再収集します。
・syslog:syslogのログ情報を再収集します。
- -s 再収集開始年月日・時刻
手順1で記録した年月日・時刻をyyyymmddHHMMSSの形式で指定します。yyyyは西暦年,mmは月,ddは日,HHは時,MMは分,SSは秒を示します。
- -e 再収集終了年月日・時刻
手順2で記録した年月日・時刻をyyyymmddHHMMSSの形式で指定します。yyyyは西暦年,mmは月,ddは日,HHは時,MMは分,SSは秒を示します。
- -o 出力ディレクトリ
再収集したログ情報を出力する任意のディレクトリを指定します。指定したディレクトリの下位に次のログ情報の蓄積ファイルが出力されます。
・index
・bjexexec.n(BJEXの実行ログの場合)またはsyslog.n(syslogの場合)
nは1〜2147483646の整数です。
続いて,ログ情報の蓄積ファイルの移動先を決めます。
- 引数-oのディレクトリに出力されたindexを確認します。
indexをテキストエディターなどで開き,次の項目を確認します。
例えば,indexに「20081031205950△20081031205959△bjexexec.1」と記述されている場合,ファイル名は「bjexexec.1」,ログ情報が出力された年月日は「2008年10月31日」と解釈します(△:半角スペース)。
- ファイル名
- ログ情報が出力された年月日
indexの見方については,「2.3.2(2) ファイルへのログ情報の蓄積」を参照してください。
- 手順4で確認した年月日を基に,ログ情報の蓄積ファイルの移動先を決めます。
ログ情報の蓄積ファイルは,ログ収集サーバのログ収集ディレクトリ直下にある,名前が「マシン名/yyyymmdd」(マシン名はrecollectコマンドを実行したマシンの名称,yyyyは西暦年,mmは月,ddは日)のディレクトリに移動する必要があります。そのため,手順4で確認した年月日を基に,ファイルの移動先のディレクトリを決めます。
例えば,手順4の確認で,「bjexexec.1」には2008年10月1日に出力されたログ情報が蓄積されていることがわかったとします。このとき,ファイルの移動先は,Log Managerのログ収集ディレクトリ下の「マシン名/20081001/bjexexec」ディレクトリになります。
ログ収集ディレクトリの詳細は,「2.3.2(1) ディレクトリによるログ情報の分類」を参照してください。
移動先のディレクトリが存在しない場合,ディレクトリを作成します。ディレクトリの作成後,手順9に進んでください。
- 移動先のディレクトリにあるindexを基に,ファイルの挿入位置を決めます。
移動先のディレクトリにあるindexをテキストエディターなどで開きます。
indexには,ログ情報の出力年月日・時刻とファイル名の対応が時系列の順で記述されています。そのため,すでにあるファイルと移動するファイルが時系列で並ぶように,挿入位置を決めてください。
- 移動先のディレクトリにあるindexを修正します。
手順6で決めた挿入位置に,手順4で確認したindexの内容を追加します。
また,再収集したログ情報のファイル名がすでにあるファイルの名前と重複している場合は,再収集したログ情報のファイル名を重複しない名前に書き換えます。
- ■indexの修正例
- indexの修正例を次の図に示します。
- 移動するファイルをリネームします。
手順7で修正したindexに合わせて,再収集したログ情報のファイル名をリネームします。
- ファイルを移動します。
再収集したログ情報のファイルを手順5で決めたディレクトリに移動します。
以上で,ログを再収集する手順は終了です。
(3) ログ情報の出力量が作業ディレクトリの上限を超えたときのログ情報の再収集
MAX_SIZEパラメーターに指定した上限を超えてログ情報が出力されたとき,UNIXの場合はsyslog,Windowsの場合はイベントログに一時蓄積ファイルの上限を超えたことを示すメッセージ(KAKH107-W)が出力されます。Log Managerへログ情報が送信されないまま,一時蓄積ファイルへのログ情報の蓄積が継続されると,ファイルの容量がMAX_SIZEパラメーターに指定した値の2倍になった時点で,最大蓄積量に到達したことを示すメッセージ(KAKH100-E)が出力されます。また,それまで蓄積していたログ情報が破棄され,ログ情報の蓄積が中断されます。
このときは,破棄されたログ情報中に出力されたメッセージの日時を確認して,ログ情報を再収集します。
再収集の手順を次に示します。
- Log Agentが破棄したメッセージを確認します。
UNIXの場合はsyslog,Windowsの場合はイベントログから,KAKH101-IメッセージおよびKAKH102-Iメッセージを探します。
例:cat /tmp/syslog.out*|grep KAKH10[1-2]
KAKH101-Iメッセージを参照して,ログ種別および初めに破棄されたメッセージの日時を記録します。
KAKH102-Iメッセージを参照して,最後に破棄されたメッセージの日時を記録します。
syslogまたはイベントログにKAKH100-Eが出力された場合,KAKH101-IおよびKAKH102-Iを検索します。KAKH101-Iから破棄された最初のメッセージの日時,KAKH102-Iから破棄された最後のメッセージの日時を確認します。
- ■syslogの例
- ログ情報が破棄された場合のsyslogの例を次の図に示します。
- KAKH101-Iに出力されている日時・時刻は「Oct 31 23:59:50」,KAKH102-Iに出力されている日時・時刻は「Oct 31 23:59:59」です。
- 破棄された最初のメッセージの日時は2008年10月31日の23:59:50,破棄された最後のメッセージの日時は2008年10月31日の23:59:59であることがわかります(メッセージが出力された西暦年を2008年と仮定しています)。
- そのため,ログ情報の再収集を開始および終了する年月日・時刻は次ようになります。
- ・再収集開始年月日・時刻:2008/10/31/ 23:59:50
- ・再収集終了年月日・時刻:2008/10/31/ 23:59:59
- Log Agentのマシンで,recollect(ログ情報の再収集コマンド)を実行して,ログをファイルに出力します。
コマンドの実行例を次に示します。斜体で示す部分を手順1の結果に合わせて変更します。
コマンドに指定する引数を次に示します。
recollect {bjexexec|syslog} -s 再収集開始年月日・時刻 -e 再収集終了年月日・時刻 -o 出力ディレクトリ
コマンドを実行すると,ログがファイルに出力されます。
- {bjexexec|syslog}
再収集するログの種類として,次のどちらかを指定します。
・bjexexec:BJEXの実行ログを再収集します。
・syslog:syslogを再収集します。ただし,Windowsの場合は指定できません。
- -s 再収集開始年月日・時刻
手順1で記録した,KAKI101-Iに出力された年月日・時刻をyyyymmddHHMMSSの形式で指定します。yyyyは西暦年,mmは月,ddは日,HHは時,MMは分,SSは秒を示します。
- -e 再収集終了年月日・時刻
手順1で記録した,KAKI102-Iに出力された年月日・時刻をyyyymmddHHMMSSの形式で指定します。yyyyは西暦年,mmは月,ddは日,HHは時,MMは分,SSは秒を示します。
- -o 出力ディレクトリ
再収集したログを出力する任意のディレクトリを指定します。
recollect(ログ情報の再収集コマンド)の詳細は,「8.4.2 recollect(ログ情報の再収集コマンド)」を参照してください。
続いて,ファイルの移動先を決めます。
以降の手順については,「(2) Log Agentが停止したときのログ情報の再収集」の手順4〜手順9を参照してください。
(4) Log Managerでログ情報の蓄積に失敗したときのログ情報の再収集
Log Managerでログ情報の蓄積に失敗すると,ログ情報の収集が中断されます。この場合,エラーを示すメッセージ(KAKG104-E,KAKG105-EまたはKAKG112-E)に加えて,KAKG114-Iメッセージが出力されます。
このときは,Log Managerが最後にログ情報を蓄積した日時,およびログ情報の蓄積を再開した日時を確認して,ログ情報を再収集します。
再収集の手順を次に示します。
- Log Managerが最後にログ情報を蓄積した年月日・時刻を確認します。
Log Managerのマシンのsyslogファイルから,KAKG114-Iメッセージを探します。
例:cat /tmp/syslog.out*|grep KAKG114
KAKG114-Iメッセージを参照して,ログ種別,Log Agentのマシン名および最後に蓄積されたメッセージの日時を記録しておきます。
- ■syslogの例
- ログ情報の蓄積が中断した場合の,syslogに出力されたKAKG114-Iメッセージの例を次の図に示します。
- KAKG114-Iに出力されているログ種別は「syslog」,マシン名は「hosta」,日付・時刻は「Oct 31 23:59:50」です。
- 蓄積された最後のメッセージの日時は2008年10月31日の23:59:50であることがわかります(メッセージが出力された西暦年を2008年と仮定しています)。
- Log Viewerで検索を実行して,Log Managerがログ情報の蓄積を再開した年月日・時刻を確認します。
[検索条件]画面で,検索条件に次の項目を指定して検索します。メッセージIDおよびメッセージテキストの指定は不要です。
検索結果には,Log Managerが該当のマシンからログ情報の蓄積を再開した,最初のログ情報が表示されます。その年月日・時刻を記録しておきます。
- 開始日時および終了日時:手順1で記録した前後の年月日・時刻
- 出力元:手順1で記録したマシン
Log Viewerでのログの検索手順については,マニュアル「uCosminexus Batch Job Execution Server ログビューア 操作ガイド」を参照してください。
- 手順1で記録したマシンで,recollect(ログ情報の再収集コマンド)を実行して,ログ情報をファイルに出力します。
この手順の詳細および以降の手順については,「(2) Log Agentが停止したときのログ情報の再収集」の手順3〜手順9を参照してください。
- ログ情報の再収集は,Log ManagerおよびLog Agentを停止してから実行してください。
- 再収集したログ情報をログ収集サーバのログ収集ディレクトリに追加する前に,ログ収集ディレクトリをアーカイブしておいてください。ログ収集ディレクトリのアーカイブについては,ログ収集サーバのOSがUNIXの場合は「6.2(1)(a) ログ情報のアーカイブと削除」を,ログ収集サーバのOSがWindowsの場合は「6.2(2)(a) ログ情報のアーカイブと削除」を参照してください。
- 再収集の対象のログ情報が頻繁に出力されている状態の場合は,recollectコマンドを実行しないでください。ログ情報の出力頻度が低くなってから実行してください。
- recollectコマンドの実行中に,ログ情報を再収集しているファイルでファイルの切り替えが発生すると,正しく再収集されないことがあります。
recollectコマンドの引数-oのディレクトリに出力されたindexを確認して,収集対象のログが出力されていないとわかったときは,引数-oのディレクトリに出力されたファイルをすべて削除したあと,recollectコマンドを再実行してください。
- ログ情報の再収集で同じメッセージを複数のファイルに格納した場合,Log Viewerでそのメッセージを検索すると,同じメッセージが複数回表示されます。
All Rights Reserved. Copyright (C) 2009, 2011, Hitachi Solutions, Ltd.
All Rights Reserved. Copyright (C) 2009, 2011, Hitachi, Ltd.