Hitachi

JP1 Version 12 JP1/Automatic Job Management System 3 トラブルシューティング


1.4.2 UNIXの場合

〈この項の構成〉

(1) 資料採取ツールを実行する

JP1/AJS3では,次の表に示す資料採取ツールを提供しています。運用に応じてどちらかの資料採取ツールを実行してください。

表1‒39 JP1/AJS3で提供する資料採取ツール(UNIXの場合)

資料採取ツール

用途

jajs_log

ログファイルなどの出力先をデフォルトから変更していない場合や,その他の情報の採取が必要ない場合に使用します。

_04

ログファイルなどの出力先をデフォルトから変更した場合や,その他の情報を採取したい場合に,カスタマイズして使用します。

資料採取ツール(_04)のセットアップについては,マニュアル「JP1/Automatic Job Management System 3 構築ガイド 16.1 ログ情報の採取方法」を参照してください。

資料採取ツールの実行例を次に示します。

jajs_logを使用する場合
# /opt/jp1ajs2/tools/jajs_log
_04をカスタマイズし,trouble.shとして使用する場合
# /home/jp1ajs2/trouble.sh

資料採取ツールの実行結果は,デフォルトでは「/tmp/jp1ajs2/trouble/」の配下にファイルが出力されます。これらのファイルをバックアップしてください。

資料採取ツールは,クラスタ運用時,論理ホスト名を指定して資料を採取できます。また,採取する資料を限定するオプションも提供しています。UNIXで使用する資料採取ツールの詳細については,マニュアル「JP1/Automatic Job Management System 3 コマンドリファレンス 3. 通常の運用で使用するコマンド jajs_logまたは_04(UNIX限定)」を参照してください。

(2) coreファイルを採取する

coreファイルが出力されている場合は,coreファイルを採取してください。

coreファイルは,次のディレクトリのうちのどれかに出力されます。

  1. /opt/jp1ajs2/bin ※1

  2. /var/opt/jp1ajs2/database ※1

  3. /opt/jp1ajs3web/bin ※1

  4. ユーザーのホームディレクトリ※2

  5. コマンドなどを実行したカレントディレクトリ

注※1

資料採取ツールで採取できます。

注※2

JP1/AJS3 - Viewからの接続でcoreファイルが出力された場合は,マッピングされているOSユーザーのホームディレクトリになります。

また,core解析に必要な情報だけを採取したい場合はajs2collectcoreコマンドを使用します。ajs2collectcoreコマンドの詳細については,マニュアル「JP1/Automatic Job Management System 3 コマンドリファレンス 3. 通常の運用で使用するコマンド ajs2collectcore(UNIX限定)」を参照してください。

coreファイルの出力設定が使用中のホストのセキュリティポリシーに反する場合を除いて,JP1/AJS3のプロセスのcoreファイル出力を制限する設定をしないでください。coreファイルの出力が不完全な場合,障害調査ができなくなるおそれがあります。詳細については,各OSのドキュメントを参照してください。

(3) プロセスの状態を確認する

psコマンドを使ってプロセスの動作状態を確認してください。

JP1/AJS3のプロセスの情報については,「付録B.3 プロセス一覧(UNIXの場合)」を参照してください。

(4) オペレーション内容を確認する

トラブル発生時のオペレーション内容を確認し,記録しておいてください。確認が必要な情報を次に示します。

  1. オペレーション内容の詳細

  2. トラブル発生時刻

  3. マシン構成(各OSのバージョン,ホスト名,JP1/AJS3 - ManagerとJP1/AJS3 - Agentの構成など)

    マシン構成については,コマンドを実行して調査できます。OS別のコマンドの一覧を次の表に示します。

    表1‒40 UNIXのマシン構成の調査に使用するコマンドの一覧

    OS

    OSのバージョンを調査するコマンド

    ホストに搭載されている物理メモリー量を調査するコマンド

    プロセス情報およびメモリー所要量を調査するコマンド

    HP-UX

    /usr/bin/uname -a

    /usr/sbin/dmesg

    /usr/bin/ps -elf

    Solaris

    /usr/bin/uname -a

    /usr/sbin/prtconf

    /usr/bin/ps -elf

    AIX

    /usr/bin/uname -a

    /usr/sbin/bootinfo -r

    /usr/bin/ps -elf

    Linux

    /bin/uname -a

    /usr/bin/free

    (または,

    /bin/cat/proc/meminfo

    /bin/ps -elf

    コマンドのオプションは,各OSで標準的なオプションです。使用している環境によって仕様が異なる場合もあります。詳細については,使用しているOSのドキュメントを参照してください。

  4. 再現性の有無

  5. JP1/AJS3 - Viewからログインしている場合は,ログインユーザー名

  6. JP1/AJS3 - Web Consoleを利用していて,Web GUIまたはユーザーアプリケーションからログインしている場合は,ログインユーザー名

(5) 組み込みDBの情報を採取する

組み込みDB使用時にエラーが発生した場合,次に示す情報が必要です。

それぞれの情報を採取する方法について説明します。

(a) 原因を調査するために必要な情報

原因を調査するために必要な資料は,大別すると,OSの情報と組み込みDBの情報に分かれます。OSの情報はOSのコマンドなどで採取します。組み込みDBの情報は組み込みDBのコマンドなどで採取します。

問題解決支援のサポートサービスを利用する場合,原因調査に必要な情報と取得方法をトラブルの形態ごとに次の表に示します。優先順位が最も高い場合を1として,7段階で示しています。

各トラブル形態の詳細は,次のとおりです。

性能

次の処理および操作の所要時間が長い場合

  • 組み込みDBシステムの開始(正常開始,再開始,障害除去後開始を含む)

  • 組み込みDBシステムの停止(正常停止,強制停止を含む)

  • 組み込みDB操作コマンドの実行

無応答

次の処理および操作時に応答が返らない場合

  • 組み込みDBシステムの開始(正常開始,再開始,障害除去後開始を含む)

  • 組み込みDBシステムの停止(正常停止,強制停止を含む)

  • 組み込みDB操作コマンドの実行

異常終了

次のうち,どれか一つ以上発生した場合

  • 組み込みDBシステムの異常終了

  • 組み込みDBプロセスの異常終了

  • 組み込みDB操作コマンドの異常終了

表1‒41 障害の原因調査のために必要な情報と取得方法

項番

区分

取得する情報

取得方法

性能

無応答

異常終了

1

OS

syslog

OSの機能(コマンド)で取得します。

1

1

1

2

CPU利用率およびデバイス状況

OSのコマンド(sarコマンドなど)で取得します。コマンドの詳細については,OSのマニュアルを参照してください。

3

4

3

3

プロセスのCPU稼働・メモリー状態

OSのコマンド(topコマンドなど)で取得します。コマンドの詳細については,OSのマニュアルを参照してください。

3

4

3

4

仮想メモリー情報

OSのコマンド(vmstatコマンドなど)で取得します。コマンドの詳細については,OSのマニュアルを参照してください。

3

4

3

5

ネットワークステータス情報

OSのコマンド(netstatコマンドなど)で取得します。コマンドの詳細については,OSのマニュアルを参照してください。

3

4

3

6

組み込みDB

組み込みDB障害情報

次のディレクトリ下にあるファイルをDATなどに取得してください。

  • 組み込みDB運用ディレクトリ/spool

  • 組み込みDB運用ディレクトリ/tmp

上記のディレクトリ下にはエラーログファイルおよびコマンドログファイルが出力されます。

2

2

2

7

エラーログファイル

組み込みDB運用ディレクトリ/spool/errlog下のファイルに出力されます。

2

2

2

8

コマンドログファイル

組み込みDB運用ディレクトリ/spool/cmdlog下のファイルに出力されます。

2

2

2

9

組み込みDBシステム定義の情報

組み込みDB運用ディレクトリ/conf下のファイルをDATなどに取得してください。

4

5

4

10

SQLトレースファイルおよびエラーログファイル

出力されたファイルをDATなどに取得してください。ファイル名はpderrまたはpdsqlで始まっています。

6

5

11

システムログファイル

ajsembdboplogコマンドでシステムログをアンロードします。アンロードログファイルをDATなどに取得してください。

6

7

6

(凡例)

−:情報を取得する必要はありません。

リダイレクトで追加書きするファイルはファイル容量が単調増加するため,ディスク容量を圧迫します。したがって,ファイルを切り替えて一定世代で再使用する汎用シェルスクリプトを作成してください。

(b) 組み込みDBの環境を再作成するために必要な情報

組み込みDBの運用中にトラブルが発生した場合,再現テストや原因究明のためにトラブルが発生した環境を作成する必要があるときがあります。そのため,次に示す,組み込みDBの環境を再作成するために必要な情報を採取してください。

  • 組み込みDB運用ディレクトリの下にあるconf(ユーザーが定義ファイルを変更した場合)

  • 組み込みDBに関連する環境変数

  • 組み込みDBのデータ

    組み込みDBのデータは,ajsembdbrorgコマンドを実行して採取してください。

組み込みDBの環境を再作成するために必要な情報を採取する手順を次に示します。

  1. 組み込みDBを起動する。

  2. ajsembdbrorgコマンドに-k unldオプションを指定して実行する。

  3. 組み込みDB運用ディレクトリの下にあるconfを任意のフォルダに退避する。

  4. 組み込みDBに関連する環境変数を収録する。

ajsembdbrorgコマンドの操作の説明や詳細については,マニュアル「JP1/Automatic Job Management System 3 運用ガイド 9.2.3 データベースを再編成する場合」を参照してください。