Hitachi

uCosminexus Grid Processing Server 使用の手引


2.7.7 ジョブ情報の表示

JP1/AJS3ジョブとHadoopジョブを対応付ける情報(ジョブ情報)を表示できます。このジョブ情報は,JOBINFO_DIRパラメータで指定したディレクトリにファイルとして格納されます。HDFS管理コンソール画面からジョブ情報ファイルを表示することで,内容を確認できます。

ジョブ情報は次の条件を満たしている場合だけ,表示できます。

JOBINFO_DIRパラメータの指定内容については,「5.7.2(5) JOBINFO_DIRパラメータ(ジョブ情報ファイルを格納するHDFS上のディレクトリパス名定義)」を参照してください。

〈この項の構成〉

(1) ジョブ情報を表示する手順

ジョブ情報は,HDFS管理コンソール画面からパスをたどることで表示できます。ジョブ情報を表示するための,HDFS管理コンソール画面からたどるパスの遷移および手順を次に示します。

図2‒60 HDFS管理コンソール画面からたどるパスの遷移

[図データ]

  1. ブラウザでHDFS管理コンソール画面を表示する。

    HDFS管理コンソール画面のURLは"http://Hadoopのマスターノードのホスト名:dfs.http.address/"です。

  2. HDFS管理コンソール画面上で[Browse the filesystem]をクリックする。

  3. 順次,HDFS管理画面情報パス(mj.conf設定ファイルのJOBINFO_DIRパラメータで指定したジョブ情報ファイル格納ディレクトリのパス)までたどる。

    ジョブ情報がブラウザに表示されます。

    [図データ]

ジョブ情報ファイル名について

ジョブ情報ファイル名は次の規則に従っています。

≪JP1ジョブ番号≫-≪JP1/AJS3のジョブのユニット名≫-≪JP1ジョブ実行ID≫
命名例

JP1/AJS3のジョブ名(フルパス):/jobnet1123/test_job5/HadoopJOB

JP1ジョブ実行ID:@A31321

JP1ジョブ番号:3455

このような場合のジョブ情報ファイル名を次に示します。3455-HadoopJOB-@A31321

注※ アンダーラインの部分がユニット名です。

(2) ジョブ情報ファイルの内容

ジョブ情報ファイルには,Hadoopジョブ情報およびJP1/AJS3のジョブ情報が次の形式で書き込まれます。

ジョブ情報ファイルの形式
HadoopJobID:HadoopのジョブID
AJSJOBNAME:JP1/AJS3のジョブ名(フルパス) 
AJSHOST:JP1/AJS3のマネージャホスト名
AJS_AJSCONF:JP1/AJS3のスケジューラーサービス名
AJSEXECID:JP1ジョブ実行ID
JP1JobID:JP1ジョブ番号
出力例
HadoopJobID:job_201301071511_0004
AJSJOBNAME:/jobnet1123/test_job5/HadoopJOB
AJSHOST:GPSdbg04
AJS_AJSCONF:AJSROOT1
AJSEXECID:@A31321
JP1JobID:3455

(3) ジョブ情報ファイル格納ディレクトリの作成

ジョブ情報ファイル格納ディレクトリはHDFS上に作成し,mj.conf設定ファイルのJOBINFO_DIRパラメータに指定します。ジョブ情報ファイル格納ディレクトリをHDFS上に作成する手順は次のとおりです。

  1. HDFS上にディレクトリ作成権限のあるユーザで,次の方法でジョブ情報ファイル格納ディレクトリを作成する。

    hadoop fs -mkdir ジョブ情報ファイル格納ディレクトリ名

  2. 1で作成したディレクトリに,次の方法で書き込み権限を付与する。

    hadoop fs -chmod 777 ジョブ情報ファイル格納ディレクトリ名

(4) ジョブ情報ファイル生成時の障害

ジョブ情報ファイルを生成するための情報取得,およびファイルアクセスの失敗によって,ジョブ情報ファイルの生成に失敗すると,警告メッセージなどが出力され,Hadoopジョブは継続実行されます。JP1/AJS3のスケジューラがジョブごとに異なる場合は,ジョブ情報ファイル名が重複するときがあります。このような,すでに同じ名称のジョブ情報ファイルが存在する場合は,ジョブ情報ファイルが上書きされます。

ジョブ情報ファイル生成時に発生するエラー要因と,エラー発生後の動作を次の表に示します。

表2‒55 ジョブ情報ファイル生成時に発生するエラー要因およびエラー発生後の動作

エラー要因

エラー発生後の動作

ジョブ情報ファイル名を生成するために必要な,次のどれかの環境変数が無効です。

  • AJSJOBNAME

  • AJSEXECID

  • JP1JobID

  • メッセージは出力されません(コマンドによる実行として扱われます)。

  • Hadoopジョブは継続実行されます。

ファイル生成前に,HDFSへのアクセスでエラーが発生しました。

  • KAKJ0011-Wメッセージが出力されます。

  • Hadoopジョブは継続実行されます。

ファイル生成後に,HDFSへのアクセスでエラーが発生しました。

  • KAKJ0011-Wメッセージが出力されます。

  • Hadoopジョブは継続実行されます。

  • ジョブ情報ファイルはHadoopジョブ完了後に削除されます。

注※ エラーメッセージは出力されませんが,メッセージログに出力される環境変数の指定値を確認することで,エラー要因を特定できます。