3.1.1 ユーザの決定
バッチジョブ分散実行システムを利用するユーザには,システム管理者と一般ユーザの2種類があります。
|
|
ここでは,各ユーザを決定するに当たっての考え方を説明します。
- 〈この項の構成〉
(1) システム管理者
システム管理者はバッチジョブ分散実行システムの運営上の責任者で,スーパーユーザ権限があらかじめ与えられています。システム管理者が行う作業は次のとおりです。
-
グリッドジョブを実行できる環境の整備・管理
-
バッチジョブ分散実行システムを使用する一般ユーザのシステム登録
(2) 一般ユーザ
グリッドジョブ管理ホスト,グリッドプロパティ管理ホスト,および実行ノードには,次の作業をするための管理者(Linux・AIXの場合はuGPS管理者,Windowsの場合はOpenTP1管理者)が必要となります。
-
管理ホストと実行ノードのセットアップ
-
uGPSのコマンドの実行
また,JP1/AJS3からグリッドクライアントを起動する要求は,ジョブとして受け付けられます。ジョブを利用する一般ユーザのうち,開発者があらかじめ行う作業は次のとおりです。
-
データの配置情報の設計
-
グリッドジョブ(分散するジョブ)の設計
-
グリッドジョブネットの設計
(a) データ配置情報の設計
グリッドジョブネットがサブジョブを実行ノードに分散する場合には,グリッドジョブを定義するときに指定したグリッドプロパティが使用されます。グリッドプロパティは,グリッド開始ジョブでグリッドジョブ前処理プログラムによって出力された,データ配置情報を基に作成されます。
データ配置情報は,分割したデータやデータ群を識別するためのデータ識別子と,そのデータが分散されたノードとの対応を示す情報です。データ配置情報は,データ識別子とノード名との対応が実体と合うように設計する必要があります。
1つのグリッドジョブネットでは,最大128の実行ノードに分散させて処理することができます。
分割データをどの実行ノードで処理するかを検討し,データ配置情報を標準出力に出力するようグリッドジョブ前処理プログラムを作成してください。単体グリッドジョブを使用する場合は,グリッドジョブ前処理プログラムの代わりにデータ配置情報を記述したファイルを指定できます。データ配置情報の形式については,「5.2.2 グリッド開始ジョブの定義」を参照してください。
(b) グリッドジョブの設計
グリッドジョブを定義するときは,次の内容をすべて指定します。
-
先行するデータを受け取るためのグリッドプロパティ名
-
後続ジョブの制御をするためのしきい値
-
グリッドジョブ名
グリッドプロパティ名の運用には注意が必要です。関連のないグリッドジョブネット間で同じグリッドプロパティ名を使用すると,想定した結果が得られないことがあります。
グリッドプロパティ名の指定は省略できます。省略した場合に設定される名称は次のとおりです。
-
グリッド開始ジョブ,グリッド実行ジョブ,およびグリッド終了ジョブの場合
JP1/AJS3のジョブ名(AJSJOBNAME環境変数)から先頭の「/」および「/を含むジョブ定義のユニット名」を除いた文字列が仮定されます。また,単語を区切る「/」は「@」に変換されます。uGPS - ManagerがWindows環境の場合,記号「-」,「"」,「*」,「<」,「>」,「?」,「\」,および「|」は,「_」に変換されます。
-
単体グリッドジョブの場合
JP1/AJS3のジョブ名(AJSJOBNAME環境変数)から先頭の「/」を除いた文字列が仮定されます。また,単語を区切る「/」は「@」に変換されます。uGPS - ManagerがWindows環境の場合,記号「-」,「"」,「*」,「<」,「>」,「?」,「\」,および「|」は,「_」に変換されます。
グリッドジョブ名の指定は省略できます。省略した場合,ジョブ定義のユニット名が設定されます。
(c) グリッドジョブネットの設計
バッチジョブ分散実行システムで運用するグリッドジョブネットは,複数のグリッドジョブの集合です。
ジョブネットとは,JP1/AJS3でスケジュールする単位の複数ジョブの集合です。ジョブネットを構成する幾つかのジョブは互いに関連を持っていて,各ジョブは定義した順序で処理されます。ジョブネットは定義した順序で処理されるため,先行するジョブネットが正しく処理されないと後続のジョブネットの実行が意味を持たなくなります。このような場合は,ジョブの実行結果を判定する判定ジョブを利用します。判定ジョブに後続するジョブの実行条件を指定することで,先行するジョブが正常終了しなかったときにはジョブネットを終了させるように運用できます。