Hitachi

uCosminexus Grid Processing Server 使用の手引


2.1.2 機能一覧

バッチジョブ分散実行システムが提供する機能の一覧を次の表に示します。

表2‒1 バッチジョブ分散実行システムが提供する機能一覧

分類

機能名

内容

グリッドジョブの定義

グリッドジョブの定義

GUIを利用してグリッドジョブネットを定義します。JP1/AJS3のカスタムジョブで次に示すジョブを定義して,グリッドジョブネットを生成します。

  • グリッド開始ジョブ

  • グリッド実行ジョブ

  • グリッド終了ジョブ

単体グリッドジョブの定義

GUIを利用して,JP1/AJS3のカスタムジョブとして単体グリッドジョブを定義します。単体グリッドジョブは,1つのジョブ内でグリッド開始ジョブ,グリッド実行ジョブ,およびグリッド終了ジョブを実行します。

グリッドジョブの実行制御

data-awareスケジュール

分割したデータがメモリ上に存在する実行ノードへサブジョブをスケジュールします。サブジョブを実行する最適な実行ノードを選択して,アクセス時間を短縮します。

サブジョブの制御

サブジョブを制御します。

  • サブジョブの生成・投入

  • サブジョブの実行状態監視

グリッド実行ジョブで,サブジョブのNOEXEC状態を実際のサブジョブ実行状態に合わせて,UNKNOWNまたはNOEXEC状態として表示します。

実行ノードの管理

ネームサービスを利用して,サブジョブを投入する実行ノードを管理します。

多重度実行数の管理

次に示すリソースの使用上限値を使用して,ジョブ実行の多重度を制御します。

  • 同時実行グリッドジョブ数

  • 一括処理数

  • ノード内グリッドジョブ実行数

  • ノード内総同時実行サブジョブ数

  • 業務プログラム同時実行数

  • 実行ノード内の最大同時実行サブジョブ数

  • 同時実行サブジョブ数

サブジョブ同時実行数の制限

ノードマネージャの実行多重度を動的に変更することで,運用中に多重度を下げてグリッドジョブの実行を制限します。

実行ノードの選択

サブジョブを複数の実行ノードで実行できるように定義することによって,次に示す機能を利用できるようにします。

  • 自動リトライ

  • 最適ノード選択

世代管理

JP1/AJS3上で世代実行されたグリッドジョブを管理します。

グリッドジョブの実行優先順位の設定

JP1/AJS3で指定された実行優先順位に従い,グリッドジョブを実行します。

実行ノードユーザ権限の設定(Linux・AIX)

グリッドジョブ実行時に,実行ノードで定義されているOSユーザのユーザ権限でグリッドジョブを実行します。

ノードマネージャSPPの複数面化

グリッドジョブの実行ホストで,ノードマネージャSPPを複数面起動します。

スケジュールの平準化

グリッドジョブ実行時に,スケジュール優先順位の高いサブジョブからスケジューリングします。

リソース名による実行制御

サブジョブに指定されたリソース名を基に,同時に実行するサブジョブを制限します。

サブジョブ実行結果の出力容量の制限

ディスク容量不足が発生しにくくなるよう,スプールディレクトリへの出力容量を制限します。

単体グリッドジョブ実行時のサブジョブ自動分散

GUIからデータ分割数や入出力ファイル名を指定するだけで,単体グリッドジョブ実行時に,サブジョブを自動的に分散実行できます。

JP1/AJS3連携

JP1/AJS3環境変数をUAPから参照できるようにします。

サブジョブ保留

特定のサブジョブの実行を一時的に保留するために,サブジョブ単位に保留/保留解除を設定します。

実行ノード共有

大量にグリッドジョブを実行するような場合などに,負荷を分散する目的で複数の管理ホストを配置して,実行ノードを共有した構成が組めます。

グリッドジョブ間のデータ連携

グリッドプロパティによる情報の引き継ぎ

グリッドジョブネットとしてジョブを実行するために,グリッドジョブ間でサブジョブの実行結果や実行状態を引き継ぎます。また,グリッドジョブ前処理プログラム,および後処理プログラムを呼び出すインタフェースを提供します。

グリッド実行ジョブの終了コード管理

一定数のサブジョブが警告/異常となってもグリッドジョブネットを続行できるようにするために,警告/異常サブジョブのしきい値を用いて,グリッド実行ジョブの終了状態を判定します。

単体グリッドジョブの終了コード管理

グリッド実行ジョブと同等の終了コード管理を行います。さらに,グリッド実行処理の終了状態の判定によってグリッド終了処理の実行可否を制御します。

実行したグリッドジョブに対する操作

グリッドジョブの強制終了

グリッドジョブの実行中に,ジョブ単位で整合が取れた状態で安全に中止するために,グリッド開始ジョブ,グリッド実行ジョブおよびグリッド終了ジョブを強制終了します。

グリッドジョブの再実行

処理時間を短縮するために,ビューホスト,コマンド,または再実行設定の自動登録オプションで選択したサブジョブだけを再実行します。

管理ホスト障害時のジョブ状態監視機能

ジョブ実行中に管理ホスト障害が発生した場合,ジョブ再実行によるUAPの二重起動を防止するために,ジョブ状態を監視した上でジョブを起動します。

グリッド開始ジョブおよびグリッド終了ジョブ実行中に管理ホスト障害が発生した場合,ジョブ状態を監視した上でジョブを起動します。

ジョブ実行中に兼用ホストで障害が発生した場合,ジョブ状態を監視した上でジョブを起動します。

ジョブの状態および実行結果の出力

次に示すグリッドジョブやサブジョブの実行状態や実行結果を出力します。

  • グリッドジョブの終了コードおよび実行状態

  • サブジョブごとの終了コードおよびC-TIME(CPU時間)・E-TIME(実行開始からの経過時間)

  • サブジョブの実行結果

グリッドプロパティの消去

単体グリッドジョブのグリッドプロパティを消去します。

ユーザ情報の管理(Windows)

ユーザ情報の管理

グリッドジョブを実行するユーザの情報(OSユーザ名およびパスワード)を管理します。

Hadoopとの連携(Linux)

Multiple job

Hadoopジョブの実行や停止,ジョブ情報の表示などを行います。