Hitachi

uCosminexus Grid Processing Server 使用の手引


2.3.1 data-awareスケジュール

バッチジョブ分散実行システムでは,データが存在する場所でサブジョブを実行するように制御します。これをdata-awareスケジュールと呼びます。

データが存在する場所は,グリッド開始ジョブで定義したグリッドジョブ前処理プログラムによって,データ配置情報として指定します。データ配置情報の内容に従って,指定された実行ノードでサブジョブを実行します。

グリッド実行ジョブで,サブジョブの実行ノードを先行グリッドジョブと同じにするように定義した場合,1つのデータ識別子に複数の実行ノード名が対応づけられていても,先行グリッドジョブで実行された実行ノードで該当データを処理するサブジョブを実行します。一方,サブジョブを実行するノードを先行グリッドジョブと同じにしなくてもよいと定義した場合,1つのデータ識別子に複数の実行ノード名が対応づけられていると,ノードマネージャの使用状況を考慮しながら優先順位が付けられて,サブジョブの実行がスケジュールされます。単体グリッドジョブの場合は,このサブジョブを実行するノードを先行グリッドジョブと同じにしなくてもよいと定義した場合と同様にスケジュールされます。

〈この項の構成〉

(1) 実行ノードの決定と障害への対処

ジョブの実行多重度に空きが生じたことを契機にサブジョブを投入する実行ノードを決定するときは,データ配置情報に指定された実行ノードの中から使用状況を考慮しながら優先順位が付けられて選ばれます。また,データ配置情報に指定した実行ノードで障害が発生した場合,ほかの実行ノードにサブジョブが振り分けられます。

詳細については,「2.3.5 実行ノードの選択」,「2.3.10 スケジュールの平準化」および「2.3.11 リソース名による実行制御」を参照してください。