4.8.53 GRIDJOB_RETRY_COUNTパラメータ(ノードマネージャデーモンへの要求リトライ回数の定義)(Windows)
(1) 形式
[GRIDJOB_RETRY_COUNT 回数]
(2) 機能
グリッドジョブ実行時,実行ノード内でノードマネージャSPPからノードマネージャデーモンへのコネクション確立要求に失敗した場合に,ジョブマネージャSPPが同一の実行ノードにリトライする回数を指定します。
このパラメータは,次の場合,コネクション確立要求で処理に失敗するときに利用できます。
-
データ配置情報に実行ノードを1個だけ指定したジョブの場合
-
何らかのエラーで使用できる実行ノードが1台になった場合
(3) オペランド
- 回数 〜<符号なし整数>((0〜3600))《0》
-
グリッドジョブ実行時,実行ノード内でノードマネージャSPPからノードマネージャデーモンへのコネクション確立要求に失敗した場合に,ジョブマネージャSPPが同一の実行ノードにリトライする回数を指定します。0を指定した場合,コネクション確立要求が失敗するとジョブは異常終了します。
- 注意
-
設定ファイル(ugpsm.conf)のNODEINFO_WATCH_TIMEパラメータに小さい値を指定すると,ノードマネージャへの一括処理数取得要求後の応答が指定時間を過ぎてタイムアウトとなる場合があります。この場合,NODEINFO_WATCH_TIMEパラメータの処理が優先され,GRIDJOB_RETRY_COUNT,およびGRIDJOB_RETRY_INTERVALパラメータによる要求リトライが動作しません。そのため,ノードマネージャへの要求リトライ回数を指定する場合,NODEINFO_WATCH_TIMEパラメータの指定値にはノード間の通信環境を考慮した十分な値を指定するようにしてください。