ソートマージ

[目次][用語][索引][前へ][次へ]

付録C.1 CSVファイル形式

可変長データのCSVファイルのソート,マージ,およびコピーができます。

CSVファイルとは,幾つかのデータをコンマで区切ったテキストデータ,またはテキストファイルのことを指しますが,SORT EEでは,コンマ以外の任意の文字をデータの区切りに指定することもできます。

SORT EEのCSVファイルは,改行文字で複数のレコードに区切られ,さらに各レコードは任意の文字によって複数のデータ項目「セル」に区切られます。

SORT EEで扱うCSVファイルの形式を次の図に示します。

図C-1 SORT EEで扱うCSVファイルの形式

[図データ]

SORT EEでは,CSVファイルの仕様を次のとおりに規定しています。

CSVファイルのサイズを,次の表に示します。

表C-1 CSVファイルのサイズ

項目 範囲 説明
レコード数 1〜2,147,483,647件
(1〜2G-1件)
レコード件数が0件の場合は処理されません(空のファイルが出力されます)。
レコード長 1〜65,535バイト
  • 改行文字をCRLFとした場合,最大長は65,534バイトとなります。
  • 改行文字をLFとした場合,最大長は65,535バイトとなります。
  • 改行文字,およびすべてのデリミタおよびセルデータを含めた長さが,65,536バイトを超えてはなりません。
  • 入力レコード長を指定する-inpfileパラメタのreclenオペランドは省略できます。省略すると,ソート機能で一時ファイルを使用する場合があるので注意してください。reclenオペランドの詳細は,「5.8.3 reclenオペランド」を参照してください。
ファイル容量 0バイト以上(OSの制限に準拠) 4GBを超えるファイルの指定ができます。
セル数 0〜16,384個/レコード
  • ナル文字列(データなしセル)の個数も含まれます。
  • キーに指定できるセルの個数は最大64個です。
セル長 最小:0バイト
最大:65,535バイト

  • セル長が0バイトとは,ナル文字列(データなしセル)のことを表します。
  • 改行文字をCRLFとした場合,最大長は65,534バイトとなります。
  • 改行文字をLFとした場合,最大長は65,535バイトとなります。
  • マルチバイト文字(日本語)の途中で最大長を超えた場合,超えた部分のマルチバイト文字以降は無視されます。