可変長データのCSVファイルのソート,マージ,およびコピーができます。
CSVファイルとは,幾つかのデータをコンマで区切ったテキストデータ,またはテキストファイルのことを指しますが,SORT EEでは,コンマ以外の任意の文字をデータの区切りに指定することもできます。
SORT EEのCSVファイルは,改行文字で複数のレコードに区切られ,さらに各レコードは任意の文字によって複数のデータ項目「セル」に区切られます。
SORT EEで扱うCSVファイルの形式を次の図に示します。
図C-1 SORT EEで扱うCSVファイルの形式
![[図データ]](figure/zx010050.gif)
SORT EEでは,CSVファイルの仕様を次のとおりに規定しています。
- 改行文字をレコードの区切りとします(最終レコードの改行文字はなくてもかまいません)。
- レコードは,区切り文字である「デリミタ」によって,複数のデータ項目「セル」に区切られます。
- レコード長は可変長となります。
- 実データのないセルのことを,「ナル文字列(データなしセル)」と言います。
- セル数0個は,改行文字だけの空レコードを意味します。この場合は,すべてのセルがナル文字列であると仮定してソートの対象にします。
- セルデータに,改行文字またはデリミタを含む場合,セルデータを引用符で囲んでください。
- セルデータに引用符を含む場合,引用符を二つ並べてエスケープしてください(エスケープされていない引用符の直前までがセルデータと見なされます)。
CSVファイルのサイズを,次の表に示します。
表C-1 CSVファイルのサイズ
項目 | 範囲 | 説明 |
---|
レコード数 | 1~2,147,483,647件 (1~2G-1件) | レコード件数が0件の場合は処理されません(空のファイルが出力されます)。 |
レコード長 | 1~65,535バイト | - 改行文字をCRLFとした場合,最大長は65,534バイトとなります。
- 改行文字をLFとした場合,最大長は65,535バイトとなります。
- 改行文字,およびすべてのデリミタおよびセルデータを含めた長さが,65,536バイトを超えてはなりません。
- 入力レコード長を指定する-inpfileパラメタのreclenオペランドは省略できます。省略すると,ソート機能で一時ファイルを使用する場合があるので注意してください。reclenオペランドの詳細は,「5.8.3 reclenオペランド」を参照してください。
|
ファイル容量 | 0バイト以上(OSの制限に準拠) | 4GBを超えるファイルの指定ができます。 |
セル数 | 0~16,384個/レコード | - ナル文字列(データなしセル)の個数も含まれます。
- キーに指定できるセルの個数は最大64個です。
|
セル長 | 最小:0バイト 最大:65,535バイト | - セル長が0バイトとは,ナル文字列(データなしセル)のことを表します。
- 改行文字をCRLFとした場合,最大長は65,534バイトとなります。
- 改行文字をLFとした場合,最大長は65,535バイトとなります。
- マルチバイト文字(日本語)の途中で最大長を超えた場合,超えた部分のマルチバイト文字以降は無視されます。
|