付録C.1 CSVファイル形式
可変長データのCSVファイルのソート,マージ,およびコピーができます。
CSVファイルとは,幾つかのデータをコンマで区切ったテキストデータ,またはテキストファイルのことを指しますが,SORT EEでは,コンマ以外の任意の文字をデータの区切りに指定することもできます。
SORT EEのCSVファイルは,改行文字で複数のレコードに区切られ,さらに各レコードは任意の文字によって複数のデータ項目「セル」に区切られます。
SORT EEで扱うCSVファイルの形式を次の図に示します。
SORT EEでは,CSVファイルの仕様を次のとおりに規定しています。
-
改行文字をレコードの区切りとします(最終レコードの改行文字はなくてもかまいません)。
-
レコードは,区切り文字である「デリミタ」によって,複数のデータ項目「セル」に区切られます。
-
レコード長は可変長となります。
-
実データのないセルのことを,「NULLセル(空のセル)」と言います。
-
セル数0個は,改行文字だけの空レコードを意味します。この場合は,すべてのセルがNULLセルであると仮定してソートの対象にします。
-
セルデータに,改行文字またはデリミタを含む場合,セルデータを引用符で囲んでください。
-
セルデータに引用符を含む場合,引用符を二つ並べてエスケープしてください(エスケープされていない引用符の直前までがセルデータと見なされます)。
CSVファイルのサイズを,次の表に示します。
項目 |
範囲 |
説明 |
---|---|---|
レコード数 |
1〜2,147,483,647件 (1〜2G-1件) |
レコード件数が0件の場合は処理されません(空のファイルが出力されます)。 |
レコード長 |
1〜レコード長の上限値 |
|
ファイル容量 |
0バイト以上(OSの制限に準拠) |
4GBを超えるファイルの指定ができます。 |
セル数 |
0〜16,384個/レコード |
|
セル長 |
最小:0バイト 最大:レコード長の上限値 |
|