ソートマージ


5.8.13 codetypeオペランド

意味

入力データのエンコード(文字コード)の種類を指定します。

このオペランドに指定したエンコード(文字コード)で,CSVファイルの区切り文字(デリミタ),引用符,文字属性コード「w」,「u」および「v」を解析します。

このオプションは,テキストファイル,およびCSVファイルだけに有効です。

形式
codetype= encode
指定値

encodeに指定する値を次の表に示します。

encode

意味

ASCII

入力データの文字コードがASCII(JIS8コードを含む0x00〜0xFFの範囲)であることを示します。

SJIS

入力データの文字コードがShift_JISであることを示します。

EUC-JP

入力データの文字コードが日本語EUCであることを示します。

EUC-HJ

入力データの文字コードがEUC-HJであることを示します。

UTF-8

入力データのエンコードがUTF-8であることを示します。

UCS-2LE

入力データの文字コードがUCS-2 little endianであることを示します。

UCS-2BE

入力データの文字コードがUCS-2 big endianであることを示します。

UCS-4LE

入力データの文字コードがUCS-4 little endianであることを示します。

UCS-4BE

入力データの文字コードがUCS-4 big endianであることを示します。

UTF-16LE

入力データのエンコードがUTF-16 little endianであることを示します。

UTF-16BE

入力データのエンコードがUTF-16 big endianであることを示します。

UTF-32LE

入力データのエンコードがUTF-32 little endianであることを示します。

UTF-32BE

入力データのエンコードがUTF-32 big endianであることを示します。

UNICODE

入力ファイルのUnicodeシグニチャ(BOM)形式を適用します。

SORT EEで使用できるBOMの種類は次のとおりです。

  • UTF-8…0xEFBBBF(3バイト)

  • UTF-16LE…0xFFFE(2バイト)

  • UTF-16BE…0xFEFF(2バイト)

  • UTF-32LE…0xFFFE0000(4バイト)

  • UTF-32BE…0x0000FEFF(4バイト)

  • このオペランドを省略した場合,環境ファイル「EXS_CODETYPE」に指定したエンコードが仮定されます。

  • このオペランドと環境ファイル「EXS_CODETYPE」の両方の指定を省略した場合,「SJIS」が仮定されます。

  • 「UNICODE」では,入力ファイルが複数個の場合,先頭の入力ファイルのBOM形式を適用します。

  • 「UNICODE」で,最初の入力ファイルにBOMがない場合,次に示すプラットフォームに対応したエンコードを仮定します。

    プラットフォーム

    エンコード

    AIX,HP-UX

    UTF-16BE

    Linux

    UTF-8

    Windows

    UTF-16LE

注意事項
  • 入力ファイルが固定長順編成ファイルまたは可変長順編成ファイルの場合,このオペランドを指定できません。指定した場合,KBLS2209-Eメッセージを出力し,エラーになります。

  • 入力データと異なるエンコード(文字コード)を指定した場合,デリミタを正しく解析できず,exsortコマンドの実行結果が不当になるおそれがあります。

  • 入力ファイルが複数個の場合,入力データのエンコード(文字コード)は統一されていなければなりません。入力ファイルによってエンコード(文字コード)が異なると,改行文字やデリミタを正しく解析できず,exsortコマンドの実行結果が不当になるおそれがあります。

  • BOM付きの入力ファイルを指定する場合,BOMの読み飛ばしを指定する環境変数「EXSORTBOMLNGIN(64ビット版は「EXSORT64BOMLNGIN」)」または「EXSORTBOMGETPUT(64ビット版は「EXSORT64BOMGETPUT」)」を指定してください。これらの環境変数の指定がない場合,入力ファイルのBOMを読み飛ばさずに,レコードデータとして処理します。なお,環境変数「EXSORTBOMLNGIN(64ビット版は「EXSORT64BOMLNGIN」)」および「EXSORTBOMGETPUT(64ビット版は「EXSORT64BOMGETPUT」)」については「14.1 SORT EEの環境変数の設定」を参照してください。

  • 出力ファイルのBOMの有無と種類を指定する場合は,環境変数「EXSORTBOMLNGOUT(64ビット版は「EXSORT64BOMLNGOUT」)」または「EXSORTBOMGETPUT(64ビット版は「EXSORT64BOMGETPUT」)」を指定してください。なお,環境変数「EXSORTBOMLNGOUT(64ビット版は「EXSORT64BOMLNGOUT」)」または「EXSORTBOMGETPUT(64ビット版は「EXSORT64BOMGETPUT」)」については「14.1 SORT EEの環境変数の設定」を参照してください。

  • 出力レコードフォーマット機能(format,csvformatオペランド)を組み合わせた場合,指定するencodeは「ASCII」,「SJIS」,「UTF-8」です。encodeに「ASCII」,「SJIS」,「UTF-8」以外を指定した場合,KBLS2209-Eエラーとなります。