付録C.2 入力ファイルのエンコーディング

EURクライアント出力機能では,入力ファイルのデータの先頭にUnicode-BOMがある場合,Unicodeとして扱います。データの先頭にUnicode-BOMがない場合は,コードページに対応するシングルバイトまたはマルチバイトデータとして扱います。

<この項の構成>
(1) BOMと対応するエンコーディング
(2) BOMがない場合のエンコーディング

(1) BOMと対応するエンコーディング

先頭に付与するBOMと対応するエンコーディング方式を次の表に示します。

表C-2  Windows環境でのBOMと対応するエンコーディング方式

BOMエンコーディング方式
FEFFUTF-16(ビッグエンディアン)
FFFEUTF-16(リトルエンディアン)
EFBBBFUTF-8
なし対応する言語に従います。
詳細は,「付録C.2(2) BOMがない場合のエンコーディング」を参照してください。

(2) BOMがない場合のエンコーディング

データの先頭にUnicode-BOMがない場合,入力ファイルのエンコーディングは,ファイルを入力するOS環境の言語によって決定されます。入力ファイルをOS環境の言語に対応したエンコーディングで変換した場合は,デフォルトのエンコーディングで変換されます。

デフォルトのエンコーディング方式は,次の表に示すように,コードページ別に設定されます。

表C-3 Windows環境でのコードページ別のエンコーディング方式

コードページ言語エンコーディング方式
1252英語(US)Windows:CP1252
936簡体中国語GB-18030
932日本語Windows-31J
その他ISO8859-1
(凡例)
-:該当しません。