EURクライアント出力機能では,入力ファイルのデータの先頭にUnicode-BOMがある場合,Unicodeとして扱います。データの先頭にUnicode-BOMがない場合は,コードページに対応するシングルバイトまたはマルチバイトデータとして扱います。
先頭に付与するBOMと対応するエンコーディング方式を次の表に示します。
表C-2 Windows環境でのBOMと対応するエンコーディング方式
BOM | エンコーディング方式 |
---|---|
FEFF | UTF-16(ビッグエンディアン) |
FFFE | UTF-16(リトルエンディアン) |
EFBBBF | UTF-8 |
なし | 対応する言語に従います。 詳細は,「付録C.2(2) BOMがない場合のエンコーディング」を参照してください。 |
データの先頭にUnicode-BOMがない場合,入力ファイルのエンコーディングは,ファイルを入力するOS環境の言語によって決定されます。入力ファイルをOS環境の言語に対応したエンコーディングで変換した場合は,デフォルトのエンコーディングで変換されます。
デフォルトのエンコーディング方式は,次の表に示すように,コードページ別に設定されます。
表C-3 Windows環境でのコードページ別のエンコーディング方式
コードページ | 言語 | エンコーディング方式 |
---|---|---|
1252 | 英語(US) | Windows:CP1252 |
936 | 簡体中国語 | GB-18030 |
932 | 日本語 | Windows-31J |
その他 | - | ISO8859-1 |