EURでは,入力ファイルのデータの先頭にUnicode-BOMがある場合,Unicodeとして扱います。データの先頭にUnicode-BOMがない場合は,コードページに対応するシングルバイトまたはマルチバイトデータとして扱います。
先頭に付与するBOMと対応するエンコーディングを,OS環境ごとに次に示します。
表D-3 Windows環境でのBOMと対応するエンコーディング方式
BOM | エンコーディング方式 |
---|---|
FEFF | UTF-16(ビッグエンディアン) |
FFFE | UTF-16(リトルエンディアン) |
EFBBBF | UTF-8 |
なし | 対応する言語に従います。 詳細は,「付録D.2(2) BOMがない場合のエンコーディング」を参照してください。 |
表D-4 UNIX/Linux環境でのBOMと対応するエンコーディング方式
BOM | エンコーディング方式 |
---|---|
FEFF | UTF-16(ビッグエンディアン) |
FFFE | UTF-16(リトルエンディアン) |
なし | 対応する言語に従います。 詳細は,「付録D.2(2) BOMがない場合のエンコーディング」を参照してください。 |
データの先頭にUnicode-BOMがない場合,入力ファイルのエンコーディングは,ファイルを入力するOS環境の言語によって決定されます。入力ファイルをOS環境の言語に対応したエンコーディングで変換した場合は,デフォルトのエンコーディングで変換されます。
表D-5 Windows環境でのコードページ別のエンコーディング方式
コードページ | 言語 | エンコーディング方式 |
---|---|---|
1252 | 英語(US) | Windows:CP1252 |
936 | 簡体中国語 | GB-18030 |
932 | 日本語 | Windows-31J |
その他 | - | ISO8859-1 |
表D-6 UNIX/Linux環境でのロケール名ごとのエンコーディング方式
OS | ロケール名 | エンコーディング方式 |
---|---|---|
HP-UX (IPF) | C.iso88591 | ISO8859-1 |
en_US.iso885915 | ISO8859-15 | |
ja_JP.SJIS | Windows-31J | |
ja_JP.eucJP | EUCJP-ms改※ | |
zh_CN.utf8 ja_JP.utf8 | UTF-8 | |
zh_CN.hp15CN | GB18030 | |
zh_CN.gb18030 | GB18030 | |
その他 | ISO8859-1 | |
AIX | C | ISO8859-1 |
en_US | ISO8859-15 | |
Ja_JP | Windows-31J | |
ja_JP | EUCJP-ms改※ | |
ZH_CN JA_JP | UTF-8 | |
zh_CN | GB18030 | |
Zh_CN | GB18030 | |
その他 | ISO8859-1 | |
Linux | C.ISO-8859-1 | ISO8859-1 |
en_US.ISO-8859-15 | ISO8859-15 | |
ja_JP.eucJP | EUCJP-ms改※ | |
zh_CN.UTF-8 ja_JP.UTF-8 | UTF-8 | |
zh_CN.GB2312 | GB18030 | |
zh_CN.GBK | GB18030 | |
zh_CN.GB18030 | GB18030 | |
その他 | ISO8859-1 |