付録C.2 入力ファイルのエンコーディング
EURクライアント出力機能では,入力ファイルのデータの先頭にUnicode-BOMがある場合,Unicodeとして扱います。データの先頭にUnicode-BOMがない場合は,コードページに対応するシングルバイトまたはマルチバイトデータとして扱います。
(1) BOMと対応するエンコーディング
先頭に付与するBOMと対応するエンコーディング方式を次の表に示します。
BOM |
エンコーディング方式 |
---|---|
FEFF |
UTF-16(ビッグエンディアン) |
FFFE |
UTF-16(リトルエンディアン) |
EFBBBF |
UTF-8 |
なし |
対応する言語に従います。 詳細は,「付録C.2(2) BOMがない場合のエンコーディング」を参照してください。 |
(2) BOMがない場合のエンコーディング
データの先頭にUnicode-BOMがない場合,入力ファイルのエンコーディングは,ファイルを入力するOS環境の言語によって決定されます。入力ファイルをOS環境の言語に対応したエンコーディングで変換した場合は,デフォルトのエンコーディングで変換されます。
デフォルトのエンコーディング方式は,次の表に示すように,コードページ別に設定されます。
コードページ |
言語 |
エンコーディング方式 |
---|---|---|
1252 |
英語(US) |
Windows:CP1252 |
936 |
簡体中国語 |
GB-18030 |
932 |
日本語 |
Windows-31J |
その他 |
− |
ISO8859-1 |