付録I.1 文字コード体系とエンコード
入力レコードの文字列データを表現するコード体系とエンコード種別を,次の表に示します。
コード体系 |
文字種別 |
SORT EE |
SORT |
|||
---|---|---|---|---|---|---|
英数字 |
カタカナ |
漢字・外字など |
||||
ASCII |
ASCII |
− |
− |
○※4 |
○※2 |
|
JIS8 |
ASCII |
JIS8 |
− |
○※4 |
○※2 |
|
JIS X 0201 |
Shift_JIS |
JIS8 |
JIS8 |
2バイト符号化 |
○※1 |
○※2 |
JIS X 0208 |
EUC |
G0 |
G2 |
G1,G3,EUC-HJ領域 |
○※1 |
− |
G1,G3 |
− |
○※2 |
||||
Unicode |
UCS-2 |
基本ラテン文字 U+0020〜U+007F |
半角形/全角形 U+FF00〜FFFD |
CJK統合漢字など |
○※3 |
× |
UCS-4 |
基本ラテン文字 U+0020〜U+007F |
半角形/全角形 U+FF00〜FFFD |
CJK統合漢字,CJK統合漢字拡張など |
○※3 |
× |
文字コード/エンコード種別※1 |
説明 |
コード範囲 |
---|---|---|
ASCII |
ASCIIコード+JIS8 (JIS 8ビット単位コードを含みます) |
|
SJIS |
Shift-JIS (Windowsは「Microsoftコードページ932」が該当します) |
|
EUC-JP |
日本語EUC G0:ASCII G1:JIS X 0213第1面 G2:JIS X 0201カタカナ G3:JIS X 0213第2面 (Windowsは「Microsoftコードページ51932」が該当します) |
|
EUC-HJ※3 |
日本語EUC(EUC-HJ) G0:ASCII G1:JIS X 0213第1面 G2:JIS X 0201カタカナ EUC-HJ領域 |
|
UTF-8 |
8ビット単位のUnicode符号化方式 (Windowsは「Microsoftコードページ65001」が該当します) |
|
UCS-2LE |
Little endianの2オクテット (16bit)文字コード |
|
UCS-2BE |
Big endianの2オクテット (16bit)文字コード |
|
UCS-4LE |
Little endianの4オクテット (32bit)文字コード |
|
UCS-4BE |
Big endianの4オクテット (32bit)文字コード |
|
UTF-16LE |
little endianの16ビット単位のUnicode符号化方式(Windowsは「Microsoftコードページ1200」が該当します) |
|
UTF-16BE |
big endianの16ビット単位のUnicode符号化方式(Windowsは「Microsoftコードページ1201」が該当します) |
|
UTF-32LE |
little endianの32ビット単位のUnicode符号化方式(Windowsは「Microsoftコードページ12000」が該当します) |
|
UTF-32BE |
big endianの32ビット単位のUnicode符号化方式(Windowsは「Microsoftコードページ12001」が該当します) |