uCosminexus Interschema ユーザーズガイド

[目次][用語][索引][前へ][次へ]

付録K.1 文字コード一覧

トランスレータが扱う文字コードの一覧(詳細)を次に示します。

表K-1 文字コード一覧(詳細)

コード指定子 コード範囲 0x
<文字種別>※1
種別 説明
JIS8 <0201R> 00-7f
<0201K> a1-df
1バイト

JIS-X0201 (8bit)
JIS-X0201をフルサポートしています。
JIS7 <ISO> 00-7f 1バイト

ISO/IEC 646 (7bit)
一般的にはASCIIコードです。
JIS-X0201のラテン文字部分として扱います。
JIS7A <ISO> 20-60,7b-7e 1バイト

ISO/IEC 646 制御コードと英小文字を除く
UN/EDIFACT Aセット文字用コードです。
ISO8859 <ISO> 00-7f
<8859G1> a1-ff
1バイト

ISO-8859
GLはJIS7での扱いです。
GRは他コードへの変換できません。
EBCDIC 1バイト

日立EBCDIC
JIS-X0201との間でテーブル変換します。
EBCDIK 1バイト

日立EBCDIK
JIS-X0201との間でテーブル変換します。
IBM_EBCDIC 1バイト

IBM EBCDIC
EBCDIC-C-US (cp00281)です。
JIS-X0201との間でテーブル変換します。
かな文字は含みません。
IBM_EBCDIK 1バイト

IBM EBCDIK
EBCDIC-JP-Kana (cp00290拡張前)です。
JIS-X0201との間でテーブル変換します。
英小文字は含みません。
JISK <0208>[1st] 21-7e
<0208>[2nd] 21-7e
2バイト

JIS-X0208 (JIS漢字)
JIS-X0208-1990です。
文字チェックはUnicodeテーブルとのマッチングによって行います。
JISKS JISKを参照 2バイト

JIS-X0208 シフトIN/OUT付き
JISKに対してシフトコードを付けたものです。
開始:0x1B2442(2バイト文字へ遷移)
終了:0x1B284A(1バイト文字へ遷移)
終了シフトコード以降は,JIS-X0201のスペース文字(0x20)だけ許します。ただし,データとしては扱いません。
KEIS (基本)[1st] a1-cf
(基本)[2nd] a1-fe
(拡張)[1st] d0-fe
(拡張)[2nd] a1-fe
(ユーザ)[1st] 41-a0
(ユーザ)[2nd] a1-fe
2バイト

KEIS (日立漢字コード)
KEIS’83 (KEIS’90で追加された文字にも対応)です。
JIS-X0208との間で変換できます。
KEISS KEISを参照 2バイト

KEIS シフトIN/OUT付き
KEISに対してシフトコードを付けたものです。
開始:0x0A42(2バイト文字へ遷移)
終了:0x0A41(1バイト文字へ遷移)
終了シフトコード以降は,EBCDIKのスペース文字(0x40)だけ許します。ただし,データとしては扱いません。
SJISK [1st] 81-9f, e0-ef
[2nd] 40-7e,80-fc
(IBM拡張)[1st] fa-fc
(IBM拡張)[2nd]40-7e,80-fc
(ユーザ)[1st] f0-f9
(ユーザ)[2nd] 40-7e,80-fc
2バイト

Shift-JIS 2バイトコード
SJISの2バイトコードだけで構成されます。SJISを参照してください。
IBM [1st] 41-68
[2nd] 41-fe
(ユーザ)[1st] 69-7f
(ユーザ)[2nd] 41-fe
2バイト

IBM DBCS-Host (IBM漢字コード)
IBM'83です。
SJISとの間でテーブル変換します。
JEF [1st] a1-fe※2
[2nd] a1-fe※2
(拡張)[1st] 41-7d, 7f
(拡張)[2nd] a1-fe
(ユーザ)[1st] 80-a0
(ユーザ)[2nd] a1-fe
2バイト

JEF (富士通漢字コード)
JIS-C6226-1978との間で変換できます。
JEF拡張領域,ユーザ定義文字を共に外字領域として扱います。
CJIS <0208>[1st] 21-7e
<0208>[2nd] 21-7e
<0212>[1st] a1-fe
<0212>[2nd] 21-7e
2バイト

CII用 JIS-X0208 + JIS-X0212
CII 2.10以降で使用される組み合わせコードです。
JIS-X0212に対してMSB操作をします。
ISOJP <ISO/0201R> 00-7f
<0208>[1st] 21-7e
<0208>[2nd] 21-7e
混在

ISO-2022-Jp
ISO-2022に従って7bitの範囲でASCIIとJIS-X0208を切り替える文字コードです。
JIS-X0201(かな),JIS-X0212は使用できません。
シフトコードは次のとおりです。
  • 0x1B284A:JIS-X0201 (ROMAN)
  • 0x1B2440:JIS-C6226 (JIS-X0208-1978)
  • 0x1B2442:JIS-X0208
Interschemaの文字コード変換で出力する場合,次のシフトコードは出力されません。
  • 0x1B2842:ISO/IEC 646
SJIS <0201R> 00-7f
<0201K> a1-df
[1st] 81-9f, e0-ef
[2nd] 40-7e,80-fc
(ユーザ)[1st] f0-f9
(ユーザ)[2nd] 40-7e,80-fc
(IBM拡張)[1st] fa-fc
(IBM拡張)[2nd]40-7e,80-fc
混在

Shift-JIS
1バイトコード:JIS-X0201
2バイトコード:JIS-X0208を変換したものです。
IBM拡張文字は,Unicodeとの間で変換できます。
EUC <0201R> 00-7f
<0201K>(SC) 8e
<0201K> a1-df
<0208>[1st] a1-fe
<0208>[2nd] a1-fe
<0212>(SC) 8f
<0212>[1st] a1-fe
<0212>[2nd] a1-fe
(ユーザA)[1st] a1-fe
(ユーザA)[2nd] 21-7e
(ユーザB)[1st] f5-fe
(ユーザB)[2nd] a1-fe
混在

Extended UNIX Code
JIS-X0201(かな)とJIS-X0212に対してはシフトコード(1バイト,その文字だけに有効)を付けます。
ユーザ定義文字はA(EUC-HJの外字領域),Bどちらでも使用できます。
UNIC (領域A)[1st] 00-4d
(領域A)[2nd] 00-ff
(領域I)[1st] 4e-9f
(領域I)[2nd] 00-ff
(領域R)(ユーザ)[1st] e0-f8
(領域R)(ユーザ)[2nd] 00-ff
混在

Unicode (UCS-2)
各文字を2バイトで表します。
JISコードとの変換は対応テーブルによります。
UCS4 UNICを参照 混在

Unicode (UCS-4)
各文字を4バイトで表します。変換テーブルはUNICと同様です。
UTF8 UNICを参照 混在

Unicode (UTF-8)
各文字をUCSの文字コードで実際に使用されているビット数に応じた長さで表します。
変換テーブルはUNICと同様です。
UTF16 UNICを参照 混在

Unicode (UTF-16)
U+10000からU+10FFFFの範囲をUnicode規格内で予約された領域を使い,二つの16ビットデータの組み合わせで1文字を表現(サロゲートペア)します。
サロゲートペア以外はUCS-2と同様です。
変換テーブルはUNICと同様です。
JISE <0201R> 00-7f
<0201K> a1-df
<0208>[1st] 21-7e
<0208>[2nd] 21-7e
<0212>[1st] a1-fe
<0212>[2nd] a1-fe
混在

JEDICOS文字セット
ISO-2022に従ってJIS-X0201,JIS-X0208,JIS-X0212を切り替えます。
シフトコードは次のとおりです。
  • 0x1B284A:JIS-X0201 (ROMAN)
  • 0x1B2949:JIS-X0201 (かな)
  • 0x1B2442:JIS-X0208
  • 0x1B242944:JIS-X0212
Interschemaの文字コード変換で出力する場合,次のシフトコードは出力されません。
  • 0x1B2842:ISO/IEC 646
  • 0x1B2849:JIS-X0201 (かな)
  • 0x1B2440:JIS-C6226 (JIS-X0208-1978)
  • 0x1B242844:JIS-X0212
KEIS_EBCDIC_MIX KEIS,EBCDICを参照 混在

KEIS+EBCDIC混在
Shift-In:0x0A41(1バイト文字へ遷移)
Shift-Out:0x0A42(2バイト文字へ遷移)
KEIS_EBCDIK_MIX KEIS,EBCDIKを参照 混在

KEIS+EBCDIK混在
Shift-In:0x0A41(1バイト文字へ遷移)
Shift-Out:0x0A42(2バイト文字へ遷移)
IBM_EBCDIC_MIX IBM,IBM_EBCDICを参照 混在

IBM+IBM_EBCDIC混在
Shift-In:0x0F(1バイト文字へ遷移)
Shift-Out:0x0E(2バイト文字へ遷移)
IBM_EBCDIK_MIX IBM,IBM_EBCDIKを参照 混在

IBM+IBM_EBCDIK混在
Shift-In:0x0F(1バイト文字へ遷移)
Shift-Out:0x0E(2バイト文字へ遷移)
JEF_EBCDIC_MIX JEF,IBM_EBCDICを参照 混在

JEF+IBM_EBCDIC混在
Shift-In:0x29(1バイト文字へ遷移)
Shift-Out:0x28(2バイト文字へ遷移)
JEF_EBCDIK_MIX JEF,IBM_EBCDIKを参照 混在

JEF+IBM_EBCDIK混在
Shift-In:0x29(1バイト文字へ遷移)
Shift-Out:0x28(2バイト文字へ遷移)

(凡例)
1st:第1バイトです。
2nd:第2バイトです。
ユーザ:ユーザ定義文字です。
SC:シフトコードです。
1バイト:1バイト文字コードです。
2バイト:2バイト文字コードです。
混在:1バイト/2バイト混在文字コードです。
−:該当しません。

注※1
文字種別については,「付録K.2 文字種別」を参照してください。

注※2
2バイト文字の値として「0xa1a1」を除きます。