3.1.4　抽出したデータの文字コード変換

異なる文字コードのシステム間でデータ抽出・反映する場合，抽出したデータの文字コードを反映側の文字コードに合わせて変換できます。

ここでは，変換できる文字コードについて説明します。この機能の使用方法については，「4.2.3　データ抽出・反映の付加機能」を参照してください。

〈この項の構成〉

(1)　文字コード変換の対象となるデータ型
(2)　変換できる文字コード
(3)　変換できる文字コードの範囲
(4)　SJISからEUCへの文字コード変換
(5)　SJISからUTF-8への文字コード変換
(6)　SJISからUTF-16への文字コード変換
(7)　EUCからSJISへの文字コード変換
(8)　EUCからUTF-8への文字コード変換
(9)　EUCからUTF-16への文字コード変換
(10)　UTF-8からSJISまたはEUCへの文字コード変換
(11)　UTF-8からUTF-16への文字コード変換
(12)　UTF-16からSJISへの文字コード変換
(13)　UTF-16からEUCへの文字コード変換
(14)　UTF-16からUTF-8への文字コード変換
(15)　文字コード変換後の値の求め方

(1)　文字コード変換の対象となるデータ型

文字コード変換の対象となる抽出データのデータ型を次に示します。

CHAR^※1※2※3
VARCHAR^※1※2※3
MCHAR^※1※3
MVARCHAR^※1※3
NCHAR^※1
NVARCHAR^※1
SGMLTEXT^※1※4
FREEWORD^※1

注※1

ナル値情報ファイルにNOCODECONVを指定した場合，列単位にコード変換の対象から外すことができます。ナル値情報ファイルの指定方法については，「4.2.4　xtrepコマンドで指定するファイルの内容」を参照してください。

注※2

次の場合での文字集合列への反映は，文字コード変換対象となりません。

環境変数XTCSETUSEにyesを指定した場合
環境変数XTORANCSET，またはXTSQLNCSETにutf-16を指定した場合

注※3

環境変数XTDATALOCALEにutf-16BE，またはutf-16LEを指定して文字コード変換する場合，データ長を偶数バイトにしてください。奇数バイトの場合，エラー終了します。

注※4

HiRDBに反映しないでファイルだけを作成する場合は，BLOB属性と解釈するためにコード変換の対象外となります。ただし，次のどちらかによってコード変換対象にすることができます。

ナル値情報ファイルでCODECONVを指定します。

指定方法については，「4.2.4　xtrepコマンドで指定するファイルの内容」を参照してください。
反映情報ファイルでSGMLTEXT型を指定します。

指定方法については，「4.2.4　xtrepコマンドで指定するファイルの内容」を参照してください。

なお，作成したファイルをpdloadの入力ファイルとして使用する場合は，この方法で変換対象としてください。

抽出側の文字コード	反映側の文字コード
抽出側の文字コード	SJIS	EUC	UTF-8	UTF-16BE^※	UTF-16LE^※
SJIS	−	○	○	○	○
EUC	○	−	○	○	○
UTF-8	○	○	−	○	○
UTF-16BE^※	○	○	○	−	○
UTF-16LE^※	○	○	○	○	−

第1バイト	第2バイト	第3バイト	変換規則
0x00〜0x7F	−	−	1バイトコードと認識し，対応するコードに変換
0x80〜0xBF	0x00〜0xFF	−	0x20に変換
0x80〜0xBF	−	−	0x20に変換
0xC2〜0xDE	0x80〜0xFF	−	2バイトコードと認識し，対応するコードに変換
	上記以外	−	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
	−	−	未完全コードと認識し，変換しないでスキップ
0xDF	0x80〜0xBF	−	2バイトコードと認識し，対応するコードに変換
	上記以外	−	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
	−	−	未完全コードと認識し，変換しないでスキップ
0xE0	0xA0〜0xFF	0x80〜0xFF	3バイトコードと認識し，対応するコードに変換
		上記以外	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		−	未完全コードと認識し，変換しないでスキップ
	上記以外	0x80〜0xFF	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		上記以外	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		−	未完全コードと認識し，変換しないでスキップ
	−	−	未完全コードと認識し，変換しないでスキップ
0xE1〜0xEE	0x80〜0xFF	0x80〜0xFF	3バイトコードと認識し，対応するコードに変換
		上記以外	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		−	未完全コードと認識し，変換しないでスキップ
	上記以外	0x80〜0xFF	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
	上記以外	−	未完全コードと認識し，変換しないでスキップ
	−	−	未完全コードと認識し，変換しないでスキップ
0xEF	0x80〜0xBF	0x80〜0xBF	3バイトコードと認識し，対応するコードに変換
		上記以外	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		−	未完全コードと認識し，変換しないでスキップ
	上記以外	0x80〜0xBF	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		上記以外	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
		−	未完全コードと認識し，変換しないでスキップ
	−	−	未完全コードと認識し，変換しないでスキップ
0xF0〜0xED	−	−	環境変数XTUTF8UCS4CHKの指定に従って行データをスキップし，処理を中断指定がない場合は環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換
上記以外	−	−	環境変数XTUNDEF，またはXTDATAUNDEFの指定に従って変換

Unicode （16進数）	UTF-8 （2進数）
Unicode （16進数）	1バイト目	2バイト目	3バイト目	4バイト目	5バイト目	6バイト目
00000000〜0000007f	0vvvvvvv	−	−	−	−	−
00000080〜000007ff	110vvvvv	10vvvvvv	−	−	−	−
00000800〜0000ffff	1110vvvv	10vvvvvv	10vvvvvv	−	−	−
00010000〜001fffff	11110vvv	10vvvvvv	10vvvvvv	10vvvvvv	−	−
00200000〜03ffffff	111110vv	10vvvvvv	10vvvvvv	10vvvvvv	10vvvvvv	−
04000000〜7fffffff	1111110v	10vvvvvv	10vvvvvv	10vvvvvv	10vvvvvv	10vvvvvv

3.1.4 抽出したデータの文字コード変換

(1) 文字コード変換の対象となるデータ型

(2) 変換できる文字コード

(3) 変換できる文字コードの範囲

(4) SJISからEUCへの文字コード変換

(a) 1バイトコード

(b) 2バイトコード（SJIS標準漢字領域）

(c) 2バイトコード（外字領域）

(d) 2バイトコード（上記(b)(c)以外）

(5) SJISからUTF-8への文字コード変換

(a) 1バイトコード

(b) 2バイトコード（標準文字セット）

(c) 2バイトコード（外字コード）

(d) 2バイトコード（上記(b)(c)以外）

(6) SJISからUTF-16への文字コード変換

(a) 1バイトコード

(b) 2バイトコード（標準文字セット）

(c) 2バイトコード（外字コード）

(d) 2バイトコード（上記(b)(c)以外）

(7) EUCからSJISへの文字コード変換

(a) 1バイトコード

(b) 2バイトコード（標準漢字コード）

(c) 2バイトコード（外字コード）

(d) 2バイトコード（上記(b)(c)以外）

(8) EUCからUTF-8への文字コード変換

(a) 1バイトコード

(b) 2バイトコード（標準文字セット）

(c) 3バイトコード（外字コード）

(d) 2バイトコードまたは3バイトコード（上記(b)(c)以外）

(9) EUCからUTF-16への文字コード変換

(a) 1バイトコード

(b) 2バイトコード（標準文字セット）

(c) 3バイトコード（外字コード）

(d) 2バイトコードまたは3バイトコード（上記(b)(c)以外）

(10) UTF-8からSJISまたはEUCへの文字コード変換

(a) 1バイトコード

(b) 2バイトコードおよび3バイトコード（標準漢字コード）

(c) 3バイトコード（外字コード）

(d) 2バイトコードまたは3バイトコード（上記(b)(c)以外）

(e) 4バイト以上のコード

(11) UTF-8からUTF-16への文字コード変換

(a) 1バイトコード

(b) 2バイトコードおよび3バイトコード（標準漢字コード）

(c) 3バイトコード（外字コード）

(d) 2バイトコードまたは3バイトコード（上記(b)(c)以外）

(12) UTF-16からSJISへの文字コード変換

(a) 2バイトコード

(b) 2バイトコード（外字コード）

(c) 4バイトコード（補助多言語面）

(13) UTF-16からEUCへの文字コード変換

(a) 2バイトコード

(b) 2バイトコード（外字コード）

(c) 4バイトコード（補助多言語面）

(14) UTF-16からUTF-8への文字コード変換

(a) 2バイトコード

(b) 2バイトコード（外字コード）

(c) 4バイトコード（補助多言語面）

(15) 文字コード変換後の値の求め方

(a) UnicodeからUTF-8へのエンコード

(b) UTF-8からUnicodeへのデコード

(c) UnicodeからUTF-16へのエンコード

(d) UTF-16からUnicodeへのデコード

3.1.4　抽出したデータの文字コード変換

(1)　文字コード変換の対象となるデータ型

(2)　変換できる文字コード

(3)　変換できる文字コードの範囲

(4)　SJISからEUCへの文字コード変換

(a)　1バイトコード

(b)　2バイトコード（SJIS標準漢字領域）

(c)　2バイトコード（外字領域）

(d)　2バイトコード（上記(b)(c)以外）

(5)　SJISからUTF-8への文字コード変換

(a)　1バイトコード

(b)　2バイトコード（標準文字セット）

(c)　2バイトコード（外字コード）

(d)　2バイトコード（上記(b)(c)以外）

(6)　SJISからUTF-16への文字コード変換

(a)　1バイトコード

(b)　2バイトコード（標準文字セット）

(c)　2バイトコード（外字コード）

(d)　2バイトコード（上記(b)(c)以外）

(7)　EUCからSJISへの文字コード変換

(a)　1バイトコード

(b)　2バイトコード（標準漢字コード）

(c)　2バイトコード（外字コード）

(d)　2バイトコード（上記(b)(c)以外）

(8)　EUCからUTF-8への文字コード変換

(a)　1バイトコード

(b)　2バイトコード（標準文字セット）

(c)　3バイトコード（外字コード）

(d)　2バイトコードまたは3バイトコード（上記(b)(c)以外）

(9)　EUCからUTF-16への文字コード変換

(a)　1バイトコード

(b)　2バイトコード（標準文字セット）

(c)　3バイトコード（外字コード）

(d)　2バイトコードまたは3バイトコード（上記(b)(c)以外）

(10)　UTF-8からSJISまたはEUCへの文字コード変換

(a)　1バイトコード

(b)　2バイトコードおよび3バイトコード（標準漢字コード）

(c)　3バイトコード（外字コード）

(d)　2バイトコードまたは3バイトコード（上記(b)(c)以外）

(e)　4バイト以上のコード

(11)　UTF-8からUTF-16への文字コード変換

(a)　1バイトコード

(b)　2バイトコードおよび3バイトコード（標準漢字コード）

(c)　3バイトコード（外字コード）

(d)　2バイトコードまたは3バイトコード（上記(b)(c)以外）

(12)　UTF-16からSJISへの文字コード変換

(a)　2バイトコード

(b)　2バイトコード（外字コード）

(c)　4バイトコード（補助多言語面）

(13)　UTF-16からEUCへの文字コード変換

(a)　2バイトコード

(b)　2バイトコード（外字コード）

(c)　4バイトコード（補助多言語面）

(14)　UTF-16からUTF-8への文字コード変換

(a)　2バイトコード

(b)　2バイトコード（外字コード）

(c)　4バイトコード（補助多言語面）

(15)　文字コード変換後の値の求め方

(a)　UnicodeからUTF-8へのエンコード

(b)　UTF-8からUnicodeへのデコード

(c)　UnicodeからUTF-16へのエンコード

(d)　UTF-16からUnicodeへのデコード