1.3.2 処理できる文字コード
XML文書の文字コードは,XML文書に記述するXML宣言のencoding属性(encoding="XXX"のXXXの部分)に指定します。このほかにも,XML文書の入力ソースとなるInputSourceオブジェクトのエンコーディングに指定する方法などがあります。
XML Processorでは,IANAに登録された文字コードのうち次のものを処理できます。文字コードの定義については,IANAのCHARACTER SETSに関するドキュメントを参照してください。
-
UTF-8
-
UTF-16
-
UTF-16BE
-
UTF-16LE
-
Shift_JIS※1
-
Windows-31J
-
ISO-2022-JP
-
EUC-JP
-
US-ASCII
-
ISO-10646-UCS-2
-
ISO-10646-UCS-4※2
-
ISO-8859-1
- 注※1
-
Shift_JISを使用するときに適用される文字エンコーディング(SJISまたはMS932)の切り替えについては,「1.3.3 Shift_JIS切り替え機能」を参照してください。
- 注※2
-
バイトオーダーがbig-endianまたはlittle-endianであり,かつ,Byte-Order-Markが付加されていない形式だけをサポートします。
- 注意事項
-
上記以外の文字コードを使用した場合の動作は保証しません。