XML文書の文字コードは,XMLパーサやXSLTトランスフォーマの入出力XML文書に記述するXML宣言のencoding属性(encoding="XXX"のXXXの部分)に指定します。このほかにも,XML文書の入力ソースとなるInputSourceオブジェクトのエンコーディングに指定する方法などがあります。
Cosminexus XML Processorでは,IANAに登録された文字コードのうち次のものを処理できます。文字コードの定義については,IANAのCHARACTER SETSに関するドキュメントを参照してください。
- UTF-8
- UTF-16
- UTF-16BE
- UTF-16LE
- Shift_JIS※1
- Windows-31J
- ISO-2022-JP
- EUC-JP
- US-ASCII
- ISO-10646-UCS-2
- ISO-10646-UCS-4※2
- ISO-8859-1
- 注※1
- Shift_JISを使用するときに適用される文字エンコーディング(SJISまたはMS932)の切り替えについては,「1.4.3 Shift_JIS切り替え機能」を参照してください。
- 注※2
- バイトオーダーがbig-endianまたはlittle-endianであり,かつ,Byte-Order-Markが付加されていない形式だけをサポートします。
- 注意
- 上記以外の文字コードを使用した場合の動作は保証しません。