付録B 文書空間で使用する文字コード種別がUTF-8の場合のサポート範囲

ここでは,文書空間で使用する文字コード種別がUTF-8の場合にサポートする範囲について説明します。なお,文書空間で使用する文字コード種別がShift-JISの場合は,すべての機能をサポートしています。

文書空間で使用する文字コード種別がUTF-8の場合に使用できるテキスト抽出ライブラリを次の表に示します。

表B-1 文書空間で使用する文字コード種別がUTF-8の場合に使用できるテキスト抽出ライブラリ

テキスト抽出ライブラリ名使用可否
Document Filter for Text Search
HiRDB Adapter for XML
Hitachi Processing Facility for XML
フィルタプラグインライブラリ
(凡例)
○:使用できます。
-:使用できません。
注※
Document Filter for Text Searchのコンフィグレーションファイル(config.cfg)の設定で,出力するテキスト抽出結果のコード体系を「UTF-8」に設定して使用してください。

なお,テキスト抽出ライブラリを使用しないで,文書のテキスト情報を抽出することもできます。その場合,テキスト抽出結果の文字コード種別にはUTF-8を使用してください。