ここでは,文書空間で使用する文字コード種別がUTF-8の場合にサポートする範囲について説明します。なお,文書空間で使用する文字コード種別がShift-JISの場合は,すべての機能をサポートしています。
文書空間で使用する文字コード種別がUTF-8の場合に使用できるテキスト抽出ライブラリを次の表に示します。
表B-1 文書空間で使用する文字コード種別がUTF-8の場合に使用できるテキスト抽出ライブラリ
テキスト抽出ライブラリ名 | 使用可否 |
---|---|
Document Filter for Text Search※ | ○ |
HiRDB Adapter for XML | - |
Hitachi Processing Facility for XML | - |
フィルタプラグインライブラリ | - |
なお,テキスト抽出ライブラリを使用しないで,文書のテキスト情報を抽出することもできます。その場合,テキスト抽出結果の文字コード種別にはUTF-8を使用してください。