1.1 テキストインデクサーとは

テキストインデクサーはDocumentBrokerサーバに格納されている文書を全文検索インデクスに登録するユティリティプログラムです。

テキストインデクサーは,種々のアプリケーションで作成された文書からテキスト情報を抽出して全文検索用のインデクスファイルを作成し,これをDocumentBrokerサーバの全文検索インデクスに登録する機能を提供します。

この機能によって,ワードプロセッサなどのアプリケーションで作成した文書も,ユーザプログラムでテキスト情報を抽出して全文検索インデクスに登録することなく,DocumentBrokerサーバに登録できるようになります。

テキストインデクサーでインデクス登録できるドキュメントの種類には,プレーンテキスト文書やXML文書,WORD文書などがあります。これらテキストインデクサーが扱うドキュメントの種類は,指定するフィルタ拡張子とテキスト抽出ライブラリの組み合わせに従います。フィルタ拡張子とテキスト抽出ライブラリの組み合わせについては,「3.4.1 提供するフィルタ拡張子と使用するテキスト抽出ライブラリ」を参照してください。なお,フィルタプラグイン機能を利用すると,ユーザが作成するフィルタプラグイン関数でテキスト情報を抽出できるドキュメントの種類が処理対象となります。フィルタプラグイン機能の詳細については,「1.3.2 フィルタプラグイン機能」を参照してください。

注※ Windows Server 2008を使用する場合は,XML文書のインデクス登録はできません。