HiRDBを利用したシステムでは,Text Search Plug-inを使った高度な全文検索機能を利用できます。Text Search Plug-inの全文検索機能を利用する場合,検索用のテキストデータをHiRDBに登録する必要があります。企業や官公庁に限らず,一般に文書はワードプロセッサなどの文書作成ソフトウェアで作成される電子ドキュメントがほとんどです。このため,電子ドキュメントからテキストデータを抽出し,HiRDBに登録する仕組みを作成する必要があります。
Text Search Plug-in Index Generatorは,HiRDBサーバのBLOB型またはBINARY型列に格納されている電子ドキュメントからテキストを抽出し,全文検索用データとしてSGMLTEXT型またはFREEWORD型列にインデクス登録するプログラムです。Text Search Plug-in Index Generatorを利用することで,文書作成ソフトウェアで作成した文書からテキストデータを抽出し,HiRDBに登録するユーザプログラムを作成する手間を省略できます。
Text Search Plug-in Index Generatorが処理できる文書は,テキスト抽出に利用するDocument Filter for Text Searchがサポートしている文書です。詳細については,マニュアル「Document Filter for Text Search Version 3」を参照してください。
Text Search Plug-in Index Generatorは,コマンドを実行することで文書を処理します。このコマンドをTSPIndexerコマンド(全文検索用データ登録コマンド)といいます。TSPIndexerコマンドは,実行条件を定義したファイル(制御情報ファイル)に基づいて動作します。Text Search Plug-in Index Generatorの処理概要を次の図に示します。
図1-1 Text Search Plug-in Index Generatorの処理概要