付録C 用語解説

テキストインデクサーで使用する用語について説明します。

(英字)
DocumentSpace構成定義ファイル(docspace.ini)
文書空間の構成を定義するためのファイルです。
(サ行)
書誌情報
文書コンテンツからのテキスト抽出失敗時に,全文検索用インデクスファイルを生成するために使用するプロパティを指します。
処理対象文書クラス
全文検索機能付き文書クラスおよび概念検索機能付き文書クラスを指します。
全文検索インデクス
全文検索の対象になるテキストデータに対応するプロパティです。
全文検索プラグイン
HiRDB Text Search Plug-inを指します。
(タ行)
テキスト抽出フィルタプラグインライブラリ
テキストインデクサーが定義する関数に従ってユーザが作成した,テキスト抽出ライブラリのことです。
テキスト抽出ライブラリ
Document Filter for Text Search,Preprocessing Library for Text Search,およびHiRDB Adapter for XMLを指します。各種アプリケーションデータから,全文検索用のテキストを自動的に抽出するプログラムプロダクトです。
(ラ行)
レンディション
文書のコンテントの形式およびそのコンテントをあわせてレンディションと呼びます。
レンディションタイプ
Wordなどのアプリケーションで編集したファイル,HTML形式のファイルやGIFなどの画像データファイルのように,登録した文書のコンテント(データ部分)のファイル形式を表す文字列です。