HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 8

[目次][用語][索引][前へ][次へ]

4.1.2 抽象データ型の選択

ここでは,Text Search Plug-inが提供する抽象データ型の選択方法について説明します。

<この項の構成>
(1) 提供する抽象データ型の相違点
(2) 非構造文書を扱う場合に推奨する抽象データ型

(1) 提供する抽象データ型の相違点

Text Search Plug-in が提供する抽象データ型としてSGMLTEXT型とFREEWORD型があります。

これらの抽象データ型の相違点を表4-2に示します。表4-2を参照して使用する抽象データ型を選択してください。

表4-2 抽象データ型の相違点

項目 SGMLTEXT型 FREEWORD型
登録できるデータの種別 構造化文書
  • SGML
  • XML(Preprocessing Library for Text Searchで作成したテキストデータ)
プレーン文書(文字列データ)
登録データ長の上限値 5メガバイト 32,000バイト(推奨255バイト)
登録データ格納用RDエリア ユーザ用RDエリア(基表)
ユーザLOB用RDエリア(データ)
ユーザ用RDエリア(基表,データ)
全文検索
概念検索 ×
登録データの出力 原文書出力
SGML出力
プレーン出力
XML出力
原文書出力
対応するインデクス型 NGRAM型 IXFREEWORD型
インデクス格納用RDエリア ユーザLOB用RDエリア ユーザLOB用RDエリア
差分インデクス定義 ×
インデクス作成ルール追加機能 ×
インデクスファイル自動拡張機能 ○(設定を推奨します)

(凡例)
○:使用できます
×:使用できません

注※
構造名を指定した検索はできません。

(2) 非構造文書を扱う場合に推奨する抽象データ型

構造を持たない文書(または文字列データ)は,SGMLTEXT型(表の作成時に指定する文書登録種別にプレーン文書を指定した場合)とFREEWORD型の両者に登録できます。ただし,次の条件を満たす場合,FREEWORD型にデータを登録することを推奨します。