Hitachi

HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10


4.1.2 抽象データ型の選択

ここでは,Text Search Plug-inが提供する抽象データ型の選択方法について説明します。

〈この項の構成〉

(1) 提供する抽象データ型の相違点

Text Search Plug-in が提供する抽象データ型としてSGMLTEXT型とFREEWORD型があります。

これらの抽象データ型の相違点を次の表に示します。次の表を参照して使用する抽象データ型を選択してください。

表4‒2 抽象データ型の相違点

項目

SGMLTEXT型

FREEWORD型

登録できるデータの種別

構造化文書

  • SGML

  • XML(Preprocessing Library for Text Searchで作成したテキストデータ)

プレーン文書(文字列データ)

登録データ長の上限値

5メガバイト

32,000バイト(推奨255バイト)

登録データ格納用RDエリア

ユーザ用RDエリア(基表)

ユーザLOB用RDエリア(データ)

ユーザ用RDエリア(基表,データ)

全文検索

○(構造名を指定した検索はできません)

概念検索

×

登録データの出力

原文書出力

SGML出力

プレーン出力

XML出力

原文書出力

対応するインデクス型

NGRAM型

IXFREEWORD型

インデクス格納用RDエリア

ユーザLOB用RDエリア

ユーザLOB用RDエリア

差分インデクス定義

×

インデクス作成ルール追加機能

×

インデクスファイル自動拡張機能

○(設定をお勧めします)

(凡例)

○:使用できます

×:使用できません

(2) 非構造化文書を扱う場合に推奨する抽象データ型

構造を持たない文書(または文字列データ)は,SGMLTEXT型(表の作成時に指定する文書登録種別にプレーン文書を指定した場合)とFREEWORD型の両者に登録できます。ただし,次の条件を満たす場合,FREEWORD型にデータを登録することをお勧めします。