スケーラブルデータベースサーバ HiRDB Version 8 解説(UNIX(R)用)

[目次][用語][索引][前へ][次へ]

10.3.1 全文検索プラグインHiRDB Text Search Plug-in

HiRDB Text Search Plug-inの全文構造検索機能には,次に示す機能があります。

それぞれの機能について説明します。

<この項の構成>
(1) SGML/XML文書の登録
(2) フラット文書の登録
(3) 構造指定検索
(4) 同義語・異表記語検索
(5) スコア検索
(6) 注意事項

(1) SGML/XML文書の登録

HiRDB Text Search Plug-inのユティリティを使用して,SGML/XML文書の構造や要素を表すタグ名称などを定義するDTDファイルをHiRDBのデータベースに登録できます。登録したDTDファイルを基に,コンストラクタ関数SGMLTEXTを使用すると,SGML/XML文書を文書構造の情報と一緒にHiRDBのデータベースに登録できます。

(2) フラット文書の登録

構造を持たないフラットな文書をHiRDBのデータベースに登録できます。

(3) 構造指定検索

抽象データ型関数containsを使用して,検索対象の列と,検索する条件(検索対象の文書構造名,検索したいキーワードを指定した条件式)を指定すると,SGML/XML文書を全文検索できます。

(4) 同義語・異表記語検索

HiRDB Text Search Plug-inのユティリティを使用して,同義語・異表記語辞書をローカルファイルに登録できます。登録した同義語・異表記語辞書を基に,SGML/XML文書の全文検索時に,検索したいキーワードの同義語又は異表記語のキーワードを検索できます。例えば,「コンピュータ」というキーワードを検索すると,その同義語の「電子計算機」や「COMPUTER」,異表記語の「コンピューター」や「Computer」なども検索できます。

(5) スコア検索

HiRDB Text Search Plug-inが提供する抽象データ型関数contains_with_score及びscoreを使用して,検索したキーワードの発生頻度から得点(スコア)を算出し,得点順に検索結果を表示できます。

(6) 注意事項

HiRDB Text Search Plug-inのバージョンが02-02以前の場合,文字コード種別にUTF-8をサポートしていません。UTF-8をサポートしていないHiRDB Text Search Plug-inを使用する場合は,pdsetupコマンドで指定する文字コード種別にUTF-8を指定しないでください。UTF-8のサポート状況については,HiRDB Text Search Plug-inのマニュアル,又はリリースノートなどで御確認ください。