10.3.1 全文検索プラグイン(HiRDB Text Search Plug-in)
HiRDB Text Search Plug-inの全文構造検索機能には,次に示す機能があります。
-
SGML/XML文書登録
-
フラット文書登録
-
構造指定検索
-
同義語・異表記語検索
-
スコア検索
-
検索結果テキストデータ取り出し
-
検索ヒット位置ハイライト表示タグ埋め込み
それぞれの機能について説明します。
(1) SGML/XML文書の登録
HiRDB Text Search Plug-inのユティリティを使用して,SGML/XML文書の構造や要素を表すタグ名称などを定義するDTDファイルをHiRDBのデータベースに登録できます。登録したDTDファイルを基に,コンストラクタ関数SGMLTEXTを使用すると,SGML/XML文書を文書構造の情報と一緒にHiRDBのデータベースに登録できます。
(2) フラット文書の登録
構造を持たないフラットな文書をHiRDBのデータベースに登録できます。
(3) 構造指定検索
抽象データ型関数containsを使用して,検索対象の列と,検索する条件(検索対象の文書構造名,検索したいキーワードを指定した条件式)を指定すると,SGML/XML文書を全文検索できます。
(4) 同義語・異表記語検索
HiRDB Text Search Plug-inのユティリティを使用して,同義語・異表記語辞書をローカルファイルに登録できます。登録した同義語・異表記語辞書を基に,SGML/XML文書の全文検索時に,検索したいキーワードの同義語又は異表記語のキーワードを検索できます。例えば,「コンピュータ」というキーワードを検索すると,その同義語の「電子計算機」や「COMPUTER」,異表記語の「コンピューター」や「Computer」なども検索できます。
(5) スコア検索
HiRDB Text Search Plug-inが提供する抽象データ型関数contains_with_score及びscoreを使用して,検索したキーワードの発生頻度から得点(スコア)を算出し,得点順に検索結果を表示できます。