Hitachi

HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10


5.1.1 登録運用の種類

Text Search Plug-inで提供している機能を利用して,次のような運用方法でデータを登録できます。

また,これらの登録運用に加えて,データの登録と検索を同時に実行する運用方法があります。

登録運用の長所および短所を表5-1に,登録・検索同時実行による運用の長所および短所を表5-2に示します。

表5‒1 Text Search Plug-inの登録運用の長所および短所

方式

長所

短所

UAPの更新による運用

INSERT文またはUPDATE文による通常の更新運用ができます

登録済みのデータの増大に伴い,登録時間および登録単位のログ量が増大します

バッチ登録による運用

  • 一括してデータ更新ができます

  • 1件ずつデータ登録するよりもログ量が削減できます

なし

プラグインインデクスの遅延一括作成による運用

  • UAPのスループットが通常の更新に比べて向上します

  • ログ量はバッチ登録と同等です

  • 登録データの検索がインデクスを作成するまで実行できません

  • インデクスは別途作成する必要があります。この間,処理中のSGMLTEXT型およびFREEWORD型に対する検索およびデータ更新はできません

  • UPDATE文を実行した場合,元データは削除されるため,検索対象外となります

差分インデクスによる運用

  • UAPのスループットが通常の更新に比べて向上します。また,インデクスも作成するため検索対象にできます

  • ログ量は通常の場合に比べて削減できます

  • MASTERインデクスへの反映処理を別途する必要があります。この間,処理中のSGMLTEXT型に対する検索およびデータ更新はできません

  • MASTERインデクスに反映する際に,ログが出力されます

  • FREEWORD型では使用できません

インデクス作成方法に初期分割登録を指定してインデクス作成をする運用

  • インデクス作成時の処理時間が短くなります

  • インデクスへの文書または文字列データの登録を時間を区切って実行できます

  • ログ量はバッチ登録と同じです

  • インデクス未登録状態の文書または文字列データは,検索対象になりません

  • インデクス作成開始ユティリティを実行し,インデクスへ文書または文字列データを登録する必要があります

  • インデクス未登録状態の文書または文字列データは,インクリメンタルの対象外になります

分割遅延登録による運用

  • UAPのスループットが通常の更新と比べて向上します

  • ログ容量はバッチ登録と同等です

  • インデクス作成時に,時間と件数を指定できます

  • 登録・検索同時実行と併用できます

  • 登録データの検索がインデクスを作成するまで実行できません

  • UPDATE文を実行した場合,元データは削除されるため検索対象外となります

統一インデクスによる運用

  • 異表記展開と同様の検索が高速にできます。

  • 同義語異表記展開用メモリを削減できます。

  • 大小文字・全角半角文字または拗音を区別した検索ができなくなります。

注※

1件ずつ登録する場合,ログ量は通常の更新と同じです。

表5‒2 登録・検索同時実行による運用の長所および短所

方式

長所

短所

登録・検索同時実行による運用

  • SQLによる単数の更新系トランザクションと,複数の検索系トランザクションを同時に実行できます

  • インデクス未作成の場合,複数の更新系トランザクションを同時に実行できます

  • ほかのユーザが更新中(トランザクションが終了していない状態)の文書または文字列データを検索できます

  • Text Search Plug-inのデータの整合性を確保する排他制御のため,オーバヘッドが掛かります。また,排他制御が競合した場合,一時的に待ち時間が発生します

  • 共用メモリが必要です

  • ロールバックによる回復処理中のRDエリアに対して検索した場合,「回復中であるため,検索できない」というエラーになる場合があります

登録・検索同時実行を使用しない運用

  • Text Search Plug-inのデータの整合性確保のための排他制御によるオーバヘッドが掛かりません

  • 共用メモリは不要です

  • 更新系トランザクションと,ほかのトランザクションを同時に実行できません