Hitachi

HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10


5.4 概念検索用統計情報の収集,統合および反映

横分割した表に文書を登録した場合,横分割した表単位に定義された概念検索用インデクスは,それぞれ異なる統計情報を保持します。このため,横分割した表から,検索用特徴タームを抽出すると,横分割した表ごとに異なる検索用特徴タームが抽出されることがあります。

横分割したそれぞれの表の検索用特徴タームを一意にするには,横分割した表ごとに異なる統計情報を収集,統合,そして反映します。統計情報を収集,統合し,反映するまでの手順を次に示します。なお,表を横分割しない運用の場合は,概念検索用統計情報は一意であるため,この手順は不要です。

  1. 横分割した表のサーバ単位に,統計情報を出力するディレクトリを作成します。

  2. 統計情報収集ユティリティを使用して,1.で作成したディレクトリに統計情報を出力します。統計情報収集ユティリティについての詳細は,「3.2.18 phnconget(統計情報収集ユティリティ)」を参照してください。

    このとき,-oオプションで指定する統計情報出力先定義ファイルには,1.で作成したディレクトリを指定してください。

  3. 2.で出力した統計情報ファイルを統計情報統合ユティリティを実行するマシンに集めます。

  4. 統計情報統合ユティリティを使用して,各統計情報を統合します。統計情報統合ユティリティについての詳細は,「3.2.19 phnconbuild(統計情報統合ユティリティ)」を参照してください。

  5. 統合統計情報ファイルを,反映先の各サーバに配布します。

  6. 統計情報反映ユティリティを使用して,統合後の統計情報をデータベースに反映します。このとき,RDエリアに空き容量があるかどうかを確認してください。統計情報反映ユティリティについての詳細は,「3.2.20 phnconrstr(統計情報反映ユティリティ)」を参照してください。

    この段階で,各RDエリアの統計情報が一意になります。

  7. 特徴ターム取得RDエリア指定ユティリティを使用して,特徴タームを返却するRDエリアを一つに限定します。

    このとき,-rオプションで指定するRDエリアには,横分割したそれぞれの表に定義したインデクス用のRDエリアを指定してください。

    このユティリティを実行しないで特徴ターム取得抽象データ型関数を使用すると,横分割した表の数だけ,検索用特徴タームが返却されます。特徴ターム取得RDエリア指定ユティリティについての詳細は,「3.2.21 phnchgcon(特徴ターム取得RDエリア指定ユティリティ)」を参照してください。