2.2.1 検討項目
- 〈この項の構成〉
(1) リソースの見積もり
メモリ所要量やRDエリア容量など,Text Search Plug-inが使用するリソースを見積もってください。リソースの見積もりの詳細については,「2.3 リソースの見積もり」を参照してください。
(2) 検索機能の定義
全文検索または概念検索実行時に次の機能を使用する場合,インデクスの定義時に機能使用の設定が必要です。用途に合わせて設定してください。
-
英字やカタカナなど,さまざまな種類の文字種の組み合わせをインデクス情報に追加する機能です。インデクス作成ルール追加機能を使用した場合の長所および短所は次のとおりです。
-
長所
インデクス作成ルール追加機能を使用しない場合と比べて,検索タームがさまざまな文字種の組み合わせで構成される場合の全文検索性能が向上します。また,種文章から抽出された検索用特徴タームがさまざまな文字種の組み合わせで構成される場合の概念検索性能および精度が向上します。
-
短所
インデクスサイズが増加します。
-
-
大小文字または全角半角文字表記の違いを吸収した検索結果を得るための機能です。大小文字,全角文字半角文字を統一するため,異表記展開の全角半角異表記展開,および半角アルファベット展開を実行する必要がありません。異表記展開を実行した場合と比較して,検索性能が向上します。
-
「ゃ」と「や」,「ょ」と「よ」など,拗音による違いを吸収した検索結果を得るための機能です。拗音を統一するため,異表記展開のひらがな拗音展開を実行する必要はありません。異表記展開を実行した場合と比較して,検索性能が向上します。
-
「バ」や「ぱ」などの濁音を表記する方法として「ハ゛」や「は゜」のように濁音や半濁音を分離して表記する方法もあります。濁音統一機能を使用することにより,このような表記の違いを吸収して検索することが可能です。
-
検索に使用しない文字を設定する機能です。例えば,「X△M△L」のように,文字間に半角スペースを入れて表記されている場合,検索タームに半角スペースを入れなければヒットしません。しかし,削除文字指定機能を使用すると,スペースなどが登録した文書情報から削除されるため,検索タームにスペースを入れなくてもヒットさせることができます。
また,この機能を使用すると,インデクス容量を削減できます。
(3) 運用形態の決定
Text Search Plug-inの運用方法を検討します。推奨する運用方法については「5. 推奨する運用方法」を参照してください。
インデクス定義時に,次の登録運用の形態を設定できます。用途に合わせて設定してください。
(a) 差分インデクス−登録性能の向上
小容量の一時的な登録用インデクスに,文書を追加する機能を提供します。この登録用インデクスを差分インデクスといいます。
n-gramインデクスプラグインは,登録しているインデクス量が少ないほど,登録性能が良くなります。差分インデクスは,この特性を利用し,小容量の一時的なインデクスに登録することで登録性能を向上させる機能です。これはUAPによるデータ登録をする運用の場合に有効です。差分インデクスを使用しない通常の登録よりも短時間で更新できます。
なお,差分インデクスを定義している場合は,差分インデクスからMASTERインデクスへのマージ処理が必要です。
(b) インデクス作成方法の指定
表のSGMLTEXT型列に文書を登録している,またはFREEWORD型列に文字列を登録している状態でCREATE INDEXを実行する場合,次のどれかのインデクス作成方法を指定できます。
-
インデクス作成とインデクスへの文書登録を同時に実行する方法です。
-
インデクス作成時には文書登録をしないで,インデクス作成開始ユティリティで実行時間やインデクスへの登録件数を指定し,文書を登録する方法です。インデクス作成開始ユティリティの詳細については,「3.2.14 phnstartidx(インデクス作成開始ユティリティ)」または「3.3.9 phxstartidx(インデクス作成開始ユティリティ)」を参照してください。初期分割登録の対象となるのは,インデクス作成時に登録済みのデータです。例えば,表に大量の文書を登録している状態でインデクス作成を実行する場合では,インデクスへの文書登録に時間が掛かります。このような場合,時間や件数で区切って登録できます。なお,初期分割登録ではインデクスへの文書登録が完了すると,以降は即時登録となります。
-
初期分割登録での対象範囲に加えて,インデクス作成後に登録された文書も分割遅延登録する方法です。インデクス作成後は初期分割登録と同様に,インデクス作成開始ユティリティを使用して,文書をインデクスへ一括登録できます。インデクス作成開始ユティリティの詳細については,「3.2.14 phnstartidx(インデクス作成開始ユティリティ)」または「3.3.9 phxstartidx(インデクス作成開始ユティリティ)」を参照してください。また,インデクス分割遅延登録運用変更ユティリティを利用して,分割遅延登録の開始と終了を指定することもできます。インデクス分割遅延登録運用変更ユティリティの詳細については,「3.2.15 phndelay(インデクス分割遅延登録運用変更ユティリティ)」または「3.3.10 phxdelay(インデクス分割遅延登録運用変更ユティリティ)」を参照してください。