Hitachi

HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10


付録A.4 登録する文字に関する注意

〈この項の構成〉

(1) 使用できない文字に関する注意

Text Search Plug-inでは,可視状態でつながって見える文字でも,文字と文字の間に表A-1A-2およびA-3またはA-4に示す以外の文字が含まれていると,検索タームを指定してもヒットしません。表A-1A-2およびA-3またはA-4に示す以外の文字が登録文書中に含まれていても,登録は正常に処理されエラーにはならない場合があるため,表A-1A-2およびA-3またはA-4に示す以外の文字が含まれているテキストデータの取り扱いにはご注意ください。

例えば,次のような場合は検索を実行してもヒットしません。

可視状態:日立

1文字目に「日」,2文字目に「立」と見えています。

実際のデータ:日<表A-1およびA-2に示す以外の文字>立

「日」と「立」の間に<表A-1A-2およびA-3またはA-4に示す以外の文字>が含まれていると,1文字目は「日」,2文字目の「<表A-1A-2およびA-3またはA-4に示す以外の文字>」は検索対象でないため無視され,3文字目は「立」として登録されます。

検索:検索ターム「日立」

検索タームに「日立」を指定しても,実際のデータは「日」と「立」が連続していないためヒットしません。

また,<表A-1A-2およびA-3またはA-4に示す以外の文字>は検索対象でないため,検索タームに<表A-1A-2およびA-3またはA-4に示す以外の文字>を指定してもヒットしません。

「日<表A-1A-2およびA-3またはA-4に示す以外の文字>立」をヒットさせたい場合は,検索タームとして「日?立」,「日??立」,「日*立」,「日」と「立」の近傍条件などを使用してください。

英文検索は,デリミタなどの定義によってはヒットする場合もあります。

(2) 改行コードに関する注意

登録するテキストデータの改行コードには,LF(0x0a)を使用してください。登録するテキストデータに使用している改行コードがCR+LF(0x0d0a)の場合,改行コードを次のように処理します。