HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10
目次
用語
索引
前へ
2 / 203
次へ
表紙
前書き
変更内容
はじめに
1. 解説
1.1 Text Search Plug-inとは
1.1.1 Text Search Plug-inの機能
1.1.2 Text Search Plug-inの特長
1.2 Text Search Plug-inのシステム構成
1.2.1 Text Search Plug-inを構成するプログラム
1.2.2 Text Search Plug-inシステムの構成例
1.3 Text Search Plug-inを利用した検索
1.3.1 全文検索
1.3.2 概念検索
1.4 Text Search Plug-inで効果的に検索するには
1.4.1 文字種の組み合わせの追加
1.4.2 大小文字または全角半角文字の表記差の吸収
1.4.3 拗音の統一
1.4.4 濁音の統一
1.4.5 検索に使用しない文字の削除
2. Text Search Plug-inシステムの構築
2.1 Text Search Plug-inシステムの構築の流れ
2.2 システムの設計
2.2.1 検討項目
2.2.2 使用する文字コードによる機能差異について
2.3 リソースの見積もり
2.3.1 メモリ所要量
2.3.2 RDエリア容量
2.3.3 ファイル容量
2.3.4 論理ファイル数
2.4 Text Search Plug-inの環境設定
2.4.1 Text Search Plug-inのセットアップ(UNIXの場合)
2.4.2 Text Search Plug-inの登録
2.4.3 レジストリ機能の初期設定
2.4.4 システム共通定義の変更
2.5 文書検索プラグインのデータベースの作成
2.5.1 文書検索プラグインのデータベース作成の流れ
2.5.2 SGML定義情報の作成
2.5.3 SGML定義情報の登録
2.5.4 データ格納領域の確保
2.5.5 表の作成
2.5.6 インデクスの定義
2.5.7 データの登録
2.5.8 同義語辞書の作成
2.5.9 同義語辞書の登録
2.5.10 SGML定義情報のメンテナンス
2.6 文書検索プラグインのユーザ環境設定
2.6.1 SGMLプラグインの環境設定
2.6.2 n-gramインデクスプラグインの環境設定
2.7 文字列検索プラグインのデータベースの作成
2.7.1 文字列検索プラグインのデータベース作成の流れ
2.7.2 データ格納領域の確保
2.7.3 表の作成
2.7.4 インデクスの定義
2.7.5 データの登録
2.7.6 同義語辞書の作成
2.7.7 同義語辞書の登録
2.8 文字列検索プラグインのユーザ環境設定
2.8.1 FREEWORDプラグインの環境設定
2.8.2 IXFREEWORDプラグインの環境設定
2.9 システムの制限
2.10 Text Search Plug-inの設定解除
2.10.1 設定解除の流れ
2.10.2 表の削除
2.10.3 レジストリ情報の削除(SGMLTEXT型の列を定義していた場合)
2.10.4 Text Search Plug-inの削除
2.10.5 Text Search Plug-inのアンセットアップ(UNIXの場合)
2.10.6 システム共通定義の変更
2.10.7 HiRDBをOSから削除する場合の注意事項(UNIXの場合)
2.11 HiRDBの提供する機能の利用
3. Text Search Plug-inのユティリティ
3.1 ユティリティの使用方法
3.1.1 Text Search Plug-inのユティリティとは
3.1.2 ユティリティの記述形式と操作
3.2 文書検索プラグインのユティリティ
3.2.1 phsregsetup(レジストリ初期化ユティリティ)
3.2.2 phssgmlreg(SGML定義情報登録ユティリティ)
3.2.3 phssgmlrm(SGML定義情報削除ユティリティ)
3.2.4 phssgmlval(SGML定義情報参照ユティリティ)
3.2.5 phssyndicreg(同義語辞書登録ユティリティ)
3.2.6 phssyndicrm(同義語辞書削除ユティリティ)
3.2.7 phssyndicconv(同義語辞書移行ユティリティ)
3.2.8 phssyndicbkup(同義語辞書バックアップユティリティ)(UNIXの場合)
3.2.9 phnidxls(インデクス情報の取得ユティリティ)
3.2.10 phnincmt(インデクスのインクリメンタルユティリティ)
3.2.11 phnincrword(文字列指定インクリメンタルユティリティ)
3.2.12 phnmerge(インデクスのマージユティリティ)
3.2.13 phnexpnd(インデクスの拡張ユティリティ)
3.2.14 phnstartidx(インデクス作成開始ユティリティ)
3.2.15 phndelay(インデクス分割遅延登録運用変更ユティリティ)
3.2.16 phnmodidx(インデクス情報変更ユティリティ)
3.2.17 phncond(インデクス詰め替えユティリティ)
3.2.18 phnconget(統計情報収集ユティリティ)
3.2.19 phnconbuild(統計情報統合ユティリティ)
3.2.20 phnconrstr(統計情報反映ユティリティ)
3.2.21 phnchgcon(特徴ターム取得RDエリア指定ユティリティ)
3.2.22 phsrulecheck(統制ルールチェックユティリティ)
3.3 文字列検索プラグインのユティリティ
3.3.1 phcsyndicreg(同義語辞書登録ユティリティ)
3.3.2 phcsyndicrm(同義語辞書削除ユティリティ)
3.3.3 phcsyndicconv(同義語辞書移行ユティリティ)
3.3.4 phcsyndicbkup(同義語辞書バックアップユティリティ)(UNIXの場合)
3.3.5 phxidxls(インデクス情報の取得ユティリティ)
3.3.6 phxincmt(インデクスのインクリメンタルユティリティ)
3.3.7 phxincrword(文字列指定インクリメンタルユティリティ)
3.3.8 phxexpnd(インデクスの拡張ユティリティ)
3.3.9 phxstartidx(インデクス作成開始ユティリティ)
3.3.10 phxdelay(インデクス分割遅延登録運用変更ユティリティ)
3.3.11 phxmodidx(インデクス情報変更ユティリティ)
3.3.12 phxcond(インデクス詰め替えユティリティ)
3.3.13 phcrulecheck(統制ルールチェックユティリティ)
4. 抽象データ型関数を使用した文書または文字列データの操作
4.1 Text Search Plug-inが提供する抽象データ型関数
4.1.1 抽象データ型関数の使用方法
4.1.2 抽象データ型の選択
4.2 抽象データ型関数の文法
4.2.1 SGMLTEXT
4.2.2 FREEWORD
4.2.3 contains
4.2.4 contains_with_score
4.2.5 score
4.2.6 extracts
4.2.7 concept_with_score
4.2.8 score_concept
4.2.9 concept_with_terms
4.2.10 terms_concept
4.2.11 検索条件式の指定に関する注意
4.3 全文検索条件式の文法(文書検索プラグインの場合)
4.3.1 構造名を指定した検索条件のAND/OR論理条件
4.3.2 構造名の指定
4.3.3 構造名のワイルドカード指定
4.3.4 テキスト検索条件の指定
4.3.5 単純文字列指定
4.3.6 異表記展開指定
4.3.7 同義語展開指定
4.3.8 近傍条件指定
4.3.9 拡張NOT指定
4.3.10 重み
4.3.11 属性値指定
4.3.12 特定構造検索指定
4.3.13 特殊文字の指定
4.3.14 全文検索条件式の指定例
4.4 全文検索条件式の文法(文字列検索プラグインの場合)
4.4.1 検索条件のAND/OR論理条件
4.4.2 テキスト検索条件の指定
4.4.3 単純文字列指定
4.4.4 異表記展開指定
4.4.5 同義語展開指定
4.4.6 近傍条件指定
4.4.7 拡張NOT指定
4.4.8 特殊文字の指定
4.4.9 全文検索条件式の指定例
4.5 概念検索条件式の文法
4.5.1 構造名を指定した検索条件のAND/OR論理条件
4.5.2 構造名の指定
4.5.3 構造名のワイルドカード指定
4.5.4 テキスト検索条件の指定
4.5.5 単純文字列指定
4.5.6 異表記展開指定
4.5.7 同義語展開指定
4.5.8 重み
4.5.9 スコアオプション
4.5.10 検索オプション
4.5.11 絞込み指定
4.5.12 概念検索条件式の指定例
5. 推奨する運用方法
5.1 推奨するデータ登録の運用方法
5.1.1 登録運用の種類
5.1.2 推奨する登録運用
5.2 性能向上の運用
5.2.1 グローバルバッファ管理の運用
5.3 ログおよびバックアップの取得方式
5.3.1 登録運用のログ取得方式の設定について
5.3.2 バックアップ取得方法
5.4 概念検索用統計情報の収集,統合および反映
付録
付録A 登録する文書(テキストデータ)および文字列データに使用できる文字
付録A.1 登録する文書(テキストデータ)および文字列データに使用できる文字
付録A.2 英文で登録する文書(テキストデータ)および文字列データに使用できる文字
付録A.3 utf-8で使用できる文字コード
付録A.4 登録する文字に関する注意
付録B ディレクトリおよびファイル構成
付録B.1 ディレクトリおよびファイル構成(UNIXの場合)
付録B.2 ディレクトリおよびファイル構成(Windowsの場合)
付録C 資源の排他
付録C.1 排他取得内容
付録C.2 レジストリの排他
付録C.3 デッドロックの防止
付録D 障害発生時の運用方法
付録E 系切り替え
付録E.1 同義語辞書
付録E.2 インデクス定義ファイル
付録E.3 環境定義ファイル
付録F エラーメッセージ
付録F.1 SQL連絡領域に出力されるメッセージの形式
付録F.2 メッセージログ・標準エラー出力に出力されるメッセージの形式
付録F.3 メッセージの記述形式
付録F.4 メッセージ一覧
付録F.5 SGML文書の登録エラーメッセージの形式
付録F.6 SGML文書の登録エラーメッセージ一覧
付録G 用語解説
ページの先頭へ