ここでは,XMLインデクスデータ作成機能について説明します。
(1) XMLインデクスデータ作成機能とは
XMLインデクスデータ作成機能は,XMLファイルの構文解析を実行して,インデクスデータを作成し,タグ情報などを削除したプレーンテキスト形式の全文検索インデクスまたは構造指定検索用の全文検索インデクスを登録する機能です。
論理構造を持つ文書の構造を指定して実行する全文検索を,構造指定検索といいます。XMLインデクスデータ作成機能を使用して全文検索インデクスを作成したXML文書は,構造指定検索の対象になります。
構造指定検索で使用するXML文書の例を次の図に示します。
図2-18 構造指定検索で使用するXML文書の例
構造指定検索では,この図のXML文書1およびXML文書2に対して,「構造<chap>の下の構造<topic>の中に『W3C』が含まれる文書を検索する」といった検索ができます。この例の場合は,XML文書2が検索結果として取得できます。
(2) XMLインデクスデータ作成機能の処理内容
XMLインデクスデータ作成機能では,Preprocessing Library for Text Searchを利用してXMLファイルの構文解析を実行し,全文検索用のインデクスデータ(ESIS-B形式のデータ)を生成します。このインデクスデータをXML文書の全文検索インデクスとして登録することで,XML文書の構造を指定した全文検索ができるようになります。
また,インデクスデータを作成するときには,Preprocessing Library for Text Searchのフィルタリング機能を使用して,XMLファイルの内容から不要なタグを表す情報を削除したり,不要なタグおよびそのタグに囲まれた文字列全体を削除したりできます。なお,削除するタグについての定義は,フィルタリング定義ファイルとして作成しておく必要があります。
(3) XMLインデクスデータ作成機能を使用するための設定
XMLインデクスデータ作成機能を使用する場合は,フィルタリング定義ファイル(TFD)を作成して,削除するタグについて定義しておく必要があります。フィルタリング定義ファイルの作成については,「3.18 XML文書管理機能を使用する場合の設定」を参照してください。
また,構造指定検索の対象になるXML文書は,次の条件に従って作成する必要があります。
全文検索機能付き文書クラスについては,「2.3.4 全文検索機能付き文書クラスの追加」を参照してください。
(4) XMLインデクスデータ作成機能の処理対象となる文字コード
XMLインデクスデータ作成機能は,次の文字コードで記述されたXMLファイルを対象に実行できます。
ただし,全文検索インデクスは,AIXの場合,すべてShift-JISで登録されます。このため,XML文書に対して構造指定検索を実行するための検索条件は,AIXの場合,すべてShift-JISで入力してください。