1.2.11 XML文書管理機能

XMLは,W3Cによって標準化が進められている,文書の構造を定義するための言語です。XMLでは,ユーザが設定した独自のタグによって,論理構造を持つ文書を記述できます。このため,Web上のデータ交換フォーマットなどとして,多くの業務で適用されています。

DocumentBrokerは,XML形式で記述されたファイルを登録および操作できます。通常,XMLを扱うシステムには,XML形式で記述されたファイルを解析し,そのデータを処理するアプリケーションが必要となります。このアプリケーションは,ファイルの入力と解析や,抽出したデータのデータベースへの格納などの処理を実行します。なお,Linuxの場合,XML文書管理機能は使用できません。

DocumentBrokerは,次のプログラムを利用してXML文書管理機能を実現します。

管理できるXML文書,XMLプロパティマッピング機能,およびXMLインデクスデータ作成機能について次に説明します。

なお,このマニュアルでは,XMLで記述されたファイルを,XMLファイルと呼びます。また,XMLファイルをコンテントとしてDocumentBrokerに登録した文書を,XML文書と呼びます。

<この項の構成>
(1) 管理できるXML文書
(2) XMLプロパティマッピング機能
(3) XMLインデクスデータ作成機能

(1) 管理できるXML文書

一つのファイルのXML文書を,バージョンなし文書またはバージョン付き文書として管理できます。また,XMLから参照されるイメージファイルなど,複数ファイルから構成される文書群については,バージョンなしコンテナまたは構成管理コンテナを利用して管理できます。

なお,XML文書管理機能で管理するXML文書は,登録文書のままであり,文字コードの変換などは実行しません。

(2) XMLプロパティマッピング機能

XMLプロパティマッピング機能は,XML文書を登録するときに,XMLファイル中のタグ間の文字列やタグの属性値を抽出して,XML文書のプロパティとしてマッピングする機能です。なお,XMLプロパティマッピング機能を使用するためには,XMLファイルから抽出するタグの情報とマッピング先のプロパティとの対応を定義したファイルをユーザが作成する必要があります。

(3) XMLインデクスデータ作成機能

XMLインデクスデータ作成機能は,XMLファイルの構文解析を実行して,インデクスデータを作成し,タグ情報などを削除したプレーンテキスト形式の全文検索インデクスまたは構造指定検索用の全文検索インデクスを登録する機能です。なお,XMLインデクスデータ作成機能を使用するためには,削除したい不要なタグやタグ間の文字列を定義したファイルをユーザが作成する必要があります。