2.7 XML文書

この節では,Java クラスライブラリでのXML文書の概念とXML文書を管理するための機能について説明します。

XMLは,W3Cによって標準化が進められている構造化文書の定義言語です。XMLでは,ユーザが設定した独自のタグによって,論理構造を持つ文書を記述できます。このため,WWW上のデータ交換フォーマットとして,多くの業務で適用されています。Java クラスライブラリでは,XML形式で記述されたファイルを,バージョンなし文書およびバージョン付き文書のコンテンツとして登録して管理できます。

なお,このマニュアルでは,XML形式で記述されたファイルをXMLファイルといいます。また,XMLファイルをコンテンツに持つバージョンなし文書およびバージョン付き文書を特にXML文書といいます。

XML文書から参照される画像ファイルなどの複数のファイルは,バージョンなしフォルダまたはバージョン付きフォルダでまとめて管理したり,文書間リンクで関連づけたりすることによって管理できます。文書間リンクについては,「2.8 リンク」を参照してください。

Java クラスライブラリでは,次の二つの機能を使用してXML文書を管理できます。

XMLプロパティマッピング機能は,XMLファイル中のタグ間の文字列やタグの属性値を,XML文書のプロパティに割り当てて管理する機能です。

例えば,次のような内容のXMLファイルがあります。このファイルは,プロジェクトAの見積書です。

<?xml version="1.0" encoding="Shift_JIS"?>
<doc>
<title>プロジェクトA見積書</title>
<date>2001.1.10</date>
<author id="96601357">
 <name>日立太郎</name>
 <organization>営業部</organization>
</author>
<content>

</content>
</doc>

このとき,XMLファイルの<title>タグ間の情報「プロジェクトA見積書」や,<author>タグの属性値「96601357」などを,XML文書のプロパティとしてマッピングできます。XMLプロパティマッピングの例を次の図に示します。

図2-7 XMLプロパティマッピングの例

[図データ]

XMLプロパティマッピング機能を使用する場合は,前提プログラムとして,HiRDB Adapter for XMLが必要です。

XMLインデクスデータ作成機能は,XML文書の構文解析を実行して,インデクスデータを作成し,タグ情報などを削除したプレーンテキスト形式の全文検索インデクスまたは構造指定検索用の全文検索インデクスを登録する機能です。

XMLインデクスデータ作成機能を使用する場合は,前提プログラムとしてHiRDB Adapter for XMLおよびPreprocessing Library for Text Searchが必要です。