COBOL2002 XML連携機能ガイド


付録K 用語解説

(英字)

BOM(バイトオーダマーク)

ファイルの先頭に付加された,Unicodeの表現形式を表す情報。COBOL2002では,テキスト編成ファイルに対してこの情報を付加します。本文中では,Unicodeシグニチャと表記します。

DDF(Data Definition File)

XMLドキュメントのDTDで定義された要素のうち,COBOLプログラムからアクセスしたい要素とCOBOLのデータ項目との対応づけを記述するファイルです。

DDFは,データ定義ファイルともいいます。

DDL(Data Definition Language)

DDFに記述するマークアップ言語です。XML要素に対応するCOBOLのデータ項目の構造,データ名,データ型などを定義できます。

DDLは,データ定義言語ともいいます。

DOCTYPE宣言

DTDに記載する,文書の型を宣言する記述のことです。DOCTYPE宣言は,「<!DOCTYPE 〜」の形式で宣言されます。

DTD(Document Type Definition)

XMLドキュメントの構造を定義するものです。DTDを使うと,XMLドキュメントの構造の解析,検証などができます。XML連携機能では,DTDを基にCOBOLプログラムからアクセスするXML要素を指定します。

DTDは,文書型定義ともいいます。

IVS

漢字を表すUnicodeの直後にVariation Selectorと呼ばれるコードを付加し,漢字の「異体字」を表現する方法のことです。

COBOL2002では,用途がDISPLAYおよびNATIONALの項目で使用します。

UCS-2(Universal multi-octet Character Set 2)

符号化文字集合の一つの形式です。1文字を2バイトで表現します。

COBOL2002では,用途がDISPLAYおよびNATIONALの項目でサポートします。

UCS-4(Universal multi-octet Character Set 4)

符号化文字集合の一つの形式です。1文字を4バイトで表現します。

COBOL2002では,用途がDISPLAYおよびNATIONALの項目でUCS-4の範囲をサポートします。

Unicode

1バイトでは表現できない文字セットを含めあらゆる文字セットをサポートした文字コード。代表的な符号化文字集合としてUCS-2,UCS-4があります。代表的なエンコーディングスキーマとしてUTF-8,UTF-16があります。

COBOL2002では,UCS-4の範囲(UCS-2の範囲を含む)をサポートします。

本文中では,符号化文字集合,およびエンコーディングスキーマを文字コードと表記します。

URI

Uniform Resource Identifierの略です。URLのようにWeb上のデータの位置を指定する方法と,Web上の特定のデータを固有の名前で指定する方法を持ち合わせた規格です。

URL

Uniform Resource Locatorの略です。Web上にある特定のデータの位置を指定する規格です。

UTF-16(16-bit UCS Transformation Format)

エンコーディングスキーマの一つの形式です。1つのコード単位を2バイトとし,1文字を1コード単位(2バイト),または2コード単位(4バイト)で表現します。UTF-16では2バイトのコード単位の1バイト目を先に書くビッグエンディアン形式(UTF-16BE)と1バイト目を後に書くリトルエンディアン形式(UTF-16LE)があります。

COBOL2002では,用途がNATIONALの項目でUCS-4の範囲(UCS-2の範囲を含む)をサポートします。

UTF-8(8-bit UCS Transformation Format)

エンコーディングスキーマの一つの形式です。ASCII文字を1バイト,日本語文字を3〜8バイト,半角かたかなを3バイトで表現します。

COBOL2002では,用途がDISPLAYの項目で使用します。

XML(eXtensible Markup Language)

World Wide Web Consortium(W3C)によって標準化が進められている,文章の構造を定義するための言語です。XMLでは,テキストファイル中の各データをタグ(<>)で囲むことによって,データの構造を定義します。

XMLアクセス用データ定義

XMLアクセスルーチンの戻り値や,アクセスするXML要素に対応したデータ項目を登録集原文として提供するものです。XMLアクセス用データ定義は,XMLドキュメントのDTDとユーザが作成したDDFを基に,cblxmlコマンドを使って生成します。

XMLアクセスルーチン

COBOLプログラムからXMLドキュメントにアクセスするときに呼び出す副プログラムです。XMLアクセスルーチンは,XMLドキュメントのDTDとユーザが作成したDDFを基に,cblxmlコマンドを使って生成します。

XML要素

XMLドキュメントで,XMLタグ,タグに付随する属性,およびタグに囲まれたデータのすべてのことです。

(ア行)

エンティティ

XML文書中で使用される画像データやPDFファイルなどのファイルや,置換する文字列などのデータを保持する実体です。

(カ行)

解析モード

XMLパーサがXML文書を解析するときの動作方式です。解析モードには,検証モードと非検証モードがあります。

公開識別子

外部DTDや外部実体を識別するための文字列です。XML連携機能では,公開識別子と,外部DTDや外部実体を含むファイルの対応を,カタログファイルで定義することで,公開識別子を用いて外部DTDや外部実体を参照するXMLドキュメントを処理できます。

(サ行)

サロゲート

UTF-16の拡張で,2つのコード単位(4バイト)で1文字を表す機能です。この2つのコード単位の組み合わせのことをサロゲートペアと呼びます。

COBOL2002では,用途がNATIONALの項目で使用します。

システム識別子

システム識別子とは,解析中のエンティティ(XML文書)を指す識別子のことです。

属性

XML要素のうち,タグに情報を追加するための修飾部分のことです。

(タ行)

タグ

XML要素のうち,データを意味づけするために囲んだ「<…>」部分のことです。

データ

XML要素のうち,XMLタグに囲まれた内容のことです。

登録集原文

COBOLプログラム中でよく利用される標準化した手続き,ファイル記述,レコード記述,または完全な一つのプログラムなどを,コンパイルするプログラムとは別のファイルに登録したものです。XML連携機能では,XMLアクセス用データ定義が登録集原文として生成されます。

(ハ行)

パーサ

パーサとは,XML文書を解析するプログラムのことです。

バイトオーダ

2バイト以上のデータの記録を行う順序のことです。例えば,0x1234のデータを0x1234のように最上位のバイトから順番に記録する方式をビッグエンディアン,0x3412のように最下位のバイトから順番に記録する方式をリトルエンディアンと呼びます。2バイトのUTF-16は,バイトオーダを意識します。

(マ行)

見た目幅

Unicode機能の組み込み関数で使用します,文字の見た目の幅です。半角文字の幅は1,全角文字の幅は2として扱います。

Unicode機能の組み込み関数で,文字を見た目幅で数える場合に使用します。