Hitachi

ノンストップデータベース HiRDB Version 9 コマンドリファレンス(Windows(R)用)


5.1.1 データロードとは

ユーザが用意したデータを入力し,表へデータを格納します。これをデータロードといいます。

データロードの概要を次の図に示します。

図5‒1 データロードの概要

[図データ]

〈この項の構成〉

(1) 入力データファイル

入力データファイルとは,ユーザが用意したデータを格納したファイルのことです。

使用できる形式としては,全部で4種類あります。基本的には次の2種類のうち,どちらかの形式を使用します。

DAT形式:

列データを文字で記述する形式です。一般的には,CSV形式と呼ばれている形式です。

  • pdloadが列データをHiRDB内部形式に変換して格納するため,HiRDB以外のシステムのデータを基に表を作成する場合に適しています。

DAT形式の記述例:
中村,36,1958-10-15,yokohama
      :

また,DAT形式には,更に拡張機能が使用できる拡張DAT形式もあります。形式はDAT形式と基本的に同じですが,囲み文字の変更などの拡張機能を使用できます。

バイナリ形式:

列データをHiRDB内部形式で記述する形式です。

  • HiRDB内部形式への変換処理が不要となるため,性能面で優れています。大容量のデータを格納する場合,性能を要求される場合に適しています。

バイナリ形式の記述例:
928691ba814081408140240000003f0080000800796f6b6f68616d61
<------------------><------><------><------------------>
        中村          36       1         yokohama
      :
 
注 上段は実際のデータを,下段はそのデータの内容を示しています。

また,次のように,1行固定で記述する形式,及びpdrorgが出力する形式も使用できます。

固定長データ形式:

1行の長さ,及び各列データの開始位置(行の先頭からのオフセット)を,すべての行が同じになるように記述します。記述する形式としては,DAT形式,又はバイナリ形式のどちらかで記述します。

  • セパレータ文字で区切られていないテキストデータや,データ格納順序などを変更したいバイナリ形式のデータを基に表を作成する場合に適しています。

pdrorg出力バイナリ形式:

pdrorgを使用してバイナリ形式で出力したアンロードデータファイルです。

  • 他HiRDBシステムからデータを移行するときなどに使用します。

(2) 制御情報ファイル

制御情報ファイルには,pdloadの制御文を記述します。

制御文には,入力データファイルの指定,インデクス情報の指定,LOB列の情報の指定,ファイル出力先ディレクトリの指定などを記述します。なお,制御文にファイル出力先ディレクトリを指定しない場合,「制御文で指定しない場合のファイル出力先ディレクトリ」に示すディレクトリにファイルを出力します。

(3) 表

表は,あらかじめ定義されている必要があります。

(4) 表の属性によるデータロード方法

(a) 表にインデクスが定義されている場合

同時にインデクスも作成できます。

また,データロード時にはインデクス情報だけ出力しておいて,後からpdrorgでインデクスを作成することもできます。

(b) 横分割表の場合

表単位,又はRDエリア単位にデータロードできます。

(c) 監査証跡表の場合

セキュリティ監査機能を使用する場合,監査証跡ファイルに出力された監査証跡を監査証跡表にデータロードできます。

通常の表(ユーザが定義する表)に対するデータロードか,監査証跡表に対するデータロードかは,制御情報ファイルのsrcuoc文で指定します。srcuoc文については,「srcuoc文(UOC格納ライブラリの情報の記述)」を参照してください。