5.1.1 データロードとは
ユーザが用意したデータを入力し,表へデータを格納します。これをデータロードといいます。
データロードの概要を次の図に示します。
(1) 入力データファイル
入力データファイルとは,ユーザが用意したデータを格納したファイルのことです。
使用できる形式としては,全部で4種類あります。基本的には次の2種類のうち,どちらかの形式を使用します。
- DAT形式:
-
列データを文字で記述する形式です。一般的には,CSV形式と呼ばれている形式です。
-
pdloadが列データをHiRDB内部形式に変換して格納するため,HiRDB以外のシステムのデータを基に表を作成する場合に適しています。
- DAT形式の記述例:
中村,36,1958-10-15,yokohama :
また,DAT形式には,更に拡張機能が使用できる拡張DAT形式もあります。形式はDAT形式と基本的に同じですが,囲み文字の変更などの拡張機能を使用できます。
-
- バイナリ形式:
-
列データをHiRDB内部形式で記述する形式です。
-
HiRDB内部形式への変換処理が不要となるため,性能面で優れています。大容量のデータを格納する場合,性能を要求される場合に適しています。
- バイナリ形式の記述例:
928691ba814081408140240000003f0080000800796f6b6f68616d61 <------------------><------><------><------------------> 中村 36 1 yokohama : 注 上段は実際のデータを,下段はそのデータの内容を示しています。
-
また,次のように,1行固定で記述する形式,及びpdrorgが出力する形式も使用できます。
(2) 制御情報ファイル
制御情報ファイルには,pdloadの制御文を記述します。
制御文には,入力データファイルの指定,インデクス情報の指定,LOB列の情報の指定,ファイル出力先ディレクトリの指定などを記述します。なお,制御文にファイル出力先ディレクトリを指定しない場合,「制御文で指定しない場合のファイル出力先ディレクトリ」に示すディレクトリにファイルを出力します。
(3) 表
表は,あらかじめ定義されている必要があります。
(4) 表の属性によるデータロード方法
(a) 表にインデクスが定義されている場合
同時にインデクスも作成できます。
また,データロード時にはインデクス情報だけ出力しておいて,後からpdrorgでインデクスを作成することもできます。
(b) 横分割表の場合
表単位,又はRDエリア単位にデータロードできます。
(c) 監査証跡表の場合
セキュリティ監査機能を使用する場合,監査証跡ファイルに出力された監査証跡を監査証跡表にデータロードできます。
通常の表(ユーザが定義する表)に対するデータロードか,監査証跡表に対するデータロードかは,制御情報ファイルのsrcuoc文で指定します。srcuoc文については,「srcuoc文(UOC格納ライブラリの情報の記述)」を参照してください。