Hitachi

uCosminexus Enterprise Search 運用ガイド


5.4.6 RDBクローラー詳細情報

RDB固有のクローラー情報の詳細情報について説明します。他のクローラーと共通の設定については,「5.4.1 クローラー詳細情報の共通設定項目」を参照してください。

図5‒9 RDBクローラー詳細情報画面

[図データ]

RDBクローラー詳細情報画面の項目を次の表に示します。

表5‒15 RDBクローラー詳細情報画面の項目

#

項目名

指定規則

説明

入力できる文字数

対象データベース

必須

収集対象のRDBをプルダウンメニューから選択します。

表示するRDBを次に示します。

  • HiRDB

  • Oracle

  • SQL Server

ここで選択したRDBと,そのほかの項目で指定したOLE DBプロバイダーの種類が不一致の場合,クローリングエラーとなります。

接続文字列

必須

クローリングを実行するRDBに対するOLE DB接続文字列を入力します。OLE DB接続文字列は,クローリングを実行するRDBごとに異なります。それぞれのRDBの情報を確認してください。

また,ユーザー名は「%UID%」,パスワードは「%PWD%」に置き換えてください。

1,024文字以内

RDB認証※1

必須

共通定義で登録したユーザー認証定義のタイトルが,RDB認証IDの昇順でプルダウンメニューに表示されます。RDB認証に利用するユーザー認証定義を選択します。

利用しない場合は「使用しない」を選択してください。

表名※2

必須

クローリングする表名を入力します。

255文字以内

ユニークキーのカラム名※2※3

必須

クローリングする表のレコードを指定する場合に,ユニークキーの列名を入力します。

255文字以内

更新日時のカラム名※2※3

任意

更新日時のカラム名を入力できます。

  • 日時データが1970/01/01 00:00:00〜2038/01/19 03:14:07(UTC:世界標準時)の範囲内の場合は,その日時を更新日時とします。

  • 日時データが0100/01/01 00:00:00〜1969/12/31 23:59:59(UTC),または2038/01/19 03:14:08〜9999/12/31 23:59:59(UTC)の範囲内の場合は,現在日時を更新日時とします。

  • 日時データが0099/12/31 23:59:59(UTC)以前,または10000/01/01 00:00:00(UTC)以降の場合は,動作は保証しません。

255文字以内

タイトルのカラム名※2※3

任意

タイトルのカラム名を入力できます。

255文字以内

本文のカラム名※2※3

任意

本文のカラム名を入力できます。

255文字以内

参照URLのカラム名※2※3

任意

Webブラウザーのアクセスに使用するURLのカラム名が入力できます。

255文字以内

ファイル名のカラム名※1※2※3

任意

ファイル名のカラム名が入力できます。

255文字以内

注※1

RDBの認証制限を適用する場合には,複数のクローラーで同一のRDBテーブルを指定して,使用するRDB認証定義を切り替えてください。

注※2

カラム名の大文字,小文字を区別する場合はダブルクォート("")で囲んでください。なお,カラム名に半角空白,全角空白,半角セミコロン(;)は入力できません。

注※3

指定できるカラムの型は,OLE DBプロバイダーごとに異なります。指定できる型を次の表に示します。なお,指定時に型のチェックは行われません。

表5‒16 OLE DBプロバイダーによる指定できる型の差異

カラム名

Oracle Provider for OLE DBを使用してOracle Databaseの文書をクローリング

OLE DB Provider for SQL Serverを使用してSQL Serverの文書をクローリング

HiRDB OLE DBプロバイダーを使用してHiRDBの文書をクローリング

ユニークキー

文字列型,数値型

文字列型,数値型

文字列型,数値型

更新日時

日付型

日付型

日付型

タイトル

文字列型

文字列型

文字列型

本文

文字列型,バイナリ型

文字列型,バイナリ型

文字列型

参照URL

文字列型

文字列型

文字列型

ファイル

文字列型

文字列型

文字列型

Enterprise Searchが対応している各RDBのデータ型を次の表に示します。

表5‒17  Oracle Provider for OLE DBの場合

データ型

内容

文字列型

CHAR,CLOB,VARCHAR

数値型

BINARY_FLOAT,BINARY_DOUBLE,FLOAT,NUMBER

日付型

DATE,TIMESTAMP

バイナリ型

BFILE,BLOB,RAW,LONG RAW

表5‒18  OLE DB Provider for SQL Serverの場合

データ型

内容

文字列型

char,varchar,text

数値型

numeric,decimal,tinyint,smallint,int,real,float

日付型

smalldatetime,datetime

バイナリ型

binary,varbinary

表5‒19  HiRDB OLE DBプロバイダーの場合

データ型

内容

文字列型

CHAR,MCHAR,NCHAR,VARCHAR,MVARCHAR,NVARCHAR

数値型

DECIMAL,SMALLINT,INTEGER,REAL,SMALLFLT,FLOAT,DOUBLE PRECISION

日付型

DATE,TIME,TIMESTAMP

注意事項
  • クローリングは1トランザクションで行われます。そのため,対象となる文書数が多大な場合にRDBサーバーとの接続がタイムアウトし,クローリングに失敗するときがあります。このような場合は,RDBサーバーのトランザクションタイムアウトの値を,クローリング期間で設定した値よりも大きい値に設定してください。

  • RDBサーバーがSQL Server,およびHiRDBの場合,クローリング中は対象のテーブル,またはビューをロックします。Oracle Databaseの場合は,クローリング中でもロックはされません。SQL Server,およびHiRDBのロックの方法を次に示します。

    SQL Serverの場合:対象のテーブル,またはビューをインテント共有でロックします。

    HiRDBの場合:対象のテーブル,またはビューを共用モードでロックします。

    他のアプリケーションなどから更新・挿入が行われる可能性のあるテーブル,またはビューをクローリングする場合は,他のアプリケーションへの影響が最小限となる時間にクローリングを行うスケジューリングにしてください。