Hitachi

uCosminexus Enterprise Search 運用ガイド


5.4.4 NTFSクローラー詳細情報

NTFS固有のクローラー情報の詳細情報について説明します。他のクローラーと共通の設定については,「5.4.1 クローラー詳細情報の共通設定項目」を参照してください。

図5‒7 NTFSクローラー詳細情報画面

[図データ]

NTFSクローラー詳細情報画面の項目を次の表に示します。

表5‒9 NTFSクローラー詳細情報画面の項目

#

項目名

指定規則

説明

フォルダーパス

必須

クローリングするフォルダーパスを入力します。

入力できる文字はUNC形式で1,024文字※4以内です。UNC形式と認識できない場合はエラーとなります。

共有フォルダー認証

必須

共通定義で登録したユーザー認証定義のタイトルが,ユーザー認証IDの昇順でプルダウンメニューに表示されます。「共有フォルダー認証」に利用するユーザー認証定義を選択します。

利用しない場合は「使用しない」を選択します。

なお,共有フォルダーの認証制限を適用する場合は,複数のクローラーで同一の共有フォルダーを対象とし,使用する共有フォルダー認証定義,フィルターを切り替えてください。

参照プロトコル※1

必須

参照プロトコルのフォーマット式を入力します。入力できる文字数は1,024文字以内です。参照プロトコルのフォーマット式に記載できるURLスキーマを次に示します。

  • http

  • https

  • file

「フォルダーパス」で指定したパスを「参照プロトコル」で指定した文字列に置き換えることで,Webサーバー経由やローカルファイルにアクセスするURLを作成します。作成するURLは基底部の置き換えとセパレーターの変換(「\」を「/」に変換)を行います。

フィルター※2※3

任意

クローリングしないファイルパスのフィルター式を入力します。入力できる文字数は1,024文字以内です。

「を含む」にはクロール対象に含むフィルター式を,「を除く」には,クロール対象から除くフィルター式を指定できます。フィルター式の正当性はチェックされません。

  • 「を含む」

    フィルター式にマッチするファイルパスのクローリングを実行します。

  • 「を除く」

    フィルター式にマッチするファイルパスのクローリングを実行しません。

「を除く」,「を含む」の両方を指定した場合,「を除く」で指定された条件にマッチしないファイルパスのうち,「を含む」で指定された条件にマッチするファイルパスのクローリングを実行します。

なお,フィルターによりクローリングするエントリーから除かれたファイルへは,アクセスを行いません。

注※1

参照プロトコルで指定したURLスキーマがhttp,httpsの場合は,URL正規化を行います。置き換えの例を次の表に示します。

表5‒10 置き換えの例

置き換え前の参照プロトコル

置き換え後の参照URL

http://12.34.56.78/web/local/

http://12.34.56.78/web/local/target.doc

file://12.34.56.78/共用/フォルダー/

file://12.34.56.78/共用/フォルダー/under/target.doc

注※2

フィルターは次の表に示す内容で,部分文字列マッチを確認します。

表5‒11 部分文字列マッチの内容

フィルター定義

意味

*(ワイルドカード)

任意の文字0文字以上として扱われます。

?(ワイルドカード)

任意の文字1文字として扱われます。

任意のシングルバイト文字

大文字と小文字は,同一文字として扱われます。

任意のマルチバイト文字(UTF-8)

そのまま比較します。

;(セミコロン)

セパレーターです。

このセパレーターで複数のフィルターを指定できます。

注※3

フィルター式に何も指定しない場合は,次の表のとおりとなります。

表5‒12 フィルター式に何も指定しない場合

フィルター種類

デフォルト

備考

クロール対象に含むフィルター式

なし

クロール対象から除くフィルター式

*.gif;*.tif;*.tiff;*.jpg;*.jpeg;*.png;*.bmp

既定の画像ファイル

注※4

システム定義として設定可能な上限値です。実際の収集では,収集先システムの制限を受けます。Windowsファイルシステムの場合,収集可能なファイル名の長さは259バイト以下に制限されます。