5.4.4 NTFSクローラー詳細情報
NTFS固有のクローラー情報の詳細情報について説明します。他のクローラーと共通の設定については,「5.4.1 クローラー詳細情報の共通設定項目」を参照してください。
NTFSクローラー詳細情報画面の項目を次の表に示します。
# |
項目名 |
指定規則 |
説明 |
---|---|---|---|
① |
フォルダーパス |
必須 |
クローリングするフォルダーパスを入力します。 入力できる文字はUNC形式で1,024文字※4以内です。UNC形式と認識できない場合はエラーとなります。 |
② |
共有フォルダー認証 |
必須 |
共通定義で登録したユーザー認証定義のタイトルが,ユーザー認証IDの昇順でプルダウンメニューに表示されます。「共有フォルダー認証」に利用するユーザー認証定義を選択します。 利用しない場合は「使用しない」を選択します。 なお,共有フォルダーの認証制限を適用する場合は,複数のクローラーで同一の共有フォルダーを対象とし,使用する共有フォルダー認証定義,フィルターを切り替えてください。 |
③ |
参照プロトコル※1 |
必須 |
参照プロトコルのフォーマット式を入力します。入力できる文字数は1,024文字以内です。参照プロトコルのフォーマット式に記載できるURLスキーマを次に示します。
「フォルダーパス」で指定したパスを「参照プロトコル」で指定した文字列に置き換えることで,Webサーバー経由やローカルファイルにアクセスするURLを作成します。作成するURLは基底部の置き換えとセパレーターの変換(「\」を「/」に変換)を行います。 |
④ |
フィルター※2※3 |
任意 |
クローリングしないファイルパスのフィルター式を入力します。入力できる文字数は1,024文字以内です。 「を含む」にはクロール対象に含むフィルター式を,「を除く」には,クロール対象から除くフィルター式を指定できます。フィルター式の正当性はチェックされません。
「を除く」,「を含む」の両方を指定した場合,「を除く」で指定された条件にマッチしないファイルパスのうち,「を含む」で指定された条件にマッチするファイルパスのクローリングを実行します。 なお,フィルターによりクローリングするエントリーから除かれたファイルへは,アクセスを行いません。 |
- 注※1
-
参照プロトコルで指定したURLスキーマがhttp,httpsの場合は,URL正規化を行います。置き換えの例を次の表に示します。
表5‒10 置き換えの例 置き換え前の参照プロトコル
置き換え後の参照URL
http://12.34.56.78/web/local/
http://12.34.56.78/web/local/target.doc
file://12.34.56.78/共用/フォルダー/
file://12.34.56.78/共用/フォルダー/under/target.doc
- 注※2
-
フィルターは次の表に示す内容で,部分文字列マッチを確認します。
表5‒11 部分文字列マッチの内容 フィルター定義
意味
*(ワイルドカード)
任意の文字0文字以上として扱われます。
?(ワイルドカード)
任意の文字1文字として扱われます。
任意のシングルバイト文字
大文字と小文字は,同一文字として扱われます。
任意のマルチバイト文字(UTF-8)
そのまま比較します。
;(セミコロン)
セパレーターです。
このセパレーターで複数のフィルターを指定できます。
- 注※3
-
フィルター式に何も指定しない場合は,次の表のとおりとなります。
表5‒12 フィルター式に何も指定しない場合 フィルター種類
デフォルト
備考
クロール対象に含むフィルター式
なし
−
クロール対象から除くフィルター式
*.gif;*.tif;*.tiff;*.jpg;*.jpeg;*.png;*.bmp
既定の画像ファイル
- 注※4
-
システム定義として設定可能な上限値です。実際の収集では,収集先システムの制限を受けます。Windowsファイルシステムの場合,収集可能なファイル名の長さは259バイト以下に制限されます。