5.4.7 Groupmaxクローラー詳細情報画面
Groupmax固有のクローラー情報の詳細情報について説明します。他のクローラーと共通の設定については,「5.4.1 クローラー詳細情報の共通設定項目」を参照してください。
Groupmaxクローラー詳細情報画面の項目を次の表に示します。
# |
項目名 |
指定規則 |
説明 |
---|---|---|---|
① |
クロール対象機能 |
必須 |
クロールするGroupmaxの機能を指定します。
Groupmaxクローラーの登録が完了したあとに,クロール対象機能の変更はできません。 |
② |
Groupmaxエクスポートフォルダー※1 |
必須 |
Groupmaxの電子掲示板/電子会議室/ファイル共有の内容ファイルがエクスポートされるフォルダーのパスを,UNC形式,または絶対パス形式で指定してください。 指定できる文字数は1,024文字※4までです。 |
③ |
フォルダー認証 |
必須 |
共通定義で登録したユーザー認証定義のタイトルが,ユーザー認証IDの昇順でプルダウンメニューに表示されます。 「フォルダー認証」に利用するユーザー認証定義を選択します。 利用しない場合は「使用しない」を選択します。 |
④ |
クローリング後にエクスポートフォルダーを削除するかの指定 |
必須 |
Groupmaxクローラーの登録が完了したあとに「Groupmaxエクスポートフォルダー」で指定したフォルダーに格納されている,電子掲示板/電子会議室/ファイル共有の内容ファイルを削除するかどうかを指定します。
|
⑤ |
フィルター※2※3 |
任意 |
電子掲示板,または電子会議室の添付ファイルのファイル名に対するフィルター式を入力します。なお,クロール対象機能にファイル共有を指定した場合は,この項目は表示されません。 入力できる文字数は1,024文字以内です。
「を除く」,「を含む」の両方を指定した場合,「を除く」で指定された条件にマッチしない添付ファイルのファイル名のうち,「を含む」で指定された条件にマッチする添付ファイルのファイル名に対してクローリングを行います。 フィルターによりクローリングする添付ファイルのファイル名から除かれたファイルへは,アクセスを行いません。 |
- 注※1
-
-
Groupmaxからエクスポートされたファイルが正しくない場合は,クローリングエラーとなります。
-
「Groupmaxエクスポートフォルダー」の指定先に複数のファイルが存在する場合,Enterprise Searchはファイル名の日付が昇順のファイルからクローリングを実行します。
-
- 注※2
-
フィルターは次の表に示す内容で,部分文字列マッチを確認します。
表5‒21 部分文字列マッチの内容 フィルター定義
意味
*(ワイルドカード)
任意の文字0文字以上として扱われます。
?(ワイルドカード)
任意の文字1文字として扱われます。
任意のシングルバイト文字
大文字と小文字は,同一文字として扱われます。
任意のマルチバイト文字(UTF-8)
そのまま比較します。
;(セミコロン)
セパレーターです。このセパレーターで複数のフィルターを指定できます。
- 注※3
-
フィルター式に何も指定しない場合は,次の表のとおりとなります。
表5‒22 フィルター式に何も指定しない場合 フィルター種類
デフォルト
備考
クローリングする添付ファイルのファイル名に含むフィルター式
なし
−
クローリングする添付ファイルのファイル名から除くフィルター式
*.gif;*.tif;*.tiff;*.jpg;*.jpeg;*.png;*.bmp
既定の画像ファイル
- 注※4
-
システム定義として設定可能な上限値です。実際の収集では,収集先システムの制限を受けます。Windowsファイルシステムの場合,収集可能なファイル名の長さは259バイト以下に制限されます。
- 注意事項
-
-
Enterprise Searchは指定先のGroupmaxエクスポートフォルダーのファイルからGroupmaxのユーザーのアクセス権や必要なデータを取得しています。ファイルのエクスポートを定期的に行わない場合,Groupmax上でのアクセス権とEnterprise Searchで表示する内容が一致しないおそれがあります。Groupmaxからのファイルのエクスポートは定期的に行う運用を推奨します。
-
クロール実行コマンド(IWSCrawler.bat)で-d(登録済みデータの削除)を指定し,かつ「エントリー保存期間」に「クローリング先から削除されたエントリーを削除する」を指定している場合,Enterprise Searchはクローリングを実行するごとに「Groupmaxエクスポートフォルダー」で指定したフォルダーのファイルを確認し,会議室の参照期限,発言の有効期限が過ぎた電子会議室,記事の提示期限が過ぎた電子掲示板,および前回までに収集したファイル共有のデータで未更新のデータを削除します。なお,ファイル共有のデータはコマンドでの削除を推奨します。詳細については「9.8 Groupmaxファイル共有クローラー削除コマンド」を参照してください。
-
- 〈この項の構成〉
(1) Groupmaxのエクスポートコマンド使用時の注意
Groupmaxのエクスポート機能で,エクスポートコマンドを使用する際の注意事項について説明します。
なお,Groupmaxのエクスポート機能の詳細についてはマニュアル「Collaboration - Forum システム管理者ガイド」,および「Collaboration - Bulletin board システム管理者ガイド」を参照してください。
-
Enterprise Searchは,クローリングの実行時に指定されたGroupmaxエクスポートフォルダー内のすべてのファイルを登録します。-startdateオプション(開始日付の指定)を指定すると,前回エクスポートコマンドを実行した時間から追加,更新されたデータだけが出力されるため,クローリング時間の短縮ができます。
-startdateオプションを指定する運用を推奨します。
-
-cオプション(文字コードセット)にはUTF-8を指定してください。UTF-8以外の文字コードを指定した場合は,エクスポートしてもファイルを認識できません。
-
次の場合はアクセス権情報の判定ができないため,登録がスキップされます。
-
アクセス権一覧ファイルに存在しない掲示板IDを持つ記事データ
-
アクセス権一覧ファイルに存在しないロールIDを持つ発言データ
-
会議室一覧ファイルに存在しない会議室IDを持つ発言データ
-
アクセス権一覧ファイルに存在しないOIIDを持つコンテンツデータ
-
-
一度でも登録がスキップされた場合は,次に示す動作となります。
-
クローリング後にエクスポートフォルダーを削除するかの指定が「削除する」の場合でも,エクスポートフォルダーの削除は実施しません。
-
クロール実行コマンド(IWSCrawler.bat)で-d(登録済みデータの削除)を指定し,かつ「エントリー保存期間」に「クローリング先から削除されたエントリーを削除する」を指定した場合でも,エントリーの削除は実施されません。
-
-
電子掲示板のデータをエクスポートする場合
-
記事一覧とアクセス権一覧ファイルを同じディレクトリに出力するように,-dオプション(出力先ディレクトリパス)を指定してください。
-
-bidオプション(掲示板ID),-nidオプション(記事ID)は指定しないでください。
-
-
電子会議室のデータをエクスポートする場合
-
発言一覧と会議室一覧ファイル,およびアクセス権一覧ファイルを同じディレクトリに出力するように,-dオプション(出力先ディレクトリパス)を指定してください。
-
-fidオプション(会議室ID),-opnidオプション(発言ID)は指定しないでください。
-
記事一覧,発言一覧のURLを出力する場合は,-e urlオプションを指定してください。
-
-
ファイル共有のデータをエクスポートする場合
-
コンテンツデータ一覧とアクセス権一覧ファイルを同じディレクトリに出力するように,-dオプション(出力先ディレクトリパス)を指定してください。
-
-
ファイル共有のグループフォルダーのデータをエクスポートする場合
-
ファイルの所有者や運用者のアクセス権で検索に正しくヒットするためには,そのファイルより上位のフォルダーのアクセス権で明示的に,所有者や運用者のアクセス権が設定されている必要があります。
ファイル共有のグループフォルダーに関するアクセス制御の詳細については,Collaboration - File Sharingのマニュアルを参照してください。
-