Hitachi

JP1 Cloud Service システム管理 生成AI連携 利用ガイド


2.1.3 インデックスの作成(任意)

Azure AI Searchと連携する場合はインデックスの作成が必要です。連携しない場合はこの操作は不要です。Azure AI Searchのインデックスを,以下に記載されたスキーマに沿って作成してください。

生成AI連携基盤がユーザーコンテンツの検索先として使用するAzure AI Searchのインデックスに関して,必要なインデックス内のフィールドを以下に示します。

表2‒2 インデックスの項目

#

フィールド名

説明

設定例

文字数の目安※1

1

id

インデックス内で検索ドキュメントを一意に定めるキーフィールド

"0001"

2

content

検索対象の中身をテキスト化して格納するフィールド

JP1は日立オープンミドルウェアシリーズのひとつです。

600文字

3

sourcepage

#2の元ファイルにおける記載箇所も含めて引用元を表すフィールド。

生成AI連携による回答にAzure AI Searchから得られた情報を用いる場合,引用元の情報として,本項目の設定内容が使用されます。

Example.pdf-page.100

64文字※2

4

sourcefile

#2の元ファイルを識別するためのフィールド。

生成AI連携による回答にAzure AI Searchから得られた情報を用いる場合,引用元の情報として,本項目の設定内容が使用されます。

Example.pdf

64文字※2

5

document_url

#2の元ファイルへアクセスするURL(httpまたはhttps)を格納するフィールド。

生成AI連携による回答にAzure AI Searchから得られた情報を用いる場合,引用元へのアクセス情報として,本項目の設定内容が使用されます。

'"https://example_file_storage.XXX/Example.pdf?token=YYY"

※3

500文字※4

注※1

生成AI連携として定める文字数の目安を記載しています。文字数が多くなるほど,生成AIがトークンを消費するため,目安を参考にしてインデックスを作成してください。Azure AI Searchとしての制限は,Microsoft社が公開するドキュメントを参照してください。

注※2

半角英数字と“.(ドット)”,“-(ハイフン)”,“_(アンダーバー)”が使用可能です。

注※3

URLの格納は任意となります。URLを格納しない場合は,”None”という文字列を格納してください。

注※4

URLエンコードされた文字列が使用可能です。

また,各フィールドの属性については以下のように設定してください。

表2‒3 インデックスのフィールド属性

#

フィールド名

キー

取得可能

フィルタ可能

ソート可能

ファセット可能

検索可能

アナライザ

1

id

String

2

content

String

日本語 - Microsoft※5

3

sourcepage

String

4

sourcefile

String

5

document_url

String

注※5

生成AI連携基盤は日本語のみサポート対象としています。

インデックスの作成については,作成手順例をまとめたサンプルファイルを「JP1CloudService-生成AI連携_サンプルコンテンツ_インデックス作成手順例.zip」にまとめて提供します。サンプルファイルはJP1 Cloud Serviceの提供ファイルのダウンロード機能を利用してダウンロードできます。ダウンロード方法については「JP1 Cloud Service ジョブ管理・システム管理 サービスポータル 利用ガイド JCSM03-0210-01」における「3.2 提供ファイル一覧」を参照してください。