一部のサービスと機能は名前を変更中です。生成ハンドブックとフロー機能も、単一の統合コンソールに移行されます。

Google は AI 技術を使用して、コンテンツをご希望の言語に翻訳しています。AI 翻訳には誤りが含まれる場合があります。

データストア

**注:** データストア機能は Dialogflow CX の SLA には含まれていません。

データストアは、データストアツールがエンドユーザーの質問に対する回答をデータから見つけるために使用されます。データストアは、ウェブサイト、ドキュメント、サードパーティシステムのデータのコレクションで、それぞれがデータを参照します。

エンドユーザーがエージェントに質問すると、エージェントは特定のソースコンテンツから回答を検索し、見つかった結果を簡潔なエージェントレスポンスに要約します。また、エンドユーザーが詳細を確認できるように、レスポンスのソースへのサポートリンクも提供します。エージェントは、特定の質問に対して最大 5 つの回答スニペットを提供できます。

データストアのソース

データにはさまざまなソースを使用できます。

ウェブサイトの URL: ドメインまたはウェブページのリストからウェブサイトのコンテンツを自動的にクロールします。
BigQuery: データをインポート BigQuery テーブルから。
Cloud Storage: Cloud Storage バケットからデータをインポートします。
AlloyDB: AlloyDB for PostgreSQL クラスタからデータをインポートします。
Bigtable: Bigtable テーブルからデータをインポートします。
Firestore: Firestore コレクションからデータをインポートします。
Cloud SQL: Cloud SQL テーブルからデータをインポートします。
Spanner: Spanner テーブルからデータをインポートします。

アクセス制限付きのデータストアのソース

Google は、アクセス制限付き機能として、ファーストパーティとサードパーティのデータストアのソースを多数提供しています。利用可能なソースを確認してアクセスをリクエストするには、その他のデータストアのソースをご覧ください。

ウェブサイトのコンテンツ

ウェブサイトのコンテンツをソースとして追加する場合は、複数のサイトを追加または除外できます。サイトを指定するときに、パターンのワイルドカードとして個々のページまたは * を使用できます。すべての HTML と PDF のコンテンツが処理されます。

ウェブサイトのコンテンツをソースとして使用する場合は、ドメインの所有権を確認する必要があります。

制限事項:

公開 URL からのファイルは、検索インデックスに存在するように、Google 検索インデクサによってクロールされている必要があります。これは Google Search Consoleで確認できます。
最大 20 万ページがインデックスに登録されます。データストアにこれ以上のページ数が含まれている場合、その時点でインデックス登録は失敗しますが、すでにインデックスに登録されているコンテンツは残ります。

データのインポート

BigQuery または Cloud Storage からデータをインポートできます。このデータは、FAQ 形式または非構造化とすることができ、メタデータありまたはメタデータなしとすることができます。

次のデータインポートのオプション を使用できます。

データの追加/更新: 提供されたドキュメントがデータストアに追加されます。新しいドキュメントの ID が既存のドキュメントと同じ場合、古いドキュメントは新しいドキュメントで置き換えられます。
既存のデータをオーバーライド: 既存のデータをすべて削除し、新しいデータをアップロードします。この操作は取り消せません。

FAQ データストア

データストアは、よくある質問の回答を保持できます。ユーザーの質問がアップロードされた質問と高い信頼性で一致すると、エージェントはその質問に対する回答を変更せずに返します。エージェントで表示される質問と回答のペアごとにタイトルと URL を指定できます。

データを CSV 形式でデータストアにアップロードします。各ファイルには、列を記述するヘッダー行が必要です。

次に例を示します。

"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""

title 列と url 列は省略できます。

"answer","question"
"42","What is the meaning of life?"

アップロードプロセス中に、フォルダを選択します。ここでは、拡張子に関係なく各ファイルが CSV ファイルとして扱われます。

制限事項:

, の後に余分なスペース文字があると、エラーが発生します。
空行（ファイルの末尾でも）があると、エラーが発生します。

非構造化データストア

非構造化データストアには、次の形式のコンテンツを含めることができます。

HTML
PDF
TXT
CSV

別のプロジェクトの Cloud Storage バケットからファイルをインポートできます。これを行うには、インポートプロセスに明示的なアクセス権を付与します。エラーメッセージの指示に従ってください。エラーメッセージには、インポートを実行するためにバケットへの読み取りアクセス権が必要なユーザーの名前が含まれています。

制限事項:

テキストベースの形式のファイルの最大サイズは 2.5 MB、その他の形式の場合は 100 MB です。

メタデータを含むデータストア

タイトルと URL をメタデータとして指定できます。会話中に、エージェントはこの情報を提供して、Google 検索インデクサがアクセスできない内部ウェブページにユーザーがすばやくリンクできるようにします。

メタデータを含むコンテンツをインポートするには、JSON Lines ファイルを 1 つ以上指定する必要があります。このファイルの各行に 1 つのドキュメントを記述します。実際のドキュメントを直接アップロードしません。Cloud Storage パスにリンクする URIs が、JSON Lines ファイルで指定されます。

JSON Lines ファイルを指定するには、これらのファイルが含まれている Cloud Storage フォルダを指定します。このフォルダには他のファイルを保存しないでください。

フィールドの説明

フィールド	タイプ	説明
id	文字列	ドキュメントの一意の識別子。
content.mimeType	文字列	ドキュメントの MIME タイプ。「application/pdf」と「text/html」がサポートされています。
content.uri	文字列	Cloud Storage 内のドキュメントの URI。
structData	文字列	省略可能な `title` フィールドと `url` フィールドを含む単一行の JSON オブジェクト。

次に例を示します。

{ "id": "d001", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/first_doc.pdf"}, "structData": {"title": "First Document", "url": "https://internal.example.com/documents/first_doc.pdf"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"title": "Second Document", "url": "https://internal.example.com/documents/second_doc.pdf"} }
{ "id": "d003", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/mypage.html"}, "structData": {"title": "My Page", "url": "https://internal.example.com/mypage.html"} }

メタデータなしのデータストア

このタイプのコンテンツにはメタデータはありません。代わりに、個々のドキュメントへの URI リンクを指定します。コンテンツタイプはファイル拡張子によって決まります。

解析とチャンク化の設定

データソースに応じて、エージェント検索で定義されている解析とチャンク化の設定を構成できます。

データストアドキュメントに対する Cloud Storage の使用

コンテンツが公開されていない場合は、Cloud Storage にコンテンツを保存することをおすすめします。データストアドキュメントを作成するときは、Cloud Storage オブジェクトの URL を gs://bucket-name/folder-name の形式で指定します。フォルダ内の各ドキュメントがデータストアに追加されます。

Cloud Storage バケットを作成する場合は、次の手順を行います。

エージェントに使用するプロジェクトを選択します。
Standard Storage クラスを使用します。
バケットのロケーションをエージェントと同じロケーションに設定します。

Cloud Storage クイックスタートに沿って、バケットを作成し、ファイルをアップロードします。

言語

サポートされている言語については、言語リファレンスのデータストア列を参照してください。

最適なパフォーマンスを得るには、データストアを 1 つの言語で作成します。

データストアを作成したら、必要に応じてデータストアの言語を指定できます。データストアの言語を設定すると、別の言語用に構成されたエージェントにデータストアを接続できます。たとえば、英語のエージェントに接続されるフランス語のデータストアを作成できます。

サポートされるリージョン

サポートされているリージョンの詳細については、リージョンリファレンスをご覧ください。

（アクセス制限付き）その他のデータストアのソース

次の表に、その他のデータストアタイプを示します。これらは、アクセス制限付き機能として利用できます。アクセスをリクエストするには、アクセスリクエストフォームに記入してください。承認されると、Vertex AI Agent Builder でデータストアを作成するときに、これらのオプションが表示されます。

サードパーティのデータストアのソース

データストアのソース	説明
Box	組織の Box サイトからデータをインポートします。
Confluence Cloud	Confluence Cloud ワークスペースからデータをインポートします。
Dropbox	Dropbox ストレージからデータをインポートします。
EntraID	組織の EntraID システムからデータをインポートします。
Jira Cloud	Jira タスク管理システムからデータをインポートします。
OneDrive	組織の OneDrive ストレージからデータをインポートします。
Microsoft Outlook	Microsoft Outlook からデータをインポートします。
Salesforce	Salesforce からデータをインポートします。
ServiceNow	ServiceNow からデータをインポートします。
SharePoint	組織の SharePoint システムからデータをインポートします。
Slack	Slack からデータをインポートします。
Microsoft Teams	Microsoft Teams からデータをインポートします。

コネクタを使用してサードパーティのデータストアを設定する

このセクションでは、サードパーティのデータを使用してデータストアを設定するプロセスについて説明します。サードパーティのデータソースごとに固有の手順については、 Vertex AI Agent Builder のドキュメントをご覧ください。

ID プロバイダ

ID プロバイダを使用すると、ユーザー、グループ、認証を管理できます。サードパーティのデータストアを設定するときに、Google ID プロバイダまたはサードパーティの ID プロバイダを使用できます。

Google ID プロバイダ:

エージェントのユーザーは、Google 認証情報を使用してログインします。これは、@gmail.com メールアドレス、または Google を ID プロバイダとして使用するアカウント（Google Workspace など）です。ユーザーがを使用してエージェントと会話する場合、Google ID がシステムに自動的に組み込まれるため、この手順はスキップされます。 Google Cloud
Identity and Access Management（IAM）を使用して、Google アカウントへのアクセス権を割り当てることができます。

サードパーティの ID プロバイダ:

エージェントのユーザーは、Google 以外の認証情報（Microsoft メールアドレスなど）を使用してログインします。
Google 以外の ID プロバイダを含む Workforce Pool を使用して Workforce プールを作成する必要があります。 Google Cloud IAM を使用して、プール全体またはプール内の個々のユーザーにアクセス権を付与できます。
この方法は、 Google Cloud 組織で設定されたプロジェクトでは使用できません。@google.com

コネクタ

サードパーティのデータストアは、コネクタを使用して実装されます。各コネクタには複数のデータストアを含めることができ、Dialogflow CX システムにエンティティとして保存されます。

データストアを作成する前に、各リージョンに単一の ID プロバイダを Google Cloud > Agent Builder > 設定 で設定する必要があります。そのリージョン内のすべてのデータストアで同じ ID プロバイダが使用されます。Workforce プールで Google ID またはサードパーティの ID を選択できます。Workforce プールにある場合、同じ Google 認証情報は別の ID と見なされます。たとえば、test@gmail.com は workforcePools/test-pool/subject/test@gmail.com とは異なる ID と見なされます。
- 必要に応じて、 Workforce プールを作成します。
- Agent Builder の [設定] に移動し、[Google Identity] または [3rd Party Identity] を選択します。[保存] をクリックして、ID をリージョンに保存します。
- これで、リージョンにデータストアを作成できます。
各データストアは、アクセス制御リスト（ACL）データを各ドキュメントとともに保存します。このレコードは、どのユーザーまたはグループがどのエンティティに対する読み取りアクセス権を持っているかを追跡します。実行時に、ユーザーまたはグループメンバーは、読み取りアクセス権を持つエンティティをソースとするレスポンスのみをエージェントから受け取ります。ユーザーがデータストア内のエンティティに対する読み取りアクセス権を持っていない場合、エージェントは空のレスポンスを返します。
データストア内のデータはサードパーティインスタンスのコピーであるため、定期的に更新する必要があります。更新間隔は、時間単位または日単位で構成できます。
データストアを構成して [作成] をクリックすると、データストアがデータストアのリストに表示されるまでに最大で 1 時間かかることがあります。

データストアのトレース

この機能には次の 2 つの部分があります。

エージェントシミュレータでのデータストアの内部実行トレースとステップレイテンシの表示。
データストアの内部実行トレースとステップレイテンシを Cloud Logging と BigQuery にエクスポートします。

シミュレータでデータを表示する

エージェントシミュレータでトレースと実行データを表示するには、エージェントのレスポンスの右側にある展開矢印をクリックして、会話ターンの詳細を開きます。

[実行] タブには、次のものを含むデータストアの内部実行トレースが表示されます。

元のユーザー入力。
データストアエンジンによって書き換えられたクエリ。
セキュリティチェックのステータス、安定性チェックのステータス、グラウンディングチェックの結果、安全チェックのステータスなど、実行ステップからの品質シグナル。
データストア検索からの検索スニペット。
スニペットのサポートドキュメントのリスト。

[レイテンシ] タブには、さまざまなデータストア実行ステップの時間グラフが表示されます。ステップのリストは、データストアの構成方法と実行フローによって異なります。表示されるデータには次のものがあります。

FAQ の照合: FAQ の照合ステップを実行します。
クエリの書き換え: 元のユーザークエリを書き換えます。
検索: スニペット検索を実行します。
要約: レスポンスを要約します。
安全チェック: 安全チェックステップを実行します。

他のロケーションでトレースデータを表示する

会話履歴のロギングで会話エージェントを構成すると、データストアのトレースを [**会話履歴**]で表示できます。
Logging で会話エージェントを構成すると、CloudLogs Explorer でトレースとレイテンシを表示できます。
BigQuery エクスポートで会話エージェントを構成すると、エクスポートされた BigQuery テーブルでトレースとレイテンシを表示できます。

次のステップ

エージェントでデータストアを作成して使用する方法については、データストアツールのドキュメントをご覧ください。

ハンドブックの評価

データストアツール

データストア コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

データストアのソース

アクセス制限付きのデータストアのソース

ウェブサイトのコンテンツ

データのインポート

FAQ データストア

非構造化データストア

メタデータを含むデータストア

メタデータなしのデータストア

解析とチャンク化の設定

データストア ドキュメントに対する Cloud Storage の使用

言語

サポートされるリージョン

（アクセス制限付き）その他のデータストアのソース

サードパーティのデータストアのソース

コネクタを使用してサードパーティのデータストアを設定する

ID プロバイダ

コネクタ

データストアのトレース

シミュレータでデータを表示する

他のロケーションでトレースデータを表示する

次のステップ

データストア

データストアドキュメントに対する Cloud Storage の使用