Cloud Storage データストア ツール

このツールは、独自のファイルが入力されたデータストアに接続して、非構造化ドキュメントやよくある質問のコンテンツから情報を検索して取得するために使用されます。

ツールを初めて作成するときに、次の情報を指定します。

  • 名前: AI がツールの役割を理解するのに役立つわかりやすい名前。名前は動詞で始める必要があります(例: search_internal_docsquery_product_manuals)。
  • 説明: (省略可)ツールの機能と、AI がツールを使用するタイミングの説明。これにより、モデルは特定のデータストアにユーザーのプロンプトに対する回答が含まれているかどうかを判断できます。
  • モックツールのレスポンス: データを完全にインデックス登録する前に、テスト目的でツールの出力をシミュレートするために使用されるオプションの構成。
  • ロケーション: データストアがホストされているリージョン(グローバルなど)。
  • データ型: インポートするコンテンツの形式。

    • 非構造化データ: PDF、HTML ファイル、テキスト ファイルなどのドキュメントに最適です。
    • FAQ: 構造化された質問と回答のペアに最適です。
  • フォルダまたはファイルを選択: Google Cloud Storage(gs://*)内のデータのパス。単一のファイルまたはフォルダ全体をインポートできます。

  • 同期頻度: ツールがソースファイルの更新をチェックする頻度。

    • 1 回限り: 現在のデータを 1 回だけインポートします。
    • 定期: ソースファイルが変更されると、データストアが自動的に更新されます(この設定は作成後に変更できません)。

よくある質問のデータストア

FAQ データストアは、よくある質問(FAQ)の回答を保持できます。ユーザーの質問がアップロードされた質問と高い信頼性で一致すると、エージェントはその質問に対する回答を変更せずに返します。 エージェントで表示される質問と回答のペアごとにタイトルと URL を指定できます。

データは CSV 形式でデータストアにアップロードする必要があります。各ファイルには、列を記述するヘッダー行が必要です。

次に例を示します。

"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""

title 列と url 列は省略可能です。

"answer","question"
"42","What is the meaning of life?"

アップロード プロセス中に、フォルダを選択します。ここでは、拡張子に関係なく各ファイルが CSV ファイルとして扱われます。

制限事項:

  • , の後に余分なスペース文字があると、エラーが発生します。
  • 空白行(ファイルの末尾でも)があるとエラーが発生します。

非構造化データストア

非構造化データストアには、次の形式のコンテンツを含めることができます。

  • HTML
  • PDF
  • TXT
  • CSV

別のプロジェクトの Cloud Storage バケットからファイルをインポートすることは可能ですが、あまり一般的ではありません。これを行うには、インポート プロセスに明示的なアクセス権を付与する必要があります。エラー メッセージの指示に従ってください。エラー メッセージには、インポートを実行するためにバケットへの読み取りアクセス権が必要なユーザーの名前が含まれています。

制限事項:

  • テキストベースの形式のファイルの最大サイズは 2.5 MB、その他の形式の場合は 100 MB です。

Cloud Storage からインポートするもご覧ください。