Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud SQL を使用した生成 AI RAG

検索拡張生成（RAG）を使用して、組織のデータに基づいてグラウンディングされた正確な回答を提供する生成 AI チャットアプリケーションを構築します。このガイドでは、独自のニーズに合わせてカスタマイズしてアプリケーションとしてデプロイできる、 Cloud SQL を使用した生成 AI RAGアプリケーションテンプレートについて説明します。

たとえば、このテンプレートを実装して、次のようなビジネスニーズに対応できます。

例	ビジネスニーズ	実装
カスタマーサポートチャットボット	企業は、即時のカスタマーサポートを提供する必要があります。	Cloud Run でチャットインターフェースをホストします。Vertex AI はエンベディングを処理し、Cloud SQL にベクトルとして保存されている技術ドキュメントに基づいてレスポンスを生成します。
社内人事アシスタント	従業員は、特典、社内ポリシー、社内手続きに関する情報を探す必要があります。	Cloud Run で人事アシスタントをホストします。従業員がツールにクエリを実行すると、Vertex AI は Cloud SQL から関連するポリシー情報を取得し、正確なソースグラウンディングされた回答を生成します。
法律文書の研究者	法務チームは、大規模なドキュメントリポジトリ全体で関連する判例や契約条項を迅速に見つける必要があります。	Cloud Run で調査ポータルをホストします。Vertex AI は、Cloud SQL にベクトルとして保存されている法律文書を使用して、関連する判例を要約し、契約書の特定の文言を特定します。
セマンティックプロダクト検索	e コマース企業は、正確なキーワードではなく自然言語の説明を使用して商品検索を容易にしたいと考えています。	Cloud Run で検索インターフェースをホストします。Vertex AI はユーザーの説明を処理し、Cloud SQL にベクトルとして保存されている商品カタログからセマンティックに関連性の高い商品を返します。

アーキテクチャ

次の図は、アプリケーションのコンポーネントと接続を示しています。

デザインキャンバスの生成 AI RAG アプリケーション。このアプリケーションには、フロントエンド、取得、AI、シークレット管理、データベースのコンポーネントが含まれています。

アプリケーションのリクエスト処理フローは次のとおりです。

Cloud SQL の PostgreSQL データベースにデータを読み込みます。
Vertex AI はテキストフィールドのエンベディングを作成し、データベースにベクトルとして保存します。
A Cloud Load Balancing フロントエンドは外部リクエストを受信し、トラフィックを Cloud Load Balancing バックエンドに分散します。
Cloud Load Balancing バックエンドは、トラフィックを Cloud Run フロントエンドサービスに分散します。
フロントエンドサービスは、生成 AI を呼び出すために検索サービスと通信します。
検索サービスは Secret Manager を使用して、Vertex AI と Cloud SQL へのアクセスに必要な API キーと認証情報に安全にアクセスします。
検索サービスはリクエストをエンベディングに変換し、Cloud SQL データベースで類似するベクトルを検索します。
検索サービスは、検索結果を元のプロンプトとともに Vertex AI に送信して、レスポンスを作成します。

次のステップ

Google テンプレートに基づいて、このテンプレートを複製してカスタマイズします。
アプリケーションテンプレートを設計して、独自の構成を定義します。
アーキテクチャフレームワークを使用して、一般的なアーキテクチャのベストプラクティスを特定します。Google Cloud

Cloud SQL を使用した生成 AI RAG コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

アーキテクチャ

次のステップ

Cloud SQL を使用した生成 AI RAG