検索拡張生成(RAG)を使用して、組織のデータに基づいてグラウンディングされた正確な回答を提供する生成 AI チャット アプリケーションを構築します。このガイドでは、独自のニーズに合わせてカスタマイズしてアプリケーションとしてデプロイできる、 Cloud SQL を使用した生成 AI RAGアプリケーション テンプレートについて説明します。
たとえば、このテンプレートを実装して、次のようなビジネスニーズに対応できます。
| 例 | ビジネスニーズ | 実装 |
|---|---|---|
| カスタマー サポート チャットボット | 企業は、即時のカスタマー サポートを提供する必要があります。 | Cloud Run でチャット インターフェースをホストします。Vertex AI はエンベディングを処理し、Cloud SQL にベクトルとして保存されている技術ドキュメントに基づいてレスポンスを生成します。 |
| 社内人事アシスタント | 従業員は、特典、社内ポリシー、社内手続きに関する情報を探す必要があります。 | Cloud Run で人事アシスタントをホストします。従業員がツールにクエリを実行すると、Vertex AI は Cloud SQL から関連するポリシー情報を取得し、正確なソースグラウンディングされた回答を生成します。 |
| 法律文書の研究者 | 法務チームは、大規模なドキュメント リポジトリ全体で関連する判例や契約条項を迅速に見つける必要があります。 | Cloud Run で調査ポータルをホストします。Vertex AI は、Cloud SQL にベクトルとして保存されている法律文書を使用して、関連する判例を要約し、契約書の特定の文言を特定します。 |
| セマンティック プロダクト検索 | e コマース企業は、正確なキーワードではなく自然言語の説明を使用して商品検索を容易にしたいと考えています。 | Cloud Run で検索インターフェースをホストします。Vertex AI はユーザーの説明を処理し、Cloud SQL にベクトルとして保存されている商品カタログからセマンティックに関連性の高い商品を返します。 |
アーキテクチャ
次の図は、アプリケーションのコンポーネントと接続を示しています。
アプリケーションのリクエスト処理フローは次のとおりです。
- Cloud SQL の PostgreSQL データベースにデータを読み込みます。
- Vertex AI はテキスト フィールドのエンベディングを作成し、 データベースにベクトルとして保存します。
- A Cloud Load Balancing フロントエンドは外部リクエストを受信し、トラフィックを Cloud Load Balancing バックエンドに分散します。
- Cloud Load Balancing バックエンドは、トラフィックを Cloud Run フロントエンド サービスに分散します。
- フロントエンド サービスは、生成 AI を呼び出すために検索サービスと通信します。
- 検索サービスは Secret Manager を使用して、Vertex AI と Cloud SQL へのアクセスに必要な API キーと認証情報に安全にアクセスします。
- 検索サービスはリクエストをエンベディングに変換し、Cloud SQL データベースで類似するベクトルを検索します。
- 検索サービスは、検索結果を元のプロンプトとともに Vertex AI に送信して、レスポンスを作成します。
次のステップ
- Google テンプレートに基づいて、このテンプレートを複製してカスタマイズします。
- アプリケーション テンプレートを設計して、独自の構成を定義します。
- アーキテクチャ フレームワークを使用して、一般的なアーキテクチャのベスト プラクティスを特定します。Google Cloud