RAG を使用した生成 AI

次のアーキテクチャ ガイドを使用して、 Google Cloudで検索拡張生成(RAG)を備えた生成 AI アプリケーションを設計してデプロイします。

アーキテクチャ ガイド 説明
Gemini Enterprise と Vertex AI を使用した生成 AI 用 RAG インフラストラクチャ Gemini Enterprise を統合プラットフォームとして使用し、リアルタイムのデータ可用性とコンテキスト検索の強化を必要とするエンタープライズ アプリケーション向けに、エンドツーエンドの RAG データフローをオーケストレートするエージェント駆動型アーキテクチャ。
Vertex AI とベクトル検索を使用した生成 AI 用 RAG インフラストラクチャ 大規模なアプリケーション向けに最適化された高パフォーマンスのベクトル検索を提供する、フルマネージドのサーバーレス アーキテクチャ。
Vertex AI と AlloyDB for PostgreSQL を使用した生成 AI 用 RAG インフラストラクチャ AlloyDB for PostgreSQL などのフルマネージド データベースに、運用データとともにベクトル エンベディングを保存するアーキテクチャ。
ジャンプ スタート ソリューション: Vertex AI と Cloud SQL を使用する生成 AI の RAG Cloud SQL などのフルマネージド データベースに、運用データとともにベクトル エンベディングを保存するアーキテクチャ。
GKE と Cloud SQL を使用した生成 AI 用 RAG インフラストラクチャ Ray、Hugging Face、LangChain などのオープンソース ツールを使用してカスタム アプリケーションを構築するために最大限の制御を提供する、柔軟なコンテナベースのアーキテクチャ。
Vertex AI と Spanner Graph を使用した生成 AI 用 GraphRAG インフラストラクチャ ベクトル検索とナレッジグラフ クエリを組み合わせて、相互接続されたコンテキスト データを取得する高度な RAG アーキテクチャ。これにより、より詳細で関連性の高い生成 AI レスポンスが生成されます。
RAG アプリケーション用の Harness CI / CD パイプライン Google Cloudの RAG アプリケーションの継続的インテグレーション(CI)と継続的デプロイ(CD)パイプラインのアーキテクチャ。