Last reviewed 2025-01-06 UTC
アーキテクチャ センターのこのドキュメントでは、 Google Cloudで生成 AI ワークロードを構築してデプロイする際に役立つアーキテクチャ ガイドを提供します。
基盤モデルで生成 AI アプリケーションを設定、デプロイ、評価、運用する方法については、生成 AI アプリケーションをデプロイして運用するをご覧ください。
アーキテクチャの概要
次のガイドでは、生成 AI の特定のビジネス ユースケースと技術ユースケースの概要アーキテクチャについて説明します。
| ガイド | 説明 |
|---|---|
| パーソナライズされたマーケティング キャンペーンを生成する | パーソナライズされたマーケティング キャンペーン用のメディア アセットを生成します。 |
| パーソナライズされた商品のおすすめを生成する | 小売アプリケーションのユーザーの好みに基づいて、パーソナライズされたおすすめ商品を生成します。 |
| 音声ファイルからポッドキャストを生成する | スポーツ イベントのライブ解説などのメディアファイルに基づいてポッドキャストを生成します。 |
| カスタマー サポート リクエストに対する解決策を生成する | 技術サポートのリクエストなど、お客様の質問に対する回答を生成します。 |
リファレンス アーキテクチャ
次のガイドでは、特定のユースケース向けに生成 AI ワークロードとインフラストラクチャをデプロイするための詳細なアーキテクチャの例と設計の推奨事項について説明します。
| ガイド | 説明 |
|---|---|
| 保険請求の利用状況の審査を自動化する | 健康保険請求の事前承認(PA)と利用審査(UR)のプロセスを改善します。 |
| Gemini Enterprise と Vertex AI を使用した RAG インフラストラクチャ | リアルタイムのデータ可用性とコンテキスト検索の強化を備えたエージェント RAG ワークフローをオーケストレートします。 |
| Vertex AI とベクトル検索を使用した RAG インフラストラクチャ | 大規模なアプリケーション向けに最適化された高パフォーマンスのベクトル検索を提供します。 |
| Vertex AI と AlloyDB for PostgreSQL を使用した RAG インフラストラクチャ | ベクトル エンベディングを運用データとともにフルマネージドの AlloyDB for PostgreSQL データベースに保存します。 |
| Vertex AI と Cloud SQL を使用する RAG インフラストラクチャ | フルマネージドの Cloud SQL データベースに、運用データとともにベクトル エンベディングを保存します。 |
| GKE と Cloud SQL を使用した RAG インフラストラクチャ | Ray、Hugging Face、LangChain などのオープンソース ツールを使用して、カスタム RAG アプリケーションを構築します。 |
| Vertex AI と Spanner Graph を使用した GraphRAG インフラストラクチャ | ベクトル検索とナレッジグラフ クエリを組み合わせて、相互接続されたコンテキスト データを取得します。 |
| RAG 対応生成 AI アプリケーションのプライベート接続 | 共有 VPC を使用して、RAG 対応生成 AI アプリケーションのネットワーク インフラストラクチャを保護します。 |
| RAG アプリケーション用の Harness CI/CD パイプライン | RAG アプリケーションの継続的インテグレーション(CI)と継続的デプロイ(CD)パイプラインを設定します。 |