生成式 AI 架構指南

Last reviewed 2025-01-06 UTC

這份架構中心的文章提供架構指南,協助您在 Google Cloud中建構及部署生成式 AI 工作負載。

如要瞭解如何設定、部署、評估及運作以基礎模型為基礎的生成式 AI 應用程式,請參閱「部署及運作生成式 AI 應用程式」。

整體架構

下列指南提供特定業務和技術用途的生成式 AI 高階架構:

指南 說明
產生個人化行銷活動 為個人化行銷活動生成媒體素材資源。
生成個人化產品建議 根據使用者偏好,為零售應用程式生成個人化產品建議。
從音訊檔案生成 Podcast 根據媒體檔案生成 Podcast,例如體育賽事的現場評論。
為客戶支援要求生成解決方案 生成顧客問題的回覆,例如技術支援要求。

參考架構

下列指南提供詳細的架構範例和設計建議,協助您為特定用途部署生成式 AI 工作負載和基礎架構:

指南 說明
自動審查保險理賠的利用情形 改善健康保險理賠的預先授權 (PA) 和使用情形審查 (UR) 程序。
使用 Gemini Enterprise 和 Vertex AI 建構 RAG 基礎架構 運用代理 RAG 工作流程,即時取得資料並進行情境豐富的搜尋。
使用 Vertex AI 和 Vector Search 的 RAG 基礎架構 為大規模應用程式提供最佳化的高效能向量搜尋功能。
使用 Vertex AI 和 AlloyDB for PostgreSQL 建構 RAG 基礎架構 在全代管的 AlloyDB for PostgreSQL 資料庫中,與作業資料一起儲存向量嵌入。
使用 Vertex AI 和 Cloud SQL 的 RAG 基礎架構 在全代管的 Cloud SQL 資料庫中,與作業資料一併儲存向量嵌入內容。
使用 GKE 和 Cloud SQL 的 RAG 基礎架構 使用 Ray、Hugging Face 和 LangChain 等開放原始碼工具,建構自訂 RAG 應用程式。
使用 Vertex AI 和 Spanner Graph 建構 GraphRAG 基礎架構 結合向量搜尋和知識圖譜查詢,檢索互相關聯的脈絡資料。
具備 RAG 功能的生成式 AI 應用程式專用連線 使用共用 VPC,確保支援 RAG 的生成式 AI 應用程式網路基礎架構安全無虞。
運用 CI/CD 管道開發 RAG 應用程式 為 RAG 應用程式設定持續整合 (CI) 和持續部署 (CD) pipeline。