Last reviewed 2025-01-06 UTC
這份架構中心的文章提供架構指南,協助您在 Google Cloud中建構及部署生成式 AI 工作負載。
如要瞭解如何設定、部署、評估及運作以基礎模型為基礎的生成式 AI 應用程式,請參閱「部署及運作生成式 AI 應用程式」。
整體架構
下列指南提供特定業務和技術用途的生成式 AI 高階架構:
| 指南 | 說明 |
|---|---|
| 產生個人化行銷活動 | 為個人化行銷活動生成媒體素材資源。 |
| 生成個人化產品建議 | 根據使用者偏好,為零售應用程式生成個人化產品建議。 |
| 從音訊檔案生成 Podcast | 根據媒體檔案生成 Podcast,例如體育賽事的現場評論。 |
| 為客戶支援要求生成解決方案 | 生成顧客問題的回覆,例如技術支援要求。 |
參考架構
下列指南提供詳細的架構範例和設計建議,協助您為特定用途部署生成式 AI 工作負載和基礎架構:
| 指南 | 說明 |
|---|---|
| 自動審查保險理賠的利用情形 | 改善健康保險理賠的預先授權 (PA) 和使用情形審查 (UR) 程序。 |
| 使用 Gemini Enterprise 和 Vertex AI 建構 RAG 基礎架構 | 運用代理 RAG 工作流程,即時取得資料並進行情境豐富的搜尋。 |
| 使用 Vertex AI 和 Vector Search 的 RAG 基礎架構 | 為大規模應用程式提供最佳化的高效能向量搜尋功能。 |
| 使用 Vertex AI 和 AlloyDB for PostgreSQL 建構 RAG 基礎架構 | 在全代管的 AlloyDB for PostgreSQL 資料庫中,與作業資料一起儲存向量嵌入。 |
| 使用 Vertex AI 和 Cloud SQL 的 RAG 基礎架構 | 在全代管的 Cloud SQL 資料庫中,與作業資料一併儲存向量嵌入內容。 |
| 使用 GKE 和 Cloud SQL 的 RAG 基礎架構 | 使用 Ray、Hugging Face 和 LangChain 等開放原始碼工具,建構自訂 RAG 應用程式。 |
| 使用 Vertex AI 和 Spanner Graph 建構 GraphRAG 基礎架構 | 結合向量搜尋和知識圖譜查詢,檢索互相關聯的脈絡資料。 |
| 具備 RAG 功能的生成式 AI 應用程式專用連線 | 使用共用 VPC,確保支援 RAG 的生成式 AI 應用程式網路基礎架構安全無虞。 |
| 運用 CI/CD 管道開發 RAG 應用程式 | 為 RAG 應用程式設定持續整合 (CI) 和持續部署 (CD) pipeline。 |