本文說明如何使用 AI,在 Google Cloud中為零售應用程式生成個人化產品建議,並提供高階架構。
本文的目標讀者包括架構師、開發人員和管理員,他們負責在雲端建構及管理零售業的生成式 AI 應用程式。本文假設您已具備生成式 AI 的基礎知識。
架構
下圖顯示的架構會使用 AI 模型,根據點擊流指標的洞察資料生成個人化產品推薦內容。
架構顯示下列流程:
- 擷取及處理使用者資料:
- 系統會將網頁瀏覽、點擊和購買等點擊流資料上傳至 Dataflow 管道。
- Dataflow 會處理資料並衍生洞察資料,例如使用者個人資料和偏好設定。接著,Dataflow 會將資料、洞察資訊和向量嵌入儲存在 BigQuery 中。
- 生成及放送產品建議:
- 顧客造訪公司店面,也就是這個架構中的 Cloud Run 服務。
- 店面服務會將訪客資料傳送至在 Cloud Run 上執行的推薦服務。
- 推薦服務會在 BigQuery 中執行向量相似度搜尋,並擷取訪客的個人資料和偏好設定相關資料。
- 推薦服務會將訪客的個人資料和偏好設定資料傳送至 Vertex AI 中的 Gemini API,並提示生成產品建議。Gemini 會生成適合訪客的產品建議。
- 建議工具服務會將產品建議傳送至店面服務,然後顯示建議。
如要最佳化成本和效能,請在店面服務和推薦服務之間新增快取。建議服務會檢查快取中的訪客資料。如果快取中沒有相關資料,這項服務會在 BigQuery 中執行向量相似度搜尋。如要設定快取,可以使用 Memorystore,或透過 Cloud CDN 設定負載平衡器。
使用的產品
這個範例架構使用下列 Google Cloud 產品:
- Cloud Run:無伺服器運算平台,可讓您在 Google 可擴充的基礎架構上直接執行容器。
- Vertex AI:機器學習平台,可讓您訓練及部署機器學習模型和 AI 應用程式,並自訂 LLM 用於 AI 輔助的應用程式。
- BigQuery:企業資料倉儲,內建機器學習、地理空間分析和商業智慧等功能,有助於管理及分析資料。
- Dataflow:這項服務整合串流與批次資料處理功能,可大規模處理資料。
部署
如要試用零售業工作負載的生成式 AI 應用程式,請使用下列程式碼範例: Google Cloud
後續步驟
- 如要瞭解詳情,請參閱生成式 AI 架構指南。
- 如要瞭解適用於 Google Cloud中 AI 和機器學習工作負載的架構原則和建議,請參閱 Well-Architected Framework 中的AI 和機器學習觀點。
- 如要查看更多參考架構、圖表和最佳做法,請瀏覽 Cloud Architecture Center。
貢獻者
作者:Kumar Dhanagopal | 跨產品解決方案開發人員
其他貢獻者:
- Amina Mansour | Cloud Platform 評估團隊主管
- Megan O'Keefe | 開發人員服務代表
- Samantha He | 技術文件撰稿者
- Shir Meir Lador | 開發人員關係工程工程師經理