Vertex AI 是整合式開放平台,可用於建構、部署及擴展生成式 AI 和機器學習 (ML) 模型與 AI 應用程式。這個平台提供 Model Garden 的存取權,其中包含超過 200 個精選模型,包括 Google 的基礎模型 (例如 Gemini) 和合作夥伴與開放模型的完整選擇,以及底層的 TPU/GPU 基礎架構。Vertex AI 支援最先進的生成式 AI 工作流程,以及 MLOps 的 AI 推論工作流程。提供端對端 MLOps 工具,以及企業級控管功能,可確保管理、安全性和法規遵循。
Vertex AI 的主要功能
Vertex AI 包含支援生成式 AI 的工具和服務,以及 AI 推論和機器學習工作流程。
生成式 AI 功能
Vertex AI 整合了全套工具,以及 Google 的進階基礎模型工具,可供您建構可用於正式環境的生成式 AI 代理程式和應用程式,如下所示:
提示:從 Vertex AI Studio 中的提示設計開始。 Vertex AI Studio 包含提示設計和模型管理工具,可用於設計原型、建構及部署生成式 AI 應用程式。
模型:Vertex AI Model Garden 是集中式中樞,內含超過 200 個企業級模型,包括 Google 模型、頂尖第三方合作夥伴 (例如 Anthropic 的 Claude) 模型,以及熱門的開放原始碼選項 (例如 Llama)。
這項模型選擇包括:
Google 的基礎生成式 AI 模型:
- Gemini:提供多模態功能,可處理文字、圖片、影片和音訊;以及模型思考功能,例如 Gemini 3 Flash 和 Gemini 3 Pro (搭配 Nano Banana)。
- Vertex AI 中的 Imagen:生成及編輯圖片。
- Vertex AI 的 Veo:根據文字和圖片生成影片。
合作夥伴和開放原始碼模型:存取精選的頂尖模型,例如 Anthropic 的 Claude、Mistral AI 模型和 Llama,享有卓越的成本效益。這些模型以全代管的模型即服務 (MaaS) API 提供。
模型自訂:根據貴商家調整模型,建立獨特的 AI 資源。從以企業資料或 Google 搜尋建立基準來減少幻覺,到使用 Vertex AI Training 監督式微調 (SFT) 或參數效率微調 (PEFT) Gemini 等模型,應有盡有。如要進一步瞭解模型自訂功能,請參閱微調簡介。
生成式 AI 評估:使用 Vertex AI GenAI Evaluation 功能,客觀評估及比較模型和代理程式的成效。部署執行階段防禦功能 (例如 Model Armor),主動檢查並防範提示詞注入和資料竊取等新興威脅,確保安全和法規遵循。
代理建構工具:Vertex AI Agent Builder 是全方位代理轉換系統,可協助您建立、管理及部署 AI 代理。使用開放原始碼的 Agent Development Kit (ADK) 建構及協調代理,然後將代理部署至代管的無伺服器 Vertex AI Agent Engine,以便在正式環境中大規模使用。每個代理程式都會獲派代理程式身分 (Identity and Access Management 主體),確保安全並提供清楚的稽核追蹤記錄。
存取外部資訊:透過基礎連結至可靠來源、使用函式呼叫與外部 API 互動,以及透過 RAG 從知識庫擷取資訊,提升模型回覆品質。
負責任的 AI 技術和安全:使用內建安全功能封鎖有害內容,確保以負責任的方式使用 AI。
如要進一步瞭解 Vertex AI 生成式 AI,請參閱這份說明文件。
AI 推論功能
Vertex AI 提供對應機器學習工作流程各階段的工具和服務:
資料準備:收集、清理及轉換資料。
- 使用 Vertex AI Workbench 筆記本執行探索性資料分析 (EDA)。
- 與 Cloud Storage 和 BigQuery 整合,存取資料。
- 使用 Dataproc Serverless Spark 大規模處理資料。
模型訓練:訓練機器學習模型。
- 選擇「AutoML」AutoML即可免除程式碼訓練,選擇「自訂訓練」則可全權控管。
- 使用 Vertex AI Experiments 管理及比較訓練執行作業。
- 在 Vertex AI Model Registry 中註冊訓練好的模型。
- Vertex AI Training 提供無伺服器訓練和訓練叢集。
- 使用 Vertex AI 無伺服器訓練,在全代管環境中依需求執行自訂訓練程式碼。請參閱 [Vertex AI 無伺服器訓練總覽][serverless]。
- 對於需要專屬預留加速器叢集保證容量的大型工作,請使用 Vertex AI 訓練叢集。請參閱 Vertex AI 訓練叢集總覽。
- 使用 Ray on Vertex AI,在受管理互動式叢集上,透過開放原始碼 Ray 架構調度 Python 和機器學習工作負載的資源。請參閱 Ray on Vertex AI 簡介。
- 使用 Vertex AI Vizier 調整複雜機器學習模型中的模型超參數。
模型評估和疊代:評估及提升模型效能。
- 使用模型評估指標比較模型。
- 將評估作業整合至 Vertex AI Pipelines 工作流程。
模型服務:部署模型並從中取得推論結果。
- 使用預先建構或自訂容器,部署以進行線上推論。
- 對大型資料集執行批次推論。
- 使用最佳化的 TensorFlow 執行階段,有效率地提供 TensorFlow 服務。
- 使用 Vertex Explainable AI 瞭解模型推論。
- 從 Vertex AI 特徵儲存庫提供特徵。
- 部署使用 BigQuery ML 訓練的模型。
模型監控:追蹤已部署模型的長期成效。
- 使用 Vertex AI 模型監控功能,偵測訓練/應用偏差和推論偏移。
機器學習運作工具
自動化處理、管理及監控機器學習專案:
- Vertex AI Pipelines:自動調度管理機器學習工作流程,並以可重複使用的管道形式執行。
- Vertex AI Model Registry:管理機器學習模型的生命週期,包括版本控管和部署。
- Vertex AI 無伺服器訓練:在全代管環境中,依需求執行自訂訓練程式碼
- Vertex AI Model Monitoring:監控已部署的模型,偵測資料偏差和偏移情形,維持模型效能。
- Vertex AI Experiments:追蹤及分析不同的模型架構和超參數。
- Vertex AI 特徵儲存庫:管理及提供特徵資料,用於訓練模型或進行即時預測。
- Vertex 機器學習中繼資料:追蹤及管理機器學習構件的中繼資料。
- Vertex AI 訓練叢集: 在專屬的預留加速器叢集上,訓練需要保證容量的大型工作。
- Vertex AI 上的 Ray:在受管理互動式叢集上,使用開放原始碼的 Ray 架構,擴充 Python 和 ML 工作負載。
後續步驟
- 深入瞭解 Vertex AI 生成式 AI。
- 瞭解 Vertex AI 的 MLOps 功能。
- 探索可與 Vertex AI 互動的介面。