Vertex AI 總覽

Vertex AI 是整合式開放平台，可用於建構、部署及擴展生成式 AI 和機器學習 (ML) 模型，以及 AI 應用程式。這個平台提供 Model Garden 的存取權，其中包含超過 200 個精選模型，包括 Google 的基礎模型 (例如 Gemini) 和合作夥伴與開放模型的完整選擇，以及底層的 TPU/GPU 基礎架構。Vertex AI 支援最先進的生成式 AI 工作流程，以及 MLOps 的 AI 推論工作流程。提供端對端 MLOps 工具，以及企業級控管功能，可確保治理、安全性和法規遵循。

Vertex AI 的主要功能

Vertex AI 包含支援生成式 AI 的工具和服務，以及 AI 推論和機器學習工作流程。

生成式 AI 功能

Vertex AI 整合了全套工具，以及 Google 的進階基礎模型工具，可供您建構可用於正式環境的生成式 AI 代理程式和應用程式，如下所示：

提示：在 Vertex AI Studio 中開始設計提示。 Vertex AI Studio 內含提示設計和模型管理工具，可用於設計原型、建構及部署生成式 AI 應用程式。
模型：Vertex AI Model Garden 是集中式中樞，內含超過 200 個企業級模型，包括 Google 模型、頂尖第三方合作夥伴 (例如 Anthropic 的 Claude) 模型，以及熱門的開放原始碼選項 (例如 Llama)。

這項模型選擇包括：
- Google 的基礎生成式 AI 模型：
  - Gemini：提供多模態功能，可處理文字、圖片、影片和音訊；並提供模型思考功能，例如 Gemini 3 Flash 和 Gemini 3 Pro (搭配 Nano Banana)。
  - Vertex AI 中的 Imagen：生成及編輯圖片。
  - Vertex AI 的 Veo：根據文字和圖片生成影片。
- 合作夥伴和開放原始碼模型：精選頂尖模型，例如 Anthropic 的 Claude、Mistral AI 模型和 Llama，提供卓越的成本效益。這些模型以全代管的模型即服務 (MaaS) API 提供。
模型自訂：根據貴商家調整模型，建立獨特的 AI 資源。從以企業資料或 Google 搜尋建立基準來減少幻覺，到使用 Vertex AI Training 對 Gemini 等模型進行監督式微調 (SFT) 或參數效率微調 (PEFT)，應有盡有。如要進一步瞭解模型自訂功能，請參閱微調簡介。
生成式 AI 評估：使用 Gen AI Evaluation Service 客觀評估及比較模型和代理程式的成效。部署執行階段防禦功能 (例如 Model Armor)，主動檢查並防範提示詞注入和資料竊取等新興威脅，確保安全和法規遵循。
代理建構工具：Vertex AI Agent Builder 是全方位代理轉換系統，可協助您建立、管理及部署 AI 代理。使用開放原始碼的 Agent Development Kit (ADK) 建構及協調代理，然後將代理部署至代管的無伺服器 Vertex AI Agent Engine，以便在正式環境中大規模使用。每個代理程式都會獲派代理程式身分 (Identity and Access Management 主體)，確保安全並提供清楚的稽核追蹤記錄。
存取外部資訊：透過基礎連結至可靠來源、使用函式呼叫與外部 API 互動，以及透過 RAG 從知識庫擷取資訊，提升模型回覆品質。
負責任的 AI 技術和安全：使用內建安全功能封鎖有害內容，確保以負責任的方式使用 AI。

如要進一步瞭解 Vertex AI 的生成式 AI，請參閱 Vertex AI 的生成式 AI 說明文件。

AI 推論功能

Vertex AI 提供對應機器學習工作流程各階段的工具和服務：

資料準備：收集、清理及轉換資料。
- 使用 Vertex AI Workbench 筆記本執行探索性資料分析 (EDA)。
- 與 Cloud Storage 和 BigQuery 整合，存取資料。
- 使用 Dataproc Serverless Spark 大規模處理資料。
模型訓練：訓練機器學習模型。
- 選擇「AutoML」AutoML即可免除程式碼訓練，選擇「自訂訓練」則可全權控管。
- 使用 Vertex AI Experiments 管理及比較訓練執行作業。
- 在 Vertex AI Model Registry 中註冊訓練好的模型。
- Vertex AI Training 提供無伺服器訓練和訓練叢集。
  - 使用 Vertex AI 無伺服器訓練，在全代管環境中依需求執行自訂訓練程式碼。請參閱 [Vertex AI 無伺服器訓練總覽][serverless]。
  - 對於需要專屬預留加速器叢集保證容量的大型工作，請使用 Vertex AI 訓練叢集。請參閱 Vertex AI 訓練叢集總覽。
- 在受管理互動式叢集上，使用開放原始碼 Ray 架構，透過 Ray on Vertex AI 擴展 Python 和機器學習工作負載。請參閱「Ray on Vertex AI 簡介」。
- 使用 Vertex AI Vizier 調整複雜機器學習模型中的模型超參數。
模型評估和疊代：評估及提升模型效能。
- 使用模型評估指標比較模型。
- 將評估作業整合至 Vertex AI Pipelines 工作流程。
模型服務：部署模型並從中取得推論結果。
- 使用預先建構或自訂容器，部署以進行線上推論。
- 對大型資料集執行批次推論。
- 使用最佳化的 TensorFlow 執行階段，有效提供 TensorFlow 服務。
- 使用 Vertex Explainable AI 瞭解模型推論。
- 從 Vertex AI 特徵儲存庫提供特徵。
- 部署使用 BigQuery ML 訓練的模型。
模型監控：追蹤已部署模型的長期成效。
- 使用 Vertex AI Model Monitoring 偵測訓練/應用偏差和推論偏移。

機器學習工作流程示意圖

機器學習運作工具

自動化處理、管理及監控機器學習專案：

Vertex AI Pipelines：自動調度管理及自動執行機器學習工作流程，並將其做為可重複使用的管道。
Vertex AI Model Registry：管理機器學習模型的生命週期，包括版本控管和部署。
Vertex AI 無伺服器訓練：在全代管環境中，視需要執行自訂訓練程式碼
Vertex AI Model Monitoring：監控已部署的模型，偵測資料偏差和偏移情形，以維持效能。
Vertex AI Experiments：追蹤及分析不同的模型架構和超參數。
Vertex AI 特徵儲存庫：管理及提供特徵資料，用於訓練模型或進行即時預測。
Vertex 機器學習中繼資料：追蹤及管理機器學習構件的中繼資料。
Vertex AI 訓練叢集：在專屬的預留加速器叢集上，訓練需要保證容量的大型工作。
Vertex AI 上的 Ray：在受管理互動式叢集上，使用開放原始碼的 Ray 架構，調度 Python 和 ML 工作負載的資源。

Vertex AI 總覽 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

Vertex AI 的主要功能

生成式 AI 功能

AI 推論功能

機器學習運作工具

後續步驟

Vertex AI 總覽