Vertex AI 概览

Vertex AI 是一个统一的开放平台,用于构建、部署和扩缩生成式 AI 和机器学习 (ML) 模型以及 AI 应用。它可让您访问 Model Garden,其中包含 200 多个精选模型,包括 Google 的基础模型(例如 Gemini)以及各种合作伙伴模型和开放模型,还有底层 TPU/GPU 基础设施。Vertex AI 不仅支持先进的生成式 AI 工作流,还支持 MLOps 的 AI 推理工作流。它提供端到端的 MLOps 工具和企业级控制功能,以实现治理、安全和合规性。

Vertex AI 的主要功能

Vertex AI 包含支持生成式 AI 以及 AI 推理和机器学习工作流的工具和服务。

生成式 AI 功能

Vertex AI 将全面的工具集与 Google 先进的基础模型工具相结合,可用于构建适用于生产环境的生成式 AI 代理和应用,如下所示:

  • 提示:首先在 Vertex AI Studio 中进行提示设计。 Vertex AI Studio 包含用于提示设计和模型管理的工具,您可以使用这些工具来设计原型、构建和部署生成式 AI 应用。

  • 模型:Vertex AI Model Garden 是一个集中式枢纽,其中包含 200 多个企业就绪型模型,这些模型来自 Google、领先的第三方合作伙伴(例如 Anthropic 的 Claude)和热门的开源选项(例如 Llama)。

    所选模型包括:

    • Google 的基础生成式 AI 模型

      • Gemini:支持文本、图片、视频和音频的多模态功能;以及模型思维能力,例如 Gemini 3 Flash 和 Gemini 3 Pro(搭配 Nano Banana)。
      • Imagen on Vertex AI:生成和修改图片。
      • Veo on Vertex AI:根据文本和图片生成视频。
    • 合作伙伴模型和开源模型:精选了 Anthropic 的 Claude、Mistral AI 模型和 Llama 等领先模型,具有出色的性价比。这些模型以全托管式模型即服务 (MaaS) API 的形式提供。

  • 模型自定义:根据您的业务量身定制模型,打造独特的 AI 资产。这包括以企业数据或 Google 搜索为基础来减少幻觉,以及使用 Vertex AI Training 对 Gemini 等模型进行监督式微调 (SFT) 或参数高效微调 (PEFT)。如需详细了解模型自定义,请参阅调优简介

  • 生成式 AI 评估:借助 Vertex AI GenAI Evaluation 功能,客观地评估和比较模型及代理的性能。 部署 Model Armor 等运行时防御功能,主动检查并防范提示注入和数据渗漏等新兴威胁,确保安全性和合规性。

  • 代理构建器:Vertex AI Agent Builder 是一种全栈代理转换系统,可帮助您创建、管理和部署 AI 代理。使用开源智能体开发套件 (ADK) 构建和编排代理,然后将它们部署到托管式无服务器 Vertex AI Agent Engine,以便在生产环境中大规模使用。每个代理都会分配一个代理身份(Identity and Access Management 主账号),以确保安全性和清晰的审核轨迹。

  • 访问外部信息:通过以下方式增强模型回答:利用接地连接到可靠的来源,使用函数调用与外部 API 互动,以及使用 RAG 从知识库中检索信息。

  • Responsible AI 和安全:使用内置的安全功能来屏蔽有害内容,确保符合 Responsible AI 用法。

如需详细了解 Vertex AI 上的生成式 AI,请参阅 Vertex AI 上的生成式 AI 文档

AI 推理功能

Vertex AI 提供的工具和服务可对应于机器学习工作流的每个阶段:

  1. 数据准备:收集、清理和转换数据。

  2. 模型训练:训练机器学习模型。

    • 您可以选择 AutoML 进行无代码训练,也可以选择自定义训练来完全掌控训练过程。
    • 使用 Vertex AI Experiments 管理和比较训练。
    • Vertex AI Model Registry 中注册经过训练的模型。
    • Vertex AI Training 提供无服务器训练和训练集群。
      • 使用 Vertex AI 无服务器训练在全托管式环境中按需运行自定义训练代码。请参阅 [Vertex AI 无服务器训练概览][无服务器]。
      • 对于需要在专用预留加速器集群上确保容量的大型作业,请使用 Vertex AI 训练集群。请参阅 Vertex AI 训练集群概览
    • 使用 Ray on Vertex AI,通过托管式交互集群中的开源 Ray 框架扩缩 Python 和机器学习工作负载。请参阅 Ray on Vertex AI 概览
    • 使用 Vertex AI Vizier 调整复杂机器学习模型中的模型超参数。
  3. 模型评估和迭代:评估和提升模型性能。

  4. 模型部署:部署模型并获取推理结果。

  5. 模型监控:跟踪已部署模型随时间变化的性能。

机器学习工作流示意图

MLOps 工具

自动执行、管理和监控机器学习项目:

后续步骤