可自行部署的模型概览

借助 Model Garden,您可以在 Vertex AI 上自行部署和提供开放模型、合作伙伴模型和自定义模型服务。与无服务器且无需手动部署的模型即服务 (MaaS) 产品不同,自行部署的模型在您的 Google Cloud 项目和 VPC 网络中安全运行,让您能够完全控制部署环境。

自行部署开放模型

开放模型为各种 AI 任务提供预训练模型,包括擅长多模态处理的 Gemini 模型。这些模型可免费使用;只要遵守其许可条款,您就可以自由发布其输出内容。Vertex AI 提供开放权重模型和开源模型。

将开放模型与 Vertex AI 搭配使用时,您可以将 Vertex AI 用于基础设施。您还可以将开放模型与其他基础设施产品(例如 PyTorch 或 Jax)搭配使用。

开放权重模型

许多开放模型都被认为是开放权重大语言模型 (LLM)。与非开放权重模型相比,开放权重模型提供了更高的透明度。模型的权重是存储在模型的神经网络架构中的数值,用于表示从训练模型的数据中学习的模式和关系。系统会发布开放权重模型的预训练参数或权重。您可以使用开放权重模型进行推理和调优。诸如原始数据集、模型架构和训练代码等详细信息并不总是提供的。

开源模型

开放模型不同于开源 AI 模型。虽然开放模型通常会公开已学模式的权重和核心数值表示法,但不一定会提供完整的源代码或训练细节。另一方面,开源模型则通常会公开整个代码库,包括训练脚本和数据。提供权重带来了一定程度的 AI 模型透明度,让您无需自行构建模型即可了解模型的功能。

可自行部署的合作伙伴模型

Model Garden 可帮助您购买和管理合作伙伴提供的专有模型许可,这些模型可作为自行部署选项提供。您可以通过 Cloud Marketplace 获取这些模型。获得许可后,您可以选择在按需硬件上进行部署,也可以利用现有的 Compute Engine 预留和承诺使用折扣来管理费用。对于自行部署的合作伙伴模型,您需要同时为模型使用量和耗用的底层 Vertex AI 基础设施付费。

如需申请使用自行部署的合作伙伴模型,请执行以下操作:

  1. 前往 Model Garden 控制台
  2. 找到相关的合作伙伴模型。
  3. 点击启用,然后填写提供的表单,以获取必要的商业用途许可。

如需详细了解如何部署和使用合作伙伴模型,请参阅部署合作伙伴模型并发出预测请求

注意事项

使用自行部署的合作伙伴模型时,请注意以下几点:

  • 权重导出:与某些开放模型不同,您无法导出自行部署的合作伙伴模型的权重。
  • 端点类型:这些部署仅支持共享公共端点类型。

详细了解 Vertex AI 中的自行部署模型