借助 Model Garden,您可以在 Vertex AI 上自行部署和提供开放模型、合作伙伴模型和自定义模型服务。与无服务器且无需手动部署的模型即服务 (MaaS) 产品不同,自行部署的模型在您的 Google Cloud 项目和 VPC 网络中安全运行,让您能够完全控制部署环境。
自行部署开放模型
开放模型为各种 AI 任务提供预训练模型,包括擅长多模态处理的 Gemini 模型。这些模型可免费使用;只要遵守其许可条款,您就可以自由发布其输出内容。Vertex AI 提供开放权重模型和开源模型。
将开放模型与 Vertex AI 搭配使用时,您可以将 Vertex AI 用于基础设施。您还可以将开放模型与其他基础设施产品(例如 PyTorch 或 Jax)搭配使用。
开放权重模型
许多开放模型都被认为是开放权重大语言模型 (LLM)。与非开放权重模型相比,开放权重模型提供了更高的透明度。模型的权重是存储在模型的神经网络架构中的数值,用于表示从训练模型的数据中学习的模式和关系。系统会发布开放权重模型的预训练参数或权重。您可以使用开放权重模型进行推理和调优。诸如原始数据集、模型架构和训练代码等详细信息并不总是提供的。
开源模型
开放模型不同于开源 AI 模型。虽然开放模型通常会公开已学模式的权重和核心数值表示法,但不一定会提供完整的源代码或训练细节。另一方面,开源模型则通常会公开整个代码库,包括训练脚本和数据。提供权重带来了一定程度的 AI 模型透明度,让您无需自行构建模型即可了解模型的功能。
可自行部署的合作伙伴模型
Model Garden 可帮助您购买和管理合作伙伴提供的专有模型许可,这些模型可作为自行部署选项提供。您可以通过 Cloud Marketplace 获取这些模型。获得许可后,您可以选择在按需硬件上进行部署,也可以利用现有的 Compute Engine 预留和承诺使用折扣来管理费用。对于自行部署的合作伙伴模型,您需要同时为模型使用量和耗用的底层 Vertex AI 基础设施付费。
如需申请使用自行部署的合作伙伴模型,请执行以下操作:
- 前往 Model Garden 控制台。
- 找到相关的合作伙伴模型。
- 点击启用,然后填写提供的表单,以获取必要的商业用途许可。
如需详细了解如何部署和使用合作伙伴模型,请参阅部署合作伙伴模型并发出预测请求。
注意事项
使用自行部署的合作伙伴模型时,请注意以下几点:
- 权重导出:与某些开放模型不同,您无法导出自行部署的合作伙伴模型的权重。
- 端点类型:这些部署仅支持共享公共端点类型。
详细了解 Vertex AI 中的自行部署模型
- 如需详细了解自定义权重,请参阅部署具有自定义权重的模型。
- 如需详细了解 Model Garden,请参阅 Model Garden 概览。
- 如需详细了解如何部署模型,请参阅使用 Model Garden 中的模型。
- 使用 Gemma 开放模型
- 使用 Llama 开放模型
- 使用 Hugging Face 开放模型