可自行部署的模型概览

借助 Model Garden，您可以在 Vertex AI 上自行部署和提供开放模型、合作伙伴模型和自定义模型服务。与无服务器且无需手动部署的模型即服务 (MaaS) 产品不同，自行部署的模型在您的 Google Cloud 项目和 VPC 网络中安全运行，让您能够完全控制部署环境。

自行部署开放模型

开放模型为各种 AI 任务提供预训练模型，包括擅长多模态处理的 Gemma 模型。这些模型可免费使用；只要遵守其许可条款，您就可以自由发布其输出内容。Vertex AI 提供开放权重模型和开源模型。

将开放模型与 Vertex AI 搭配使用时，您可以将 Vertex AI 用于基础设施。您还可以将开放模型与其他基础设施产品（例如 PyTorch 或 Jax）搭配使用。

开放权重模型

许多开放模型都被认为是开放权重大语言模型 (LLM)。与非开放权重模型相比，开放权重模型提供了更高的透明度。模型的权重是存储在模型的神经网络架构中的数值，用于表示从训练模型的数据中学习的模式和关系。系统会发布开放权重模型的预训练参数或权重。您可以使用开放权重模型进行推理和调优。诸如原始数据集、模型架构和训练代码等详细信息并不总是提供的。

开源模型

开放模型不同于开源 AI 模型。虽然开放模型通常会公开已学模式的权重和核心数值表示法，但不一定会提供完整的源代码或训练细节。另一方面，开源模型则通常会公开整个代码库，包括训练脚本和数据。提供权重带来了一定程度的 AI 模型透明度，让您无需自行构建模型即可了解模型的功能。

可自行部署的合作伙伴模型

Model Garden 可帮助您购买和管理合作伙伴提供的专有模型许可，这些模型可作为自行部署选项提供。您可以通过 Cloud Marketplace 获取这些模型。获得许可后，您可以选择在按需硬件上进行部署，也可以利用现有的 Compute Engine 预留和承诺使用折扣来管理费用。对于自行部署的合作伙伴模型，您需要同时为模型使用量和耗用的底层 Vertex AI 基础设施付费。

如需申请使用自行部署的合作伙伴模型，请执行以下操作：

前往 Model Garden 控制台。
找到相关的合作伙伴模型。
点击启用，然后填写提供的表单，以获取必要的商业用途许可。

如需详细了解如何部署和使用合作伙伴模型，请参阅部署合作伙伴模型并发出预测请求。

注意事项

使用自行部署的合作伙伴模型时，请注意以下几点：

权重导出：与某些开放模型不同，您无法导出自行部署的合作伙伴模型的权重。
端点类型：这些部署仅支持共享公共端点类型。

详细了解 Vertex AI 中的自行部署模型

如需详细了解自定义权重，请参阅部署具有自定义权重的模型。
如需详细了解 Model Garden，请参阅 Model Garden 概览。
如需详细了解如何部署模型，请参阅使用 Model Garden 中的模型。
使用 Gemma 开放模型
使用 Llama 开放模型
使用 Hugging Face 开放模型