您可以使用代管式数据集提供用于在 Gemini Enterprise Agent Platform 上训练 AutoML 和自定义模型的源数据。代管式数据集对于 AutoML 是必需的,对于自定义训练则是可选的。
权限和访问权限控制
当您使用 Cloud Storage 存储桶中的数据创建数据集时,Agent Platform 需要获得访问相应数据的权限。Agent Platform 使用一种特殊的 Google 代管式服务账号(称为服务代理)来安全地访问您的数据。如需详细了解所需角色以及服务代理的运作方式,请参阅使用 IAM 进行访问权限控制。
为 AutoML 模型创建代管式数据集
您可以使用Google Cloud 控制台或 Agent Platform API 创建托管式数据集,用于训练 AutoML 模型。有关如何执行此操作的说明会因数据类型和模型目标而略有不同。首先准备训练数据。
图片
了解如何为以下类型的图片 AutoML 模型创建代管式数据集:
表格
了解如何为以下类型的表格 AutoML 模型创建代管式数据集:
为自定义训练模型创建代管式数据集
无论您的数据类型或模型目标是什么,有关如何创建用于训练自定义模型的代管式数据集的说明都是相同的。
如需了解详情,请参阅使用代管式数据集。
使用 Knowledge Catalog 查看托管式数据集
Knowledge Catalog 是一项可伸缩的全代管式式元数据管理服务,可以在一个集中的位置跨项目和区域搜索数据集。它与 Gemini Enterprise Agent Platform 集成,并提供与已弃用的 Data Catalog 类似的功能。
您可以使用 Knowledge Catalog 通过切面(类似于 Data Catalog 标记)来发现、了解和丰富数据。
如需详细了解如何管理 Agent Platform 资源的元数据和切面,请参阅Knowledge Catalog中的管理切面并丰富元数据。