本教程介绍如何使用 Gemini Enterprise Agent Platform Pipelines 运行端到端机器学习工作流,包括以下任务:
- 导入和转换数据。
- 使用转换后的数据微调 TFHub 中的图片分类模型。
- 将经过训练的模型导入 Gemini Enterprise Agent Platform Model Registry。
- 可选:使用 Vertex AI Inference 部署模型以进行在线传送。
准备工作
确保您已完成设置项目中的步骤 1-3。
创建一个独立的 Python 环境并安装 Agent Platform SDK for Python。
安装 Kubeflow Pipelines SDK:
python3 -m pip install "kfp<2.0.0" "google-cloud-aiplatform>=1.16.0" --upgrade --quiet
运行机器学习模型训练流水线
示例代码会执行以下操作:
- 从组件代码库加载组件,以用作流水线基本组件。
- 创建组件任务并使用参数在任务之间传递数据,从而构建流水线。
- 提交流水线以在 Gemini Enterprise Agent Platform Pipelines 上执行。 请参阅 Gemini Enterprise Agent Platform Pipelines 价格。
将以下示例代码复制到开发环境中并运行代码。
图片分类
关于提供的示例代码,请注意以下几点:
- Kubeflow 流水线定义为 Python 函数。
- 流水线的工作流步骤是使用 Kubeflow 流水线组件创建的。通过使用组件的输出作为另一个组件的输入,您可以将流水线的工作流定义为图。例如,
preprocess_image_data_op组件任务依赖于transcode_imagedataset_tfrecord_from_csv_op组件任务中的tfrecord_image_data_path输出。 - 您可以使用 Agent Platform SDK for Python 在 Gemini Enterprise Agent Platform Pipelines 上创建流水线运行。
监控流水线
在 Google Cloud 控制台的“Agent Platform”部分中,前往流水线页面并打开运行标签页。
后续步骤
- 如需详细了解 Gemini Enterprise Agent Platform Pipelines,请参阅 Gemini Enterprise Agent Platform Pipelines 简介。