了解在线预测
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
Vertex AI 通过 Online Prediction API 在 Google Distributed Cloud (GDC) 气隙环境中提供在线预测。预测结果是经过训练的机器学习模型的输出。具体来说,在线预测是指向模型端点发出的同步请求。
借助在线预测,您可以上传、部署、提供和请求使用一组受支持的容器中的自有预测模型。如果您需要发出请求以响应应用输入,或者在其他需要及时推断的情况下,可以使用在线预测。
您可以将 Kubernetes 自定义资源应用于您的基础设施运维人员 (IO) 为您创建的专用预测集群,从而使用在线预测 API。
在获取在线预测结果之前,您必须导出模型制品并将模型部署到端点。此操作会将计算资源与模型相关联,以便以低延迟方式执行在线预测。
然后,您可以设置格式并发送请求,从而从自定义训练模型获取在线预测结果。
可用容器映像
下表列出了 Distributed Cloud 中在线预测功能支持的容器:
机器学习框架 |
版本 |
支持的加速器 |
支持的图片 |
TensorFlow |
2.14 |
CPU |
tf2-cpu.2-14 |
GPU |
tf2-gpu.2-14 |
PyTorch |
2.4 |
CPU |
pytorch-cpu.2-4 |
GPU |
pytorch-gpu.2-4 |
2.1(已弃用) |
CPU |
pytorch-cpu.2-1 |
GPU |
pytorch-gpu.2-1 |
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-10-22。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-10-22。"],[],[]]