本文档介绍了人工智能 (AI) 和机器学习 (ML) 工作负载中的存储服务用例和建议。
存储空间使用场景
存储服务可用于以下 AI 和机器学习工作负载:
- 准备和加载数据以用于训练
- 加载模型权重以进行推理
- 保存和恢复模型检查点
- 加载虚拟机映像
- Logging 数据
- 主目录
- 加载应用库、软件包和依赖项
存储建议
建议使用以下存储解决方案来优化 AI 和 ML 系统性能:
| 存储服务 | 功能 | 使用场景 |
|---|---|---|
| Cloud Storage |
概览:高度可伸缩、高度耐用且经济实惠的对象存储。它非常适合存储训练所需的大量数据集和模型检查点,以及托管最终训练好的模型。Cloud Storage 与 Cloud Storage FUSE 搭配使用是大多数 AI 和 ML 使用情形下的推荐存储解决方案,因为与文件系统服务相比,它能以更高的成本效益扩展数据存储空间。
|
建议用于以下方面:
不建议用于以下方面:
|
| Google Cloud Managed Lustre |
概览:一种高性能、全代管式并行文件系统,可针对 AI 和高性能计算 (HPC) 应用进行优化。 适用于需要多个计算节点快速且一致地访问共享数据以进行模拟、建模和分析的环境。
|
建议用于以下方面:
不建议用于以下方面:
|
后续步骤
- 如需详细了解适用于 AI 和机器学习工作负载(包括训练、检查点和部署)的存储选项,请参阅为 Google Cloud中的 AI 和机器学习工作负载设计存储。