Cloud Dataproc 是一项托管式 Apache Spark 和 Apache Hadoop 服务,借助该服务,您可以充分利用开源数据工具来执行批处理、查询、流式传输和机器学习。Dataproc 自动化功能可帮助您快速创建集群并轻松管理,以及在不需要集群时将其关闭以节省费用。由于在管理上花费的时间和费用更少,您可以将精力集中在作业和数据上。
前往 Dataproc 产品页面以了解详情。
获享 $300 免费赠金开始概念验证
-
使用我们最新的生成式 AI 模型和工具进行开发。
-
免费使用 20 多种热门产品,包括 Compute Engine 和 AI API。
-
不会自动收费,无需承诺。
继续探索 20 多种提供“始终免费”用量的产品。
使用适用于常见应用场景(包括 AI API、虚拟机、数据仓库等)的 20 多种免费产品。
培训
培训和教程
从 Dataproc Jobs API 将 Spark 作业提交到正在运行的 Google Kubernetes Engine 集群。
培训
培训和教程
该课程包含讲座、演示和实操实验来创建 Dataproc 集群、提交 Spark 作业,然后关闭集群。
培训
培训和教程
本课程包含讲座、演示和实操实验,使用在 Dataproc 集群上运行的 Apache Spark 的机器学习库实现逻辑回归,从而针对多变量数据集中的数据开发模型。
使用场景
使用场景
在 Google Cloud 上安排工作流。
使用场景
使用场景
如何将数据从本地 Hadoop 分布式文件系统 (HDFS) 迁移到 Google Cloud。
使用场景
使用场景
向 Dataproc 集群提交 Spark 作业时添加这些依赖项的建议方法。
代码示例
代码示例
从 Python 调用 Dataproc API。
代码示例
代码示例
从 Java 调用 Dataproc API。
代码示例
代码示例
从 Node.js 调用 Dataproc API。
代码示例
代码示例
从 Go 调用 Dataproc API。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-12-05。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-12-05。"],[],[]]