Managed Service for Apache Spark 可选的 Docker 组件

如需在 Managed Service for Apache Spark 集群节点上运行 Docker 容器,请在创建集群期间启用 Docker 可选组件。本文档介绍了如何在 Managed Service for Apache Spark 上安装和配置 Docker 组件。

如需详细了解 Managed Service for Apache Spark 中其他可用的可选组件,请参阅 可用的可选组件

Docker 组件的工作原理

启用 Managed Service for Apache Spark Docker 组件后,该组件会在每个集群节点上安装一个 Docker 守护程序 。它还会在每个节点上设置一个 Linux 用户和群组(均名为“docker”)来运行 Docker 守护程序。此外,该组件 还会创建“docker” systemd 服务来运行 dockerd 服务。您应使用此 systemd 服务来管理 Docker 服务的生命周期。

安装组件

创建 Managed Service for Apache Spark 集群时,请安装该组件。 可以将 Docker 组件安装在使用 Managed Service for Apache Spark 映像版本 1.5 或更高版本 创建的集群上。

如需查看每个 Managed Service for Apache Spark 映像版本中包含的组件版本,请参阅 支持的 Managed Service for Apache Spark 版本

gcloud 命令

如需创建包含 Docker 组件的 Managed Service for Apache Spark 集群, 请使用带有 gcloud dataproc clusters create cluster-name 命令和 --optional-components 标志。

gcloud dataproc clusters create cluster-name \
    --optional-components=DOCKER \
    --region=region \
    --image-version=1.5 \
    ... other flags

REST API

可以通过 Managed Service for Apache Spark API 使用 SoftwareConfig.Component 将 Docker 组件指定为 clusters.create 请求的一部分。

控制台

  1. 启用组件。
    • 在 Google Cloud 控制台中,打开 Managed Service for Apache Spark 创建集群 页面。选中“设置集群”面板。
    • 在组件部分中执行以下操作:
      • 在可选组件下,选择 Docker 和其他可选组件安装在集群上。

启用 Docker on YARN

如需将自定义的 Docker 映像与 YARN 搭配使用,请参阅使用 Docker on YARN 自定义 Spark 作业运行时环境

Docker 日志记录

默认情况下,Managed Service for Apache Spark Docker 组件通过设置gcplogs driver将日志写入 Cloud Logging,请参阅 查看日志

Docker 注册表

除了默认的 Docker 注册表外,Managed Service for Apache Spark Docker 组件还会将 Docker 配置为使用 Container Registry。 Docker 将使用 Docker 凭据帮助程序向 Container Registry 进行身份验证。

使用 Kerberos 集群上的 Docker 组件

您可以将 Docker 可选组件安装在已启用 Kerberos 安全的情况下所创建的集群上。