Componente Docker opcional do Dataproc

Para executar contêineres do Docker nos nós do cluster do Dataproc, ative o componente opcional do Docker durante a criação do cluster. Este documento explica como instalar e configurar o componente Docker no Dataproc.

Para saber mais sobre outros componentes opcionais disponíveis no Dataproc, consulte Componentes opcionais disponíveis.

Como o componente do Docker funciona

Quando você ativa o componente do Docker do Dataproc, ele instala um daemon do Docker em cada nó do cluster. Ele também configura um usuário e um grupo do Linux, ambos chamados "docker", em cada nó para executar o daemon do Docker. Além disso, o componente cria um serviço "docker" systemd para executar o serviço dockerd (em inglês). Você precisa usar o serviço systemd para gerenciar o ciclo de vida do serviço do Docker.

Instalar o componente

Instale o componente ao criar um cluster do Dataproc. O componente do Docker pode ser instalado em clusters criados com a versão 1.5 ou posterior da imagem do Dataproc.

Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.

Comando gcloud

Para criar um cluster do Dataproc que inclua o componente Docker, use o comando gcloud dataproc clusters create cluster-name com a sinalização --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=DOCKER \
    --region=region \
    --image-version=1.5 \
    ... other flags

API REST

Para especificar o componente do Docker por meio da API Dataproc, use o SoftwareConfig.Component como parte de uma solicitação clusters.create.

Console

  1. Ativar o componente.
    • No console do Google Cloud , abra a página Criar um cluster do Dataproc. O painel "Configurar cluster" está selecionado.
    • Na seção "Componentes:"
      • Em "Componentes opcionais", selecione Docker e outros componentes opcionais para instalar no cluster.

Ativar o Docker no YARN

Consulte Personalizar o ambiente de execução do job do Spark com o Docker no YARN para usar uma imagem do Docker personalizada com o YARN.

Geração de registros do Docker

Por padrão, o componente Docker do Dataproc grava registros no Cloud Logging definindo gcplogs driver. Consulte Como visualizar seus registros.

Registro do Docker

Além disso, ele configura o Docker para usar o Container Registry e os registros padrão do Docker. O Docker usará o auxiliar de credenciais do Docker para fazer a autenticação com o Container Registry.

Usar o componente do Docker em um cluster do Kerberos

É possível instalar o componente opcional do Docker em um cluster que está sendo criado com a segurança do Kerberos ativada.