Para executar contêineres do Docker nos nós do cluster do Dataproc, ative o componente opcional do Docker durante a criação do cluster. Este documento explica como instalar e configurar o componente Docker no Dataproc.
Para saber mais sobre outros componentes opcionais disponíveis no Dataproc, consulte Componentes opcionais disponíveis.
Como o componente do Docker funciona
Quando você ativa o componente do Docker do Dataproc, ele instala um daemon do Docker em cada nó do cluster. Ele também configura um usuário e um grupo do Linux, ambos chamados "docker", em cada nó para executar o daemon do Docker. Além disso, o componente
cria um serviço "docker" systemd
para executar o serviço dockerd
(em inglês). Você precisa usar o serviço systemd para gerenciar o ciclo de vida do serviço do Docker.
Instalar o componente
Instale o componente ao criar um cluster do Dataproc. O componente do Docker pode ser instalado em clusters criados com a versão 1.5 ou posterior da imagem do Dataproc.
Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Dataproc.
Comando gcloud
Para criar um cluster do Dataproc que inclua o componente Docker, use o comando gcloud dataproc clusters create cluster-name com a sinalização --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=DOCKER \ --region=region \ --image-version=1.5 \ ... other flags
API REST
Para especificar o componente do Docker por meio da API Dataproc, use o SoftwareConfig.Component como parte de uma solicitação clusters.create.
Console
- Ativar o componente.
- No console do Google Cloud , abra a página Criar um cluster do Dataproc. O painel "Configurar cluster" está selecionado.
- Na seção "Componentes:"
- Em "Componentes opcionais", selecione Docker e outros componentes opcionais para instalar no cluster.
Ativar o Docker no YARN
Consulte Personalizar o ambiente de execução do job do Spark com o Docker no YARN para usar uma imagem do Docker personalizada com o YARN.
Geração de registros do Docker
Por padrão, o componente Docker do Dataproc grava registros no Cloud Logging definindo gcplogs driver. Consulte Como visualizar seus registros.
Registro do Docker
Além disso, ele configura o Docker para usar o Container Registry e os registros padrão do Docker. O Docker usará o auxiliar de credenciais do Docker para fazer a autenticação com o Container Registry.
Usar o componente do Docker em um cluster do Kerberos
É possível instalar o componente opcional do Docker em um cluster que está sendo criado com a segurança do Kerberos ativada.