Introdução ao Cloud Data Fusion: console

Esta página apresenta o Cloud Data Fusion: Console, também conhecido como plano de controle. É um conjunto de operações de API e uma interface de console Google Cloud que permite gerenciar uma instância do Cloud Data Fusion. Por exemplo, usando o console, é possível criar, excluir, reiniciar ou atualizar uma instância.

Antes de começar

Visão geral do Cloud Data Fusion: Console

As seções a seguir descrevem aspectos importantes do console.

Instâncias

Uma instância é uma implantação exclusiva do Cloud Data Fusion. Para começar a usar Cloud Data Fusion, crie uma instância no Google Cloud console. É possível criar várias instâncias do Cloud Data Fusion em um único Google Cloud projeto. Você pode especificar uma Google Cloud região para cada instância. Cada instância é uma implantação exclusiva e independente do Cloud Data Fusion, que contém um conjunto de serviços que processam o gerenciamento do ciclo de vida do pipeline, a orquestração, a coordenação e o gerenciamento de metadados. Esses serviços são executados usando recursos de execução longa em um projeto de locatário.

Ao criar a instância, considere as opções a seguir.

Edição

Crie a instância em uma das seguintes edições do Cloud Data Fusion: Developer, Basic ou Enterprise. Escolha a edição com base nos seguintes critérios:

  • Custo
  • Limites de simultaneidade para execução de pipeline
  • Disponibilidade do controle de acesso baseado em papéis (RBAC)

As edições são destinadas aos seguintes casos de uso:

Edição do Cloud Data Fusion Caso de uso
Edição para desenvolvedor Para desenvolvimento, testes ou integrações em pequena escala
Edição Basic Para produção com necessidades moderadas
Edição Enterprise Para pipelines de dados críticos e em grande escala com RBAC

Instância pública ou particular

Dependendo dos seus requisitos, decida se você precisa de uma instância pública ou particular. As principais diferenças entre instâncias particulares e públicas no Cloud Data Fusion são a conectividade de rede e a segurança:

Tipo de instância do Cloud Data Fusion Comportamento
Instância pública
  • Conectividade de rede: usa endereços IP públicos para se conectar à Internet.
  • Acesso aos dados: acessa diretamente as fontes de dados na Internet pública.
Para mais informações, consulte Criar uma instância pública.
Instância particular
  • Conectividade de rede: usa endereços IP particulares em uma rede de nuvem privada virtual (VPC).
  • Acesso aos dados: exige conexões pré-configuradas para acessar fontes de dados. As seguintes conexões são compatíveis:
    • Fontes de dados locais conectadas por VPN ou Cloud Interconnect.
    • Outros Google Cloud serviços executados de forma particular na mesma VPC.

Autorização e conta de serviço

O Cloud Data Fusion normalmente tem duas contas de serviço:

Conta de serviço de tempo de design
Essa conta de serviço gerenciado pelo Google, chamada de agente de serviço da API Data Fusion, é usada no projeto de locatário do Cloud Data Fusion para acessar recursos do projeto do cliente.
Conta de serviço de tempo de execução
Essa é a conta de serviço padrão do Compute Engine que o Cloud Data Fusion cria para implantar jobs que acessam outros Google Cloud recursos. Por padrão, ela é anexada a uma VM de cluster do Managed Service for Apache Spark para permitir que o Cloud Data Fusion acesse recursos do Managed Service for Apache Spark durante uma execução de pipeline.

Para mais informações, consulte Contas de serviço no Cloud Data Fusion.

Geração de registros e monitoramento

O Cloud Logging e o Cloud Monitoring são essenciais para entender a integridade e a performance dos pipelines do Cloud Data Fusion. Você ativa o Logging e o Monitoring somente ao criar a instância do Cloud Data Fusion.

Ao ativar o Logging e o Monitoring, é possível visualizar os registros de pipeline do Cloud Data Fusion no Google Cloud console na página Visualizador de registros.

O Monitoring fornece painéis integrados para o Cloud Data Fusion. Também é possível criar painéis personalizados para monitorar métricas específicas.

Integração de linhagem com o Catálogo de Conhecimento

O Cloud Data Fusion oferece uma integração com o Catálogo de Conhecimento para linhagem. Para mais informações, consulte Visualizar a linhagem no Catálogo de Conhecimento.

Criptografia

As chaves de criptografia gerenciadas pelo cliente (CMEK, na sigla em inglês) permitem a criptografia de dados em repouso com uma chave que pode ser controlada pelo Cloud Key Management Service. A CMEK fornece controle do usuário sobre os dados gravados em Google Cloud recursos internos em projetos de locatário e dados gravados por pipelines do Cloud Data Fusion. Para mais informações, consulte Criptografia de dados gerenciada pelo cliente.

Gerenciar permissões com controle de acesso baseado em papéis (RBAC)

O Cloud Data Fusion permite controlar com Identity and Access Management (IAM, na sigla em inglês).

Para permissões detalhadas de ações realizadas nas operações do Cloud Data Fusion: Studio, use o RBAC. Para mais informações, consulte a visão geral do RBAC.

Upgrades de versão

O Cloud Data Fusion tem versões. É possível fazer upgrade de uma instância para uma versão mais recente no console do Cloud Data Fusion. Para mais informações, consulte Controle de versões no Cloud Data Fusion.

A seguir