Esta página apresenta o Cloud Data Fusion: Console, também conhecido como plano de controle. É um conjunto de operações de API e uma interface de console Google Cloud que permite gerenciar uma instância do Cloud Data Fusion. Por exemplo, usando o console, é possível criar, excluir, reiniciar ou atualizar uma instância.
Antes de começar
- Ative a API Data Fusion.
- Entenda os custos das edições do Cloud Data Fusion.
- Entenda o controle de acesso e as contas de serviço em Cloud Data Fusion.
Visão geral do Cloud Data Fusion: Console
As seções a seguir descrevem aspectos importantes do console.
Instâncias
Uma instância é uma implantação exclusiva do Cloud Data Fusion. Para começar a usar Cloud Data Fusion, crie uma instância no Google Cloud console. É possível criar várias instâncias do Cloud Data Fusion em um único Google Cloud projeto. Você pode especificar uma Google Cloud região para cada instância. Cada instância é uma implantação exclusiva e independente do Cloud Data Fusion, que contém um conjunto de serviços que processam o gerenciamento do ciclo de vida do pipeline, a orquestração, a coordenação e o gerenciamento de metadados. Esses serviços são executados usando recursos de execução longa em um projeto de locatário.
Ao criar a instância, considere as opções a seguir.
Edição
Crie a instância em uma das seguintes edições do Cloud Data Fusion: Developer, Basic ou Enterprise. Escolha a edição com base nos seguintes critérios:
- Custo
- Limites de simultaneidade para execução de pipeline
- Disponibilidade do controle de acesso baseado em papéis (RBAC)
As edições são destinadas aos seguintes casos de uso:
| Edição do Cloud Data Fusion | Caso de uso |
|---|---|
| Edição para desenvolvedor | Para desenvolvimento, testes ou integrações em pequena escala |
| Edição Basic | Para produção com necessidades moderadas |
| Edição Enterprise | Para pipelines de dados críticos e em grande escala com RBAC |
Instância pública ou particular
Dependendo dos seus requisitos, decida se você precisa de uma instância pública ou particular. As principais diferenças entre instâncias particulares e públicas no Cloud Data Fusion são a conectividade de rede e a segurança:
| Tipo de instância do Cloud Data Fusion | Comportamento |
|---|---|
| Instância pública |
|
| Instância particular |
|
Autorização e conta de serviço
O Cloud Data Fusion normalmente tem duas contas de serviço:
- Conta de serviço de tempo de design
- Essa conta de serviço gerenciado pelo Google, chamada de agente de serviço da API Data Fusion, é usada no projeto de locatário do Cloud Data Fusion para acessar recursos do projeto do cliente.
- Conta de serviço de tempo de execução
- Essa é a conta de serviço padrão do Compute Engine que o Cloud Data Fusion cria para implantar jobs que acessam outros Google Cloud recursos. Por padrão, ela é anexada a uma VM de cluster do Managed Service for Apache Spark para permitir que o Cloud Data Fusion acesse recursos do Managed Service for Apache Spark durante uma execução de pipeline.
Para mais informações, consulte Contas de serviço no Cloud Data Fusion.
Geração de registros e monitoramento
O Cloud Logging e o Cloud Monitoring são essenciais para entender a integridade e a performance dos pipelines do Cloud Data Fusion. Você ativa o Logging e o Monitoring somente ao criar a instância do Cloud Data Fusion.
Ao ativar o Logging e o Monitoring, é possível visualizar os registros de pipeline do Cloud Data Fusion no Google Cloud console na página Visualizador de registros.
O Monitoring fornece painéis integrados para o Cloud Data Fusion. Também é possível criar painéis personalizados para monitorar métricas específicas.
Integração de linhagem com o Catálogo de Conhecimento
O Cloud Data Fusion oferece uma integração com o Catálogo de Conhecimento para linhagem. Para mais informações, consulte Visualizar a linhagem no Catálogo de Conhecimento.
Criptografia
As chaves de criptografia gerenciadas pelo cliente (CMEK, na sigla em inglês) permitem a criptografia de dados em repouso com uma chave que pode ser controlada pelo Cloud Key Management Service. A CMEK fornece controle do usuário sobre os dados gravados em Google Cloud recursos internos em projetos de locatário e dados gravados por pipelines do Cloud Data Fusion. Para mais informações, consulte Criptografia de dados gerenciada pelo cliente.
Gerenciar permissões com controle de acesso baseado em papéis (RBAC)
O Cloud Data Fusion permite controlar com Identity and Access Management (IAM, na sigla em inglês).
Para permissões detalhadas de ações realizadas nas operações do Cloud Data Fusion: Studio, use o RBAC. Para mais informações, consulte a visão geral do RBAC.
Upgrades de versão
O Cloud Data Fusion tem versões. É possível fazer upgrade de uma instância para uma versão mais recente no console do Cloud Data Fusion. Para mais informações, consulte Controle de versões no Cloud Data Fusion.
A seguir
- Saiba mais sobre o Cloud Data Fusion: Studio.