Contas de serviço no Cloud Data Fusion

Esta página descreve como as contas de serviço são usadas no Cloud Data Fusion. Para mais informações, consulte o artigo Use contas de serviço.

Projetos de inquilinos e clientes

O Cloud Data Fusion configura contas de serviço para aceder a recursos nos seguintes projetos:

Projeto de inquilino

O Cloud Data Fusion cria um projeto de inquilino para conter os recursos e os serviços de que precisa para gerir pipelines em seu nome. Por exemplo: executar pipelines nos seus clusters do Dataproc que residem no seu projeto de cliente. Um projeto de inquilino não é exposto, mas quando cria uma instância privada, pode ter de usar o nome do projeto de inquilino para configurar o peering de VPC.

Para mais informações, consulte a documentação da infraestrutura de serviços acerca dos projetos de inquilino.

Projeto de cliente

Cria e é proprietário deste projeto. Por predefinição, o Cloud Data Fusion cria um cluster Dataproc efémero neste projeto para executar os seus pipelines.

O diagrama seguinte mostra uma instância do Cloud Data Fusion em execução num projeto de inquilino e um pipeline em execução num cluster do Dataproc num projeto de cliente.

Implemente o pipeline no Cloud Data Fusion.

Contas de serviço no Cloud Data Fusion

Uma conta de serviço fornece uma identidade para o Cloud Data Fusion, que dá ao Cloud Data Fusion acesso aos seus recursos.

Quando ativa a API Cloud Data Fusion e cria uma instância do Cloud Data Fusion, é adicionada uma conta de serviço ao seu projeto para aceder a recursos como a rede de serviços, o Dataproc, o Cloud Storage, o BigQuery, o Spanner e o Bigtable. Esta conta de serviço chama-se agente do serviço da API Cloud Data Fusion. As funções são concedidas automaticamente a este agente de serviços.

Uma conta de serviço é identificada pelo respetivo endereço de email, que é exclusivo da conta.

Os seguintes tipos de contas de serviço são usados no Cloud Data Fusion. Para mais informações, consulte o artigo Tipos de contas de serviço.

Conta de serviço Descrição
service-CUSTOMER_PROJECT_NUMBER@gcp-sa- datafusion.iam.gserviceaccount.com

O agente de serviço, denominado agente de serviço da API Cloud Data Fusion, que o Cloud Data Fusion cria para obter acesso aos recursos do cliente, de modo a poder agir em nome do cliente. É usado no projeto de inquilino para aceder aos recursos do projeto do cliente. Por exemplo: A pré-visualização é executada na memória em vez de num cluster do Dataproc.

A função de gestão de identidade e de acesso (IAM) do agente de serviço da API Cloud Data Fusion (roles/datafusion.serviceAgent) atribuída à conta de serviço do Cloud Data Fusion por predefinição inclui autorizações adicionais para garantir uma experiência do utilizador ideal. Para melhorar a segurança, pode criar uma função personalizada com um conjunto de autorizações mínimas necessárias para uma tarefa e atribuí-la à conta de serviço do Cloud Data Fusion.

CUSTOMER_PROJECT_NUMBER- compute@developer.gserviceaccount.com A conta de serviço predefinida do Compute Engine que o Cloud Data Fusion cria para implementar tarefas que acedem a outros Google Cloud recursos. Por predefinição, é anexado a uma VM do cluster do Dataproc para permitir que o Cloud Data Fusion aceda aos recursos do Dataproc durante a execução de um pipeline. Na edição Enterprise do Cloud Data Fusion, pode executar pipelines a partir de uma conta de serviço gerida pelo utilizador criando um perfil na consola do Cloud Data Fusion→Administrador do sistema→separador Configuração e adicionando a conta de serviço personalizada. Nas versões 6.2.3 e posteriores, pode escolher uma conta de serviço personalizada para anexar ao cluster do Dataproc quando cria uma instância do Cloud Data Fusion. Para mais informações, consulte o artigo Contas de serviço no Dataproc.

O que se segue?