Criar uma transmissão usando o fluxo automatizado

Nesta página, descrevemos como criar um stream usando o fluxo de configuração automatizada.

A configuração de stream automatizada simplifica o processo de movimentação de dados dos bancos de dados gerenciados do Cloud SQL para PostgreSQL para o BigQuery, reduzindo o número de etapas necessárias. Com esse fluxo, é possível criar um fluxo diretamente na página de visão geral da instância do Cloud SQL para PostgreSQL. O Datastream automatiza a proteção da conexão VPC entre o stream e o banco de dados de origem, criando configurações de banco de dados e recursos de conexão de stream.

Antes de começar

  1. Ative as APIs Datastream, Conectividade de rede e Compute Engine.
  2. Verifique se você tem as permissões necessárias do Identity and Access Management (IAM) para criar e gerenciar recursos do Datastream. Consulte a seção a seguir para mais detalhes.
  3. Crie e configure um banco de dados de origem do Cloud SQL para PostgreSQL para replicação. Para mais informações, consulte Configurar um banco de dados do Cloud SQL para PostgreSQL para CDC.
  4. Recomendamos que você ative a replicação lógica para sua instância antes de criar o fluxo. Se você não ativar a replicação lógica, o Datastream fará isso por você, o que reinicia a instância de origem.

    Para informações sobre como ativar a replicação lógica em uma instância do Cloud SQL para PostgreSQL, consulte Configurar um banco de dados do Cloud SQL para PostgreSQL para CDC.

  5. Verifique se o banco de dados de origem está configurado para usar o acesso a serviços particulares.

Permissões necessárias

Para usar o fluxo automatizado de criação de stream, você precisa das seguintes permissões ou papéis do Identity and Access Management (IAM):

  • serviceusage.services.enable, compute.networkAdmin para ativar as APIs necessárias e realizar tarefas de configuração de rede.
  • cloudsql.admin para tarefas de configuração de instâncias.
  • datastream.admin para tarefas de administração que o Datastream realiza em seu nome.

O usuário administrador do banco de dados também precisa de permissões GRANT para o esquema que você quer replicar. Conecte-se ao banco de dados de origem e execute o seguinte:

  GRANT cloudsqlsuperuser TO "USER_NAME";
  ALTER ROLE "USER_NAME" CREATEROLE;
  GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to "USER_NAME" WITH GRANT OPTION;
  ALTER DEFAULT PRIVILEGES
  IN SCHEMA "SCHEMA_NAME"
  GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
  

Criar e iniciar o stream

Para criar e iniciar uma transmissão, siga estas etapas:

Console

Primeiros passos

  1. Acesse a página de visão geral da instância do banco de dados de origem do Cloud SQL para PostgreSQL.

    Acesse "Instâncias do Cloud SQL"

  2. Na seção Fazer streaming de dados para o BigQuery, clique em Criar stream.

  3. Na página Começar, informe o nome do stream no campo Nome do stream. Um identificador exclusivo é preenchido automaticamente.

  4. Na seção Forneça os detalhes da conta de usuário da instância, selecione o método de autenticação:

    • Autenticação de banco de dados do IAM: essa opção está disponível se o usuário tiver a identidade principal do Identity and Access Management (IAM) atribuída. Para mais informações, consulte Principais do IAM. Se você selecionar essa opção, precisará conceder manualmente a função cloudsqlsuperuser e a permissão CREATEROLE ao usuário:

      1. No Google Cloud console, acesse a página Instâncias do Cloud SQL.

      Acesse "Instâncias do Cloud SQL"

      1. Selecione a instância do Cloud SQL.
      2. No menu de navegação, clique em Cloud SQL Studio e faça login.
      3. No painel Explorer, execute a seguinte consulta para seu usuário:
    GRANT cloudsqlsuperuser TO "USER_NAME";
    ALTER ROLE "USER_NAME" CREATEROLE;
    • Autenticação de banco de dados integrada: forneça o nome de usuário e a senha de um usuário com a função cloudsqlsuperuser. Se você selecionar essa opção, verifique se o usuário tem permissões GRANT nas tabelas que quer replicar.
  5. Revise outros detalhes do stream, como região, criptografia e rótulos. Expanda a seção Detalhes adicionais do stream para aplicar as mudanças, se necessário.

  6. Clique em Continuar.

Configurar origem

  1. Na página Configurar origem do fluxo, selecione o banco de dados de que você quer replicar os dados.
  2. A lista Objetos a serem incluídos seleciona todos os objetos disponíveis por padrão. Os objetos na lista são aqueles para os quais você tem as permissões necessárias para fazer streaming. Para mudar os objetos selecionados, modifique as seleções na lista.
  3. Revise as configurações avançadas de stream, como o modo de preenchimento e o número máximo de conexões simultâneas de preenchimento. Expanda a seção Configurações avançadas de transmissão para aplicar mudanças, se necessário.
  4. Clique em Continuar.

Configurar destino

  1. Na página Configurar destino, ajuste as configurações de destino do BigQuery, se necessário. Para mais informações, consulte Configurar informações sobre o destino do stream.

Criar e iniciar o stream

  1. Clique em Criar e iniciar depois para criar e iniciar o stream mais tarde no Datastream ou em Iniciar para criar e iniciar o stream imediatamente.

  2. Você recebe notificações sobre as tarefas realizadas automaticamente para você:

    • O Datastream cria os recursos necessários da nuvem privada virtual, como intervalo de endereços IP internos, sub-rede e anexo de rede.
    • O Datastream configura tabelas para CDC, slots de replicação, uma publicação para todas as tabelas no banco de dados e cria um usuário dedicado do Datastream.
    • O Datastream cria uma configuração de conectividade privada e perfis de conexão de origem e destino.
  3. Confirme que você quer criar ou criar e iniciar a transmissão.

Monitorar o stream

É possível monitorar os detalhes básicos do fluxo na página de visão geral da instância de origem no console Google Cloud . A página mostra informações como status do stream, nome do stream, conjunto de dados de destino do BigQuery e identificador do projeto de destino.

Na página de visão geral, também é possível realizar ações como iniciar, parar ou pausar o stream. Para informações de monitoramento mais detalhadas, clique no nome do fluxo para navegar até o Datastream.

Excluir o stream

Quando você exclui um fluxo criado usando o fluxo automatizado, alguns recursos, como o slot de replicação do PostgreSQL, são excluídos automaticamente. No entanto, há recursos que precisam ser excluídos manualmente:

  • A publicação. A publicação é criada usando o usuário administrador do banco de dados e só pode ser excluída pelo proprietário, ou seja, por padrão, o usuário que a criou.
  • O usuário leitor do Datastream.
  • Os perfis de conexão de origem e destino do Datastream
  • Os recursos de conectividade particular.
  • Todos os recursos de rede criados durante o fluxo automatizado, como a sub-rede e a conexão de rede.

A seguir