Criar uma transmissão usando o fluxo automatizado

Nesta página, descrevemos como criar um stream usando o fluxo de configuração automatizada.

A configuração automatizada de stream simplifica o processo de movimentação de dados do Cloud SQL para bancos de dados gerenciados do PostgreSQL para o BigQuery, reduzindo o número de etapas necessárias. Com esse fluxo, é possível criar um fluxo diretamente na página de visão geral da instância do Cloud SQL para PostgreSQL. O Datastream automatiza a proteção da conexão VPC entre o stream e o banco de dados de origem, criando configurações de banco de dados e recursos de conexão de stream.

Antes de começar

  1. Ative as APIs Datastream, Conectividade de rede e Compute Engine.
  2. Verifique se você tem as permissões necessárias do Identity and Access Management (IAM) para criar e gerenciar recursos do Datastream. Consulte a seção a seguir para mais detalhes.
  3. Crie e configure um banco de dados de origem do Cloud SQL para PostgreSQL para replicação. Para mais informações, consulte Configurar um banco de dados do Cloud SQL para PostgreSQL para CDC.
  4. Recomendamos que você ative a replicação lógica para sua instância antes de criar o fluxo. Se você não ativar a replicação lógica, o Datastream fará isso por você, o que reinicia a instância de origem.

    Para informações sobre como ativar a replicação lógica em uma instância do Cloud SQL para PostgreSQL, consulte Configurar um banco de dados do Cloud SQL para PostgreSQL para CDC.

  5. Verifique se o banco de dados de origem está configurado para usar o acesso a serviços particulares.

Permissões necessárias

Para usar o fluxo de criação automática de stream, você precisa das seguintes permissões ou papéis do Identity and Access Management (IAM):

  • serviceusage.services.enable, compute.networkAdmin para ativar as APIs necessárias e realizar tarefas de configuração de rede.
  • cloudsql.admin para tarefas de configuração de instâncias.
  • datastream.admin para tarefas de administração que o Datastream realiza em seu nome.

O usuário administrador do banco de dados também precisa de permissões GRANT para o esquema que você quer replicar. Conecte-se ao banco de dados de origem e execute o seguinte:

  GRANT cloudsqlsuperuser TO "USER_NAME";
  ALTER ROLE "USER_NAME" CREATEROLE;
  GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to "USER_NAME" WITH GRANT OPTION;
  ALTER DEFAULT PRIVILEGES
  IN SCHEMA "SCHEMA_NAME"
  GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
  

Tabelas futuras

As tabelas futuras são adicionadas automaticamente ao stream somente se forem criadas pelo usuário cujos detalhes da conta você fornece para autenticação durante o fluxo automatizado. Se uma tabela futura for criada por outro usuário, ele precisará conceder explicitamente a permissão SELECT ao usuário leitor do Datastream na tabela.

Criar e iniciar o stream

Para criar e iniciar uma transmissão, siga estas etapas:

Console

Primeiros passos

  1. Acesse a página de visão geral da instância do banco de dados de origem do Cloud SQL para PostgreSQL.

    Acesse "Instâncias do Cloud SQL"

  2. Na seção Fazer streaming de dados para o BigQuery, clique em Criar stream.

  3. Na página Começar, informe o nome do stream no campo Nome do stream. Um identificador exclusivo é preenchido automaticamente.

  4. Na seção Forneça os detalhes da conta de usuário da instância, selecione o método de autenticação:

    • Autenticação de banco de dados do IAM: essa opção está disponível se o usuário tiver a identidade principal do Identity and Access Management (IAM) atribuída. Para mais informações, consulte Principais do IAM. Se você selecionar essa opção, conceda manualmente a função cloudsqlsuperuser e a permissão CREATEROLE ao usuário:

      1. No Google Cloud console, acesse a página Instâncias do Cloud SQL.

      Acesse "Instâncias do Cloud SQL"

      1. Selecione a instância do Cloud SQL.
      2. No menu de navegação, clique em Cloud SQL Studio e faça login.
      3. No painel Explorer, execute a seguinte consulta para seu usuário:
    GRANT cloudsqlsuperuser TO "USER_NAME";
    ALTER ROLE "USER_NAME" CREATEROLE;
    • Autenticação de banco de dados integrada: forneça o nome de usuário e a senha de um usuário com a função cloudsqlsuperuser. Se você selecionar essa opção, verifique se o usuário tem permissões GRANT nas tabelas que quer replicar.
  5. Revise outros detalhes da transmissão, como região, criptografia e rótulos. Expanda a seção Detalhes adicionais do stream para aplicar as mudanças, se necessário.

  6. Clique em Continuar.

Configurar origem

  1. Na página Configurar origem do fluxo, selecione o banco de dados de que você quer replicar os dados.
  2. A lista Objetos a serem incluídos seleciona todos os objetos disponíveis por padrão. Os objetos na lista são aqueles para os quais você tem as permissões necessárias para fazer streaming. Para mudar os objetos selecionados, modifique as seleções na lista.
  3. Revise as configurações avançadas de stream, como o modo de preenchimento e o número máximo de conexões de preenchimento simultâneas. Expanda a seção Configurações avançadas de stream para aplicar mudanças, se necessário.
  4. Clique em Continuar.

Configurar destino

  1. Na página Configurar destino, ajuste as configurações de destino do BigQuery, se necessário. Para mais informações, consulte Configurar informações sobre o destino do stream.

Criar e iniciar o stream

  1. Clique em Criar e iniciar depois para criar e iniciar o stream mais tarde no Datastream ou em Iniciar para criar e iniciar o stream imediatamente.

  2. Você recebe notificações sobre as tarefas realizadas automaticamente para você:

    • O Datastream cria os recursos necessários da nuvem privada virtual, como intervalo de endereços IP internos, sub-rede e anexo de rede.
    • O Datastream configura tabelas para CDC, slots de replicação e uma publicação para todas as tabelas no banco de dados, além de criar um usuário dedicado do Datastream.
    • O Datastream cria uma configuração de conectividade privada e perfis de conexão de origem e destino.
  3. Confirme que você quer criar ou criar e iniciar a transmissão.

Monitorar o stream

É possível monitorar os detalhes básicos do fluxo na página de visão geral da instância de origem no console Google Cloud . A página mostra informações como status do fluxo, nome do fluxo, conjunto de dados de destino do BigQuery e identificador do projeto de destino.

Na página de visão geral, também é possível realizar ações como iniciar, parar ou pausar o stream. Para informações de monitoramento mais detalhadas, clique no nome do fluxo para navegar até o Datastream.

Excluir o stream

Quando você exclui um fluxo criado usando o fluxo automatizado, alguns recursos, como o slot de replicação do PostgreSQL, são excluídos automaticamente. No entanto, há recursos que precisam ser excluídos manualmente:

  • A publicação. A publicação é criada usando o usuário administrador do banco de dados e só pode ser excluída pelo proprietário, ou seja, por padrão, o usuário que a criou.
  • O usuário leitor do Datastream.
  • Os perfis de conexão de origem e destino do Datastream
  • Os recursos de conectividade particular.
  • Todos os recursos de rede criados durante o fluxo automatizado, como a sub-rede e a conexão de rede.

A seguir