Nesta página, descrevemos como criar um stream usando o fluxo de configuração automatizada.
A configuração de stream automatizada simplifica o processo de movimentação de dados dos bancos de dados gerenciados do Cloud SQL para PostgreSQL para o BigQuery, reduzindo o número de etapas necessárias. Com esse fluxo, é possível criar um fluxo diretamente na página de visão geral da instância do Cloud SQL para PostgreSQL. O Datastream automatiza a proteção da conexão VPC entre o stream e o banco de dados de origem, criando configurações de banco de dados e recursos de conexão de stream.
Antes de começar
- Ative as APIs Datastream, Conectividade de rede e Compute Engine.
- Verifique se você tem as permissões necessárias do Identity and Access Management (IAM) para criar e gerenciar recursos do Datastream. Consulte a seção a seguir para mais detalhes.
- Crie e configure um banco de dados de origem do Cloud SQL para PostgreSQL para replicação. Para mais informações, consulte Configurar um banco de dados do Cloud SQL para PostgreSQL para CDC.
Recomendamos que você ative a replicação lógica para sua instância antes de criar o fluxo. Se você não ativar a replicação lógica, o Datastream fará isso por você, o que reinicia a instância de origem.
Para informações sobre como ativar a replicação lógica em uma instância do Cloud SQL para PostgreSQL, consulte Configurar um banco de dados do Cloud SQL para PostgreSQL para CDC.
Verifique se o banco de dados de origem está configurado para usar o acesso a serviços particulares.
Permissões necessárias
Para usar o fluxo automatizado de criação de stream, você precisa das seguintes permissões ou papéis do Identity and Access Management (IAM):
serviceusage.services.enable,compute.networkAdminpara ativar as APIs necessárias e realizar tarefas de configuração de rede.cloudsql.adminpara tarefas de configuração de instâncias.datastream.adminpara tarefas de administração que o Datastream realiza em seu nome.
O usuário administrador do banco de dados também precisa de permissões GRANT para o esquema
que você quer replicar. Conecte-se ao banco de dados de origem e execute o seguinte:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE; GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to"USER_NAME" WITH GRANT OPTION; ALTER DEFAULT PRIVILEGES IN SCHEMA "SCHEMA_NAME" GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
Criar e iniciar o stream
Para criar e iniciar uma transmissão, siga estas etapas:
Console
Primeiros passos
Acesse a página de visão geral da instância do banco de dados de origem do Cloud SQL para PostgreSQL.
Na seção Fazer streaming de dados para o BigQuery, clique em Criar stream.
Na página Começar, informe o nome do stream no campo Nome do stream. Um identificador exclusivo é preenchido automaticamente.
Na seção Forneça os detalhes da conta de usuário da instância, selecione o método de autenticação:
Autenticação de banco de dados do IAM: essa opção está disponível se o usuário tiver a identidade principal do Identity and Access Management (IAM) atribuída. Para mais informações, consulte Principais do IAM. Se você selecionar essa opção, precisará conceder manualmente a função
cloudsqlsuperusere a permissãoCREATEROLEao usuário:- No Google Cloud console, acesse a página Instâncias do Cloud SQL.
Acesse "Instâncias do Cloud SQL"
- Selecione a instância do Cloud SQL.
- No menu de navegação, clique em Cloud SQL Studio e faça login.
- No painel Explorer, execute a seguinte consulta para seu usuário:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE;
- Autenticação de banco de dados integrada: forneça o nome de usuário e a
senha de um usuário com a função
cloudsqlsuperuser. Se você selecionar essa opção, verifique se o usuário tem permissõesGRANTnas tabelas que quer replicar.
Revise outros detalhes do stream, como região, criptografia e rótulos. Expanda a seção Detalhes adicionais do stream para aplicar as mudanças, se necessário.
Clique em Continuar.
Configurar origem
- Na página Configurar origem do fluxo, selecione o banco de dados de que você quer replicar os dados.
- A lista Objetos a serem incluídos seleciona todos os objetos disponíveis por padrão. Os objetos na lista são aqueles para os quais você tem as permissões necessárias para fazer streaming. Para mudar os objetos selecionados, modifique as seleções na lista.
- Revise as configurações avançadas de stream, como o modo de preenchimento e o número máximo de conexões simultâneas de preenchimento. Expanda a seção Configurações avançadas de transmissão para aplicar mudanças, se necessário.
- Clique em Continuar.
Configurar destino
- Na página Configurar destino, ajuste as configurações de destino do BigQuery, se necessário. Para mais informações, consulte Configurar informações sobre o destino do stream.
Criar e iniciar o stream
Clique em Criar e iniciar depois para criar e iniciar o stream mais tarde no Datastream ou em Iniciar para criar e iniciar o stream imediatamente.
Você recebe notificações sobre as tarefas realizadas automaticamente para você:
- O Datastream cria os recursos necessários da nuvem privada virtual, como intervalo de endereços IP internos, sub-rede e anexo de rede.
- O Datastream configura tabelas para CDC, slots de replicação, uma publicação para todas as tabelas no banco de dados e cria um usuário dedicado do Datastream.
- O Datastream cria uma configuração de conectividade privada e perfis de conexão de origem e destino.
Confirme que você quer criar ou criar e iniciar a transmissão.
Monitorar o stream
É possível monitorar os detalhes básicos do fluxo na página de visão geral da instância de origem no console Google Cloud . A página mostra informações como status do stream, nome do stream, conjunto de dados de destino do BigQuery e identificador do projeto de destino.
Na página de visão geral, também é possível realizar ações como iniciar, parar ou pausar o stream. Para informações de monitoramento mais detalhadas, clique no nome do fluxo para navegar até o Datastream.
Excluir o stream
Quando você exclui um fluxo criado usando o fluxo automatizado, alguns recursos, como o slot de replicação do PostgreSQL, são excluídos automaticamente. No entanto, há recursos que precisam ser excluídos manualmente:
- A publicação. A publicação é criada usando o usuário administrador do banco de dados e só pode ser excluída pelo proprietário, ou seja, por padrão, o usuário que a criou.
- O usuário leitor do Datastream.
- Os perfis de conexão de origem e destino do Datastream
- Os recursos de conectividade particular.
- Todos os recursos de rede criados durante o fluxo automatizado, como a sub-rede e a conexão de rede.
A seguir
- Saiba como criar um fluxo manualmente.
- Saiba como monitorar streams.