Visão geral
O Database Migration Service oferece suporte a migrações contínuas de bancos de dados de origem para bancos de dados de destino do AlloyDB.
Os bancos de dados de origem compatíveis com o PostgreSQL incluem o seguinte:
- Amazon RDS 9.6.10+, 10.5+, 11.1+, 12, 13, 14, 15, 16, 17
- Amazon Aurora 10.11+, 11.6+, 12.4+, 13.3+, 14, 15, 16, 17
- PostgreSQL autogerenciado (no local ou em qualquer VM da nuvem que você controla totalmente) 9.4, 9.5, 9.6, 10, 11, 12, 13, 14, 15, 16, 17
- Cloud SQL 9.6, 10, 11, 12, 13, 14, 15, 16, 17
Para configurar a origem, é preciso ajustar a instância de origem e os bancos de dados de origem básicos.
Configurar a instância de origem
Para configurar a instância de origem, siga estas etapas:
- A instância de origem precisa incluir o banco de dados
postgres. Crie esse banco de dados, caso ele não exista. - Instale o pacote
pglogicalna instância de origem e verifique se ele está incluído na variávelshared_preload_libraries.- Consulte Instalar o pacote
pglogicalna instância de origem do seu ambiente.
- Consulte Instalar o pacote
Configurar os bancos de dados de origem
O Database Migration Service migra todos os bancos de dados na instância de origem que não sejam os seguintes:
- Para origens locais: bancos de dados de modelos
template0etemplate1 - Para origens do Amazon RDS:
template0,template1erdsadmin - Para origens do Cloud SQL: modelos de bancos de dados
template0etemplate1
Faça o seguinte em cada banco de dados na instância de origem que não foi mencionada acima:
Somente para origens do PostgreSQL versão 9.4, instale as seguintes extensões
pglogicalem cada banco de dados na instância de origem:CREATE EXTENSION IF NOT EXISTS pglogical;CREATE EXTENSION IF NOT EXISTS pglogical_origin;
Para todas as outras versões, instale apenas a extensão
pglogicalem cada banco de dados na instância de origem:CREATE EXTENSION IF NOT EXISTS pglogical.Para tabelas sem chaves primárias, o Database Migration Service oferece suporte à migração de snapshots iniciais e instruções
INSERTdurante a fase de CDC. Migre as instruçõesUPDATEeDELETEmanualmente.O USER que você está usando para se conectar à instância de origem, que será configurado como o usuário na página Perfis de conexão, precisa ter determinados privilégios em cada um dos bancos de dados migrados, bem como no banco de dados
postgrespadrão. É possível criar um novo usuário ou reutilizar um já existente. Para definir esses privilégios, conecte-se à instância e execute os seguintes comandos:GRANT USAGE on SCHEMA SCHEMA to USERem todos os esquemas (além do esquema de informações e esquemas que começam com "pg_") em cada banco de dados a ser migrado.GRANT USAGE on SCHEMA pglogical to PUBLIC;em cada banco de dados a ser migrado.GRANT SELECT on ALL TABLES in SCHEMA pglogical to USERem todos os bancos de dados para receber informações de replicação de bancos de dados de origem.GRANT SELECT on ALL TABLES in SCHEMA SCHEMA to USERem todos os esquemas (além do esquema de informações e esquemas que começam com "pg_") em cada banco de dados a ser migrado.GRANT SELECT on ALL SEQUENCES in SCHEMA SCHEMA to USERem todos os esquemas (além do esquema de informações e esquemas que começam com "pg_") em cada banco de dados a ser migrado.- Se a origem for o Amazon RDS, execute o seguinte comando:
GRANT rds_replication to USER
- Se a origem não for o Amazon RDS, execute o seguinte comando:
ALTER USER USER with REPLICATIONPapel
Instale o pacote pglogical na instância de origem
Esta seção descreve como configurar o pacote pglogical, incluindo a configuração dos parâmetros max_replication_slots, max_wal_senders e max_worker_processes.
Você também pode receber os valores corretos para esses parâmetros
executando um teste de job de migração ao criar o job de migração.
Durante esse teste, o Database Migration Service pode verificar suas configurações e sugerir os valores corretos.
PostgreSQL autogerenciado ou local
- Instale o pacote pglogical no servidor.
- Conecte-se à instância e defina os seguintes parâmetros, conforme necessário:
shared_preload_librariesprecisa incluirpglogical.Para definir esse parâmetro, execute o
ALTER SYSTEM SET shared_preload_libraries = 'pglogical,[any other libraries in your instance]';comando.Defina
wal_levelcomological.Para definir esse parâmetro, execute o comando
ALTER SYSTEM SET wal_level = 'logical';.Defina
wal_sender_timeoutcomo0.Para definir esse parâmetro, execute o comando
ALTER SYSTEM SET wal_sender_timeout = 0;, em que0desativa o mecanismo de tempo limite usado para encerrar conexões de replicação inativas.max_replication_slots define o número máximo de slots de replicação que a instância de origem pode oferecer suporte. Ele precisa ser definido como pelo menos o número de assinaturas que precisam ser conectadas, além de algumas reservas para sincronização de tabelas.
O Database Migration Service exige um slot para cada banco de dados migrado (que são todos os bancos de dados na instância de origem).
Por exemplo, se houver cinco bancos de dados na instância de origem e dois jobs de migração forem criados para a origem, o número de slots de replicação precisará ser pelo menos 5 * 2 = 10, além do número de slots de replicação já usados. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de slots de replicação e verifique sua configuração executando o teste de job de migração ao criar o job de migração.
Para definir esse parâmetro, execute o comando
ALTER SYSTEM SET max_replication_slots = #;, em que # representa o número máximo de slots de replicação.max_wal_senders precisa ser definido como pelo menos
max_replication_slots, além do número de remetentes já usados na sua instância.Por exemplo, se o parâmetro
Para definir esse parâmetro, execute o comandomax_replication_slotsestiver definido como10e você já estiver usando dois remetentes, o número de processos de remetentes WAL em execução ao mesmo tempo será 10 + 2 = 12. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de remetentes e verifique sua configuração executando o teste de job de migração ao criar o job de migração.ALTER SYSTEM SET max_wal_senders = #;, em que # representa o número de processos de remetentes WAL em execução simultaneamente.max_worker_processes precisa ser definido como pelo menos o mesmo número de bancos de dados que o Database Migration Service vai migrar (que são todos os bancos de dados na instância de origem), além do número de
max_worker_processesjá usados na sua instância.Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de processos de worker e verifique sua configuração executando o teste de job de migração ao criar o job de migração.
Para definir esse parâmetro, execute o comando
ALTER SYSTEM SET max_worker_processes = #;, em que # representa o número de bancos de dados que serão migrados.
- Para aplicar as alterações na configuração, reinicie a instância de origem.
Amazon RDS PostgreSQL
- Instale a extensão
pglogicalno banco de dados de origem. Para mais informações, consulte Como usar extensões do PostgreSQL com o Amazon RDS para PostgreSQL na documentação do Amazon RDS. Configure a instância de origem usando grupos de parâmetros.
- Crie um novo grupo de parâmetros. No grupo de parâmetros:
- Verifique se o parâmetro
shared_preload_librariesincluipglogical. - Defina o parâmetro
rds.logical_replicationcomo1. Isso vai ativar os registros WAL no nível lógico. - Defina o parâmetro
wal_sender_timeoutcomo 0. Isso vai desativar o mecanismo de tempo limite usado para encerrar conexões de replicação inativas. Defina o max_replication_slots parâmetro. Esse parâmetro define o número máximo de slots de replicação que a instância de origem pode oferecer suporte. Ele precisa ser definido como pelo menos o número de assinaturas que precisam ser conectadas, além de algumas reservas para sincronização de tabelas.
O Database Migration Service exige um slot para cada banco de dados migrado (que são todos os bancos de dados na instância de origem).
Por exemplo, se houver cinco bancos de dados na instância de origem e dois jobs de migração forem criados para a origem, o número de slots de replicação precisará ser pelo menos 5 * 2 = 10, além do número de slots de replicação já usados. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de slots de replicação e verifique sua configuração por executando o teste de job de migração ao criar o job de migração.
O valor padrão desse parâmetro é 10.
Defina o max_wal_senders parâmetro como pelo menos o mesmo que
max_replication_slots, além do número de remetentes já usados na sua instância.Por exemplo, se o parâmetro
max_replication_slotsestiver definido como10e você já estiver usando dois remetentes, o número de processos de remetentes WAL em execução ao mesmo tempo será 10 + 2 = 12. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de remetentes e verifique sua configuração executando o teste de job de migração ao criar o job de migração.O valor padrão desse parâmetro é 10.
Defina o parâmetro de origem max_worker_processes como pelo menos o mesmo número de bancos de dados que o Database Migration Service vai migrar (que são todos os bancos de dados na instância de origem), além do número de
max_worker_processesjá usados na sua instância. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de processos de worker e verifique sua configuração executando o teste de job de migração ao criar o job de migração.O valor padrão desse parâmetro é 8.
Anexe o grupo de parâmetros à instância. Se você estiver criando uma nova instância, essa opção estará em Configuração adicional. Caso contrário, modifique a instância para anexar o grupo de parâmetros.
Para aplicar as alterações na configuração, reinicie a instância de origem.
Cloud SQL para PostgreSQL
Ative a replicação lógica e a decodificação do banco de dados de origem configurando as seguintes flags.
- Defina as flags
cloudsql.logical_decodingecloudsql.enable_pglogicalcomoon. Defina a flag max_replication_slots. Essa flag define o número máximo de slots de replicação que a instância de origem pode oferecer suporte. Ele precisa ser definido como pelo menos o número de assinaturas que precisam ser conectadas, além de algumas reservas para sincronização de tabelas.
O Database Migration Service exige um slot para cada banco de dados migrado (que são todos os bancos de dados na instância de origem).
Por exemplo, se houver cinco bancos de dados na instância de origem e dois jobs de migração forem criados para a origem, o número de slots de replicação precisará ser pelo menos 5 * 2 = 10, além do número de slots de replicação já usados. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de slots de replicação e verifique sua configuração executando o teste de job de migração ao criar o job de migração.
O valor padrão dessa flag é 10.
Defina a flag max_wal_senders como pelo menos o mesmo que
max_replication_slots, além do número de remetentes já usados na sua instância.Por exemplo, se a flag
max_replication_slotsestiver definida como10e você já estiver usando dois remetentes, o número de processos de remetentes WAL em execução ao mesmo tempo será 10 + 2 = 12. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, aumente o número de remetentes e verifique sua configuração por executando o teste de job de migração ao criar o job de migração.O valor padrão dessa flag é 10.
Defina a flag de origem max_worker_processes como pelo menos o mesmo número de bancos de dados que o Database Migration Service vai migrar (que são todos os bancos de dados na instância de origem), além do número de
max_worker_processesjá usados na sua instância. Se você planeja usar configurações de paralelismo de despejo de dados ajustadas, considere dois processos de worker adicionais por conexão (até um máximo de 20 workers).O valor padrão dessa flag é 8.
- Reinicie a instância de origem para que as alterações de configuração feitas nas flags entrem em vigor.
Ativar o monitoramento de atraso de replicação para versões do PostgreSQL anteriores à 9.6
Se você estiver migrando de uma versão do PostgreSQL anterior à 9.6, a métrica de atraso da replicação não estará disponível por padrão. Há três alternativas que permitem que você acompanhe essa métrica para garantir inatividade mínima ao promover o banco de dados:
Opção 1: conceda ao Database Migration Service uma consulta específica para que ele possa rastrear o atraso de replicação. Usando um usuário com o privilégio
SUPERUSER, faça o seguinte:Defina a função a seguir para permitir que o Database Migration Service consulte o atraso de replicação.
CREATE OR REPLACE FUNCTION pg_stat_replication_user() RETURNS TABLE ( pid integer , usesysid oid , username name , application_name text , client_addr inet , client_hostname text , client_port integer , backend_start timestamp with time zone , backend_xmin xid , state text , sent_location pg_lsn , write_location pg_lsn , flush_location pg_lsn , replay_location pg_lsn , sync_priority integer , sync_state text ) LANGUAGE SQL SECURITY DEFINER AS $$ SELECT * FROM pg_catalog.pg_stat_replication; $$;Conceda a permissão
EXECUTEao USER executando os seguintes comandos:REVOKE EXECUTE ON FUNCTION pg_stat_replication_user() FROM public;GRANT EXECUTE ON FUNCTION pg_stat_replication_user() to {replication_user};
Opção 2: conceda o privilégio
SUPERUSERdiretamente ao USER usado para se conectar à instância de origem. Isso vai permitir que o Database Migration Service leia o atraso de replicação diretamente.Opção 3: acompanhe o atraso de replicação de forma independente usando a seguinte consulta:
SELECT current_timestamp, application_name, pg_xlog_location_diff(pg_current_xlog_location(), pg_stat_replication.sent_location) AS sent_location_lag, pg_xlog_location_diff(pg_current_xlog_location(), pg_stat_replication.write_location) AS write_location_lag, pg_xlog_location_diff(pg_current_xlog_location(), pg_stat_replication.flush_location) AS flush_location_lag, pg_xlog_location_diff(pg_current_xlog_location(), pg_stat_replication.replay_location) AS replay_location_lag FROM pg_stat_replication WHERE application_name like 'cloudsql%';
Nesta opção, o Database Migration Service não reflete a métrica de atraso da replicação nos gráficos ou nas respostas da API.