Probleme bei der Migration von PostgreSQL zu AlloyDB diagnostizieren

Fehler bei der Migration beheben

Beim Migrationsjob können während der Laufzeit Fehler auftreten.

  • Einige Fehler, wie z. B. ein ungültiges Passwort in der Quelldatenbank, sind wiederherstellbar. Dies bedeutet, dass diese Fehler behoben werden können und der Migrationsjob anschließend automatisch fortgesetzt wird.
  • Einige Fehler sind nicht wiederherstellbar, z. B. Fehler bei der Datenreplikation. In diesem Fall muss der Migrationsjob von Anfang an neu gestartet werden.

Wenn ein Fehler auftritt, ändert sich der Status des Migrationsjobs in Failed und der Unterstatus spiegelt den letzten Status vor dem Fehler wider.

Zum Beheben eines Fehlers rufen Sie den fehlgeschlagenen Migrationsjob auf, um den Fehler anzuzeigen, und folgen dann den Schritten in der Fehlermeldung.

Weitere Informationen zum Fehler finden Sie in Cloud Monitoring. Klicken Sie dazu auf den Link im Migrationsjob. Die Logs werden nach dem jeweiligen Migrationsjob gefiltert.

In der folgenden Tabelle finden Sie einige Beispiele für Probleme und deren Lösungsmöglichkeiten:

Symptom Mögliche Ursachen Lösungsvorschlag
Fehler beim Herstellen einer Verbindung zur Quelldatenbankinstanz. Es gab ein Verbindungsproblem zwischen der Quelldatenbankinstanz und der Zielinstanz. Folgen Sie der Anleitung unter Verbindungsprobleme beheben.
Fehler beim Ausführen des Migrationsjobs aufgrund inkompatibler Versionen von Quelldatenbank und Ziel. Die Versionen der Quell- und Zieldatenbank sind keine unterstützte Kombination. Insbesondere ist die angegebene Version der Quelldatenbank nicht mit der Version der Zieldatenbank kompatibel. Achten Sie darauf, dass die Version der Zieldatenbank mit der Version der Quelldatenbank identisch ist oder eine Hauptversion höher liegt. Erstellen Sie dann einen neuen Migrationsjob.
Datendefinitionssprachen (DDLs) oder Datenbearbeitungssprachen (DMLs) sind in der Quelle blockiert. DDLs, für die die ACCESS EXCLUSIVE Sperre erforderlich ist und die während der vollständigen Dump-Phase ausgeführt werden, sind blockiert.

Während der ersten Synchronisierung (vollständiger Dump) sollten DDLs oder Programme, für die ACCESS EXCLUSIVE Sperren erforderlich sind, z. B. ALTER TABLE oder DROP TABLE, für die Tabellen vermieden werden. Andernfalls warten die DDLs oder Programme, bis die erste Synchronisierung abgeschlossen ist.

Wenn sich eine Tabelle beispielsweise noch in der ersten Synchronisierung befindet und ein ALTER TABLE-Befehl für dieselbe Tabelle ausgeführt wird, wird der Befehl nicht ausgeführt und nachfolgende DDL- und DML-Befehle werden blockiert, bis die erste Synchronisierung abgeschlossen ist.

Fehlermeldung: No pglogical extension installed on databases (X) Auf einer oder mehreren Quelldatenbanken ist pglogical nicht installiert. Folgen Sie dieser Anleitung, um pglogical auf den Datenbanken der Quellinstanz zu installieren.
Fehlermeldung: Replication user 'x' doesn't have sufficient privileges. Der Nutzer, der den Database Migration Service verwendet, hat nicht die erforderlichen Berechtigungen, um den angegebenen Vorgang auszuführen. Folgen Sie dieser Anleitung, um sicherzustellen, dass dieser Nutzer die erforderlichen Berechtigungen hat.
Fehlermeldung: Unable to connect to source database server. Database Migration Service kann keine Verbindung zum Quelldatenbankserver herstellen. Achten Sie darauf, dass die Quell- und Zieldatenbankinstanzen miteinander kommunizieren können und dass Sie alle erforderlichen Voraussetzungen erfüllt haben, die beim Definieren der Einstellungen für den Migrationsjob angezeigt wurden.
Fehlermeldung: The source database 'wal_level' configuration must be equal to 'logical'. Der wal_level für die Quelldatenbank ist auf einen anderen Wert als logical festgelegt. Legen Sie wal_level auf logical fest.
Fehlermeldung: The source database 'max_replication_slots' configuration is not sufficient. Der Parameter max_replication_slots wurde nicht richtig konfiguriert. Folgen Sie dieser Anleitung, um diesen Parameter richtig festzulegen.
Fehlermeldung: The source database 'max_wal_senders' configuration is not sufficient. Der Parameter max_wal_senders wurde nicht richtig konfiguriert. Folgen Sie dieser Anleitung, um diesen Parameter richtig festzulegen.
Fehlermeldung: The source database 'max_worker_processes' configuration is not sufficient. Der Parameter max_worker_processes wurde nicht richtig konfiguriert. Folgen Sie dieser Anleitung, um diesen Parameter richtig festzulegen.

Fehlermeldung: Cleanup may have failed on source due to error: generic::unknown: failed to connect to on-premises database.

ODER

Fehlermeldung: Error promoting EM replica: finished drop replication with errors.

Die für die Replikation erforderlichen Einstellungen können während der Hochstufung eines Migrationsjobs nicht bereinigt werden.

Führen Sie für jede Datenbank Befehle als Nutzer mit der Berechtigung superuser aus.

Weitere Informationen zu den auszuführenden Befehlen finden Sie unter Replikationsslots bereinigen.

Fehlermeldung: x509 certificate signed by unknown authority.

Das für Database Migration Service bereitgestellte CA-Zertifikat der Quelle enthält möglicherweise nur das Root-Zertifikat. Für das Quellzertifikat sind jedoch sowohl das Root-Zertifikat als auch alle Zwischenzertifikate erforderlich.

Bei Amazon Relational Database Service kann beispielsweise die Verwendung des Zertifikats rds-ca-2019-root.pem zu diesem Problem führen.

Erstellen Sie ein kombiniertes CA-Zertifikat der Quelle, das sowohl das Root-Zertifikat als auch alle erforderlichen Zwischenzertifikate enthält.

Verwenden Sie für den Anwendungsfall von Amazon Relational Database Service anstelle des Zertifikats rds-ca-2019-root.pem das Zertifikat rds-combined-ca-bundle.pem.

Fehlermeldung: ERROR: Out of shared memory HINT: You might need to increase max_locks_per_transaction.

Der für den Parameter max_locks_per_transaction festgelegte Wert ist nicht ausreichend. Legen Sie den Wert für diesen Parameter auf mindestens {max_number_of_tables_per_database}/(max_connections + max_prepared_transactions) fest.

Fehlermeldung: ERROR: no data left in message.

Das pglogical-Paket ist nicht richtig auf der Quellinstanz installiert. Weitere Informationen zur korrekten Installation dieses Pakets finden Sie unter pglogical-Paket auf der Quellinstanz installieren.

Fehlermeldung: Cannot assign TransactionIds during recovery.

Die konfigurierte Quelle befindet sich im Wiederherstellungsmodus. Konfigurieren Sie eine Quelle, die sich nicht im Wiederherstellungsmodus befindet.
Der vollständige Dump ist langsam. Der Import großer Datenmengen aus der Quelldatenbank in das AlloyDB-Ziel kann langsam sein.
  • Wählen Sie für das AlloyDB-Ziel eine höhere Stufe aus, um die maximal verfügbare Netzwerk- und Festplattenbandbreite zu erhalten.
  • Optimieren Sie das Flag max_wal_size des AlloyDB-Ziels. Normalerweise ist ein Wert von 32 GB oder 64 GB für dieses Flag gut geeignet. Für die Aktualisierung dieses Flags ist kein Neustart des Servers erforderlich.
Fehlermeldung: subscriber {subscriber_name} initialization failed during nonrecoverable step (d), please try the setup again

Der Migrationsjob ist während der vollständigen Dump-Phase fehlgeschlagen und kann nicht wiederhergestellt werden. Die Quelldatenbankinstanz wurde neu gestartet oder befindet sich im Wiederherstellungsmodus. Alternativ wurden die Replikationsverbindungen aufgrund eines zu niedrigen Werts für den wal_sender_timeout Parameter beendet.

So finden Sie die Ursache des Problems:

  1. Rufen Sie in der Google Cloud Console die Seite Log-Explorer auf.
  2. Wählen Sie in der Ressourcenliste Ihre AlloyDB-Instanz aus. Eine Liste der letzten Logs für die Instanz wird angezeigt.
  3. Wählen Sie in den Logdateinamen postgres.log aus.
  4. Legen Sie den Schweregrad des Logs auf alle Stufen über Warning fest. Die ersten Fehlerlogs können die Ursache für den Fehler sein.
  • Achten Sie darauf, dass Database Migration Service während der vollständigen Dump-Phase immer eine Verbindung zur Quelldatenbankinstanz herstellen kann.
  • Prüfen Sie, ob der Wert des Parameters wal_sender_timeout in der Quelldatenbankinstanz auf eine größere Zahl (z. B. 0) festgelegt ist.
  • Starten Sie den Migrationsjob neu und versuchen Sie es noch einmal.
Fehlermeldung: ERROR: unknown column name {column_name}

Eine Spalte wurde einer replizierten Tabelle auf dem primären Knoten, aber nicht auf dem Replikatknoten hinzugefügt.

Bei kontinuierlichen Migrationen werden nur Änderungen der Datenbearbeitungssprache (DML) automatisch aktualisiert. Der Nutzer ist für die Verwaltung von Änderungen der Datendefinitionssprache (DDL) verantwortlich, damit die Quell- und Zieldatenbanken kompatibel bleiben. Dies kann auf zwei Arten erreicht werden:

  • Beenden Sie Schreibvorgänge in die Quelldatenbank und führen Sie die DDL-Befehle in der Quelle und dem Ziel aus. Gewähren Sie dem Cloud SQL-Nutzer, der die DDL-Änderungen anwendet, die Rolle cloudsqlexternalsync, bevor die DDL-Befehle für das Ziel ausgeführt werden.
  • Verwenden Sie pglogical.replicate_ddl_command, damit DDL-Befehle an der Quelle und am Ziel an einem konsistenten Punkt ausgeführt werden können. Der Nutzer, der die Befehle ausführt, muss denselben Nutzernamen in der Quelle und im Ziel haben und der Superuser oder der Eigentümer des zu migrierenden Artefakts (z. B. Tabelle, Sequenz, Ansicht oder Datenbank) sein.
  • Beispiele für die Verwendung von pglogical.replicate_ddl_command. finden Sie unter Kontinuierliche Migration.

Fehlermeldung: ERROR: cannot truncate a table referenced in a foreign key constraint

Der Nutzer hat versucht, eine Tabelle mit einer Fremdschlüsseleinschränkung zu kürzen.

Entfernen Sie zuerst die Fremdschlüsseleinschränkung und kürzen Sie dann die Tabelle.

Fehlermeldung: ERROR: connection to other side has died

Die Replikationsverbindung wurde aufgrund eines zu niedrigen Werts für den wal_sender_timeout parameter beendet. Der Fehler tritt normalerweise während der Replikationsphase nach dem erfolgreichen ersten Dump auf.

Erwägen Sie, den wal_sender_timeout Parameterwert zu erhöhen oder den Timeout-Mechanismus zu deaktivieren, indem Sie seinen Wert in der Quelldatenbankinstanz auf 0 setzen.

Wenn Sie ausgewählte Datenbanken migrieren und der Migrationsjob Daten nicht in eine oder mehrere Datenbanken replizieren kann, wird in der Liste der Datenbanken der Status Fehlgeschlagen angezeigt. Verschiedene Fehler beim Migrationsjob.

Klicken Sie in der Spalte Fehler auf Fehler ansehen und beheben Sie die Fehler. Sie können die fehlgeschlagenen Datenbanken auch aus dem Migrationsjob entfernen.

Weitere Informationen zum Entfernen einer fehlgeschlagenen Datenbank aus einem Migrationsjob finden Sie unter Migrationsjobs verwalten.

Replikationsslots bereinigen

Eine der folgenden Meldungen wird angezeigt:

  • Cleanup may have failed on source due to error: generic::unknown: failed to connect to on-premises database.
  • Error promoting EM replica: finished drop replication with errors.

Mögliche Ursachen

Wenn Sie eine AlloyDB-Instanz hochstufen und die Quellinstanz von der AlloyDB-Instanz aus nicht erreichbar ist (z. B. die Quellinstanz wird nicht ausgeführt oder Sie haben die AlloyDB-Instanz aus der Zulassungsliste der Quellinstanzen entfernt), können die für die Replikation erforderlichen Einstellungen während der Hochstufung eines Migrationsjobs nicht bereinigt werden. Sie müssen die Replikationsslots manuell bereinigen.

Lösungsvorschlag

Führen Sie für jede Datenbank die folgenden Befehle als Nutzer mit der Berechtigung superuser aus:

  1. Rufen Sie die Namen der Replikationsslots aus der Fehlermeldung ab und führen Sie dann den folgenden Befehl aus, um die Slots einzeln zu löschen:

    select pg_drop_replication_slot({slot_name});
  2. Wenn die Namen der Replikationsslots in der Fehlermeldung nicht verfügbar sind, führen Sie den folgenden Befehl aus, um die vorhandenen Replikationsslots abzufragen:

    select pg_drop_replication_slot(slot_name) from pg_replication_slots where slot_name like '%alloydb%' and active = 'f';
  3. Wenn keine AlloyDB-Replikate die Quellinstanz verwenden, führen Sie den folgenden Befehl aus, um die pglogical-Einstellungen zu bereinigen:

    select pglogical.drop_node(node_name) from pglogical.node where node_name like 'alloydb';
  4. Wenn die pglogical-Erweiterung nicht mehr benötigt wird, führen Sie den folgenden Befehl aus, um die Erweiterung zu deinstallieren:

    DROP EXTENSION IF EXISTS pglogical;

Verwaiste AlloyDB-Cluster im Bootstrapping-Modus löschen

In seltenen Fällen kann es vorkommen, dass Ihr Migrationsjob gelöscht wurde, der zugehörige AlloyDB-Cluster jedoch nicht und sich noch im Bootstrapping-Modus befindet. Sie können den Cluster mit dem gcloud-Befehl von AlloyDB zum Löschen eines Clusters in Kombination mit der --force Option löschen.

Das Löschen eines Bootstrapping-Clusters, während er von einem Migrationsjob verwendet wird, führt zu undefiniertem Verhalten.

Nutzer und Rollen verwalten

Vorhandene Nutzer migrieren

Der Database Migration Service unterstützt derzeit nicht die Migration vorhandener Nutzer von einer Quellinstanz zu einer AlloyDB-Zielinstanz. Sie können diese Migration verwalten, indem Sie die Nutzer manuell in AlloyDB erstellen.

Informationen zum Nutzer alloydbexternalsync

Während der Migration gehören alle Objekte auf der primären AlloyDB-Instanz dem Nutzer alloydbexternalsync. Nachdem die Daten migriert wurden, können Sie den Eigentümer der Objekte ändern. Führen Sie dazu die folgenden Schritte aus:

  • Führen Sie den GRANT alloydbexternalsync to {USER} Befehl aus.
  • Führen Sie in jeder Datenbank den reassign owned by alloydbexternalsync to {USER}; Befehl aus.
  • Führen Sie den Befehl drop role alloydbexternalsync aus, um den Nutzer alloydbexternalsync zu entfernen.