Auf dieser Seite wird beschrieben, wie Sie einen Stream mit dem automatischen Einrichtungsablauf erstellen.
Die automatische Einrichtung von Streams vereinfacht das Übertragen von Daten aus verwalteten Cloud SQL for PostgreSQL-Datenbanken zu BigQuery, da weniger Schritte erforderlich sind. Mit dem Ablauf können Sie einen Stream direkt über die Übersichtsseite Ihrer Cloud SQL for PostgreSQL-Instanz erstellen. Datastream automatisiert die Sicherung der VPC-Verbindung zwischen dem Stream und der Quelldatenbank und erstellt Datenbankkonfigurationen und Streamverbindungsressourcen.
Hinweise
- Aktivieren Sie die Datastream API, die Network Connectivity API und die Compute Engine API.
- Sie benötigen die erforderlichen IAM-Berechtigungen (Identity and Access Management), um Datastream-Ressourcen zu erstellen und zu verwalten. Weitere Informationen finden Sie im nächsten Abschnitt.
- Erstellen und konfigurieren Sie eine Cloud SQL for PostgreSQL-Quelldatenbank für die Replikation. Weitere Informationen finden Sie unter Cloud SQL for PostgreSQL-Datenbank für CDC konfigurieren.
Wir empfehlen, die logische Replikation für Ihre Instanz zu aktivieren, bevor Sie den Stream erstellen. Wenn Sie die logische Replikation nicht aktivieren, wird sie von Datastream aktiviert. Dadurch wird Ihre Quellinstanz neu gestartet.
Informationen zum Aktivieren der logischen Replikation für eine Cloud SQL for PostgreSQL-Instanz finden Sie unter Cloud SQL for PostgreSQL-Datenbank für CDC konfigurieren.
Achten Sie darauf, dass Ihre Quelldatenbank für die Verwendung des Zugriffs auf private Dienste konfiguriert ist.
Erforderliche Berechtigungen
Wenn Sie den automatisierten Streamerstellungsprozess verwenden möchten, benötigen Sie die folgenden IAM-Rollen (Identity and Access Management) oder Berechtigungen:
serviceusage.services.enable,compute.networkAdminzum Aktivieren der erforderlichen APIs und zum Ausführen von Aufgaben zur Netzwerkkonfiguration.cloudsql.adminfür Instanzkonfigurationsaufgaben.datastream.adminfür Verwaltungsaufgaben, die Datastream in Ihrem Namen ausführt.
Ihr Datenbankadministratorbenutzer benötigt außerdem GRANT-Berechtigungen für das Schema, das Sie replizieren möchten. Stellen Sie eine Verbindung zu Ihrer Quelldatenbank her und führen Sie Folgendes aus:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE; GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to"USER_NAME" WITH GRANT OPTION; ALTER DEFAULT PRIVILEGES IN SCHEMA "SCHEMA_NAME" GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
Stream erstellen und starten
So erstellen und starten Sie einen Stream:
Console
Jetzt starten
Rufen Sie die Übersichtsseite Ihrer Cloud SQL for PostgreSQL-Quelldatenbankinstanz auf.
Klicken Sie im Abschnitt Daten in BigQuery streamen auf Stream erstellen.
Geben Sie auf der Seite Erste Schritte im Feld Stream-Name den Namen für den Stream ein. Eine eindeutige Kennung wird automatisch eingefügt.
Wählen Sie im Abschnitt Details zum Instanznutzerkonto angeben die Authentifizierungsmethode aus:
IAM-Datenbankauthentifizierung: Diese Option ist verfügbar, wenn Ihrem Nutzer die IAM-Hauptidentität (Identity and Access Management) zugewiesen ist. Weitere Informationen finden Sie unter IAM-Hauptkonten. Wenn Sie diese Option auswählen, müssen Sie Ihrem Nutzer die Rolle
cloudsqlsuperuserund die BerechtigungCREATEROLEmanuell zuweisen:- Wechseln Sie in der Google Cloud Console zur Seite Cloud SQL-Instanzen.
- Wählen Sie Ihre Cloud SQL-Instanz aus.
- Klicken Sie im Navigationsmenü auf Cloud SQL Studio und melden Sie sich an.
- Führen Sie im Bereich Explorer die folgende Abfrage für Ihren Nutzer aus:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE;
- Integrierte Datenbankauthentifizierung: Geben Sie den Nutzernamen und das Passwort eines Nutzers mit der Rolle
cloudsqlsuperuseran. Wenn Sie diese Option auswählen, muss der Nutzer die BerechtigungenGRANTfür die Tabellen haben, die er replizieren möchte.
Sehen Sie sich zusätzliche Streamdetails wie Region, Verschlüsselung und Labels an. Maximieren Sie den Bereich Zusätzliche Streamdetails, um bei Bedarf Änderungen vorzunehmen.
Klicken Sie auf Weiter.
Quelle konfigurieren
- Wählen Sie auf der Seite Streamquelle konfigurieren die Datenbank aus, aus der Sie Daten replizieren möchten.
- In der Liste Einzuschließende Objekte sind standardmäßig alle verfügbaren Objekte ausgewählt. Die Objekte in der Liste sind die Objekte, für die Sie die erforderlichen Berechtigungen zum Streamen haben. Wenn Sie die ausgewählten Objekte ändern möchten, passen Sie die Auswahl in der Liste an.
- Überprüfen Sie erweiterte Streamkonfigurationen wie den Backfill-Modus und die maximale Anzahl gleichzeitiger Backfill-Verbindungen. Maximieren Sie den Abschnitt Erweiterte Streamkonfigurationen, um bei Bedarf Änderungen vorzunehmen.
- Klicken Sie auf Weiter.
Ziel konfigurieren
- Passen Sie auf der Seite Ziel konfigurieren die BigQuery-Zieleinstellungen nach Bedarf an. Weitere Informationen finden Sie unter Informationen zum Ziel für den Stream konfigurieren.
Stream erstellen und starten
Klicken Sie auf Erstellen und später starten, um den Stream zu erstellen und später in Datastream zu starten, oder auf Starten, um den Stream sofort zu erstellen und zu starten.
Sie werden über die Aufgaben benachrichtigt, die automatisch für Sie ausgeführt werden:
- Datastream erstellt die erforderlichen Virtual Private Cloud-Ressourcen wie den internen IP-Adressbereich, das Subnetzwerk und den Netzwerkanhang.
- Datastream konfiguriert Tabellen für CDC, richtet Replikationsslots ein, richtet eine Publikation für alle Tabellen in der Datenbank ein und erstellt einen dedizierten Datastream-Nutzer.
- Datastream erstellt eine Konfiguration für private Verbindungen sowie Quell- und Zielverbindungsprofile.
Bestätigen Sie, dass Sie den Stream erstellen oder erstellen und starten möchten.
Stream überwachen
Sie können grundlegende Streamdetails auf der Übersichtsseite der Quellinstanz in der Google Cloud Console überwachen. Auf der Seite werden Informationen wie der Streamstatus, der Streamname, das BigQuery-Zieldataset und die Kennung des Zielprojekts angezeigt.
Auf der Übersichtsseite können Sie auch Aktionen wie das Starten, Beenden oder Pausieren des Streams ausführen. Wenn Sie detailliertere Informationen zum Monitoring benötigen, klicken Sie auf den Streamnamen, um zu Datastream zu gelangen.
Stream löschen
Wenn Sie einen Stream löschen, den Sie mit dem automatisierten Ablauf erstellt haben, werden einige Ressourcen wie der PostgreSQL-Replikationsslot automatisch gelöscht. Es gibt jedoch Ressourcen, die Sie manuell löschen müssen:
- Die Publikation. Die Publikation wird mit dem Datenbankadministratornutzer erstellt und kann nur von ihrem Inhaber gelöscht werden, also standardmäßig von dem Nutzer, der sie erstellt hat.
- Der Datastream Reader-Nutzer.
- Die Datastream-Verbindungsprofile für Quelle und Ziel
- Die Ressourcen für private Verbindungen.
- Alle Netzwerkressourcen, die während des automatisierten Ablaufs erstellt wurden, z. B. das Subnetz und die Netzwerkverbindung.