Questa pagina descrive come creare uno stream utilizzando il flusso di configurazione automatica.
La configurazione automatica dello stream semplifica il processo di spostamento dei dati dai Google Cloud database gestiti a BigQuery riducendo il numero di passaggi da eseguire. Il flusso consente di creare uno stream direttamente dalla pagina di panoramica delle istanze Cloud SQL. Datastream automatizza la protezione della connessione VPC tra lo stream e il database di origine, creando configurazioni di database e risorse di connessione dello stream.
Prima di iniziare
- Abilita le API Datastream, Connettività di rete e Compute Engine.
- Assicurati di disporre delle autorizzazioni di Identity and Access Management (IAM) necessarie per creare e gestire le risorse Datastream. Per maggiori dettagli, consulta la sezione che segue.
- Crea e configura un database Cloud SQL di origine per la replica. Per saperne di più, consulta Configurare le origini.
- Assicurati che il database di origine sia configurato per utilizzare l'accesso privato ai servizi.
Per le istanze Cloud SQL per PostgreSQL: ti consigliamo di abilitare la replica logica per l'istanza prima di creare lo stream. Se non abiliti la replica logica, Datastream la abilita per te, il che riavvia l'istanza di origine.
Per le istanze Cloud SQL per MySQL: abilita il recupero point-in-time per la tua istanza Cloud SQL per MySQL e assicurati che la versione del database sia 8.0.14 o successive. Quando utilizzi la configurazione automatica dello stream, Datastream supporta l'abilitazione del recupero point-in-time solo nel livello di backup Standard.
Per le istanze Cloud SQL per SQL Server: assicurati che Datastream supporti la versione di SQL Server utilizzata dall'istanza.
Autorizzazioni obbligatorie
Per utilizzare il flusso di creazione automatica dello stream, devi disporre dei seguenti ruoli o autorizzazioni di Identity and Access Management (IAM):
serviceusage.services.enable,compute.networkAdminper abilitare le API richieste ed eseguire attività di configurazione della rete.cloudsql.adminper le attività di configurazione dell'istanza.datastream.adminper le attività di amministrazione che Datastream esegue per tuo conto.
Autorizzazioni aggiuntive richieste per Cloud SQL per PostgreSQL
Per le istanze Cloud SQL per PostgreSQL, l'utente amministratore del database deve disporre anche delle autorizzazioni
GRANTper lo schema di cui vuoi eseguire la replica e di alcune autorizzazioni aggiuntive per le attività amministrative e strutturali all'interno del database di origine. Connettiti al database di origine ed esegui quanto segue:GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE; GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to
"USER_NAME" WITH GRANT OPTION; ALTER DEFAULT PRIVILEGES IN SCHEMA "SCHEMA_NAME" GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION; GRANT CREATE ON DATABASE "DATABASE_NAME" TO "USER_NAME"; Le tabelle future vengono aggiunte automaticamente allo stream solo se vengono create dall'utente di cui fornisci i dettagli dell'account per l'autenticazione durante il flusso automatico. Se una tabella futura viene creata da un altro utente, quest'ultimo deve concedere esplicitamente all'utente Datastream Reader l'autorizzazione
SELECTsulla tabella.
Creare e avviare lo stream
Per creare e avviare uno stream:
Console
Inizia
Vai alla pagina di panoramica dell'istanza del database Cloud SQL di origine.
Nella sezione Trasmetti flussi di dati in BigQuery, fai clic su Crea stream.
Nella pagina Inizia, fornisci il nome dello stream nel campo Nome stream. Un identificatore univoco viene compilato automaticamente.
Nella sezione Fornisci i dettagli dell'account utente dell'istanza, seleziona il metodo di autenticazione:
Autenticazione del database IAM: questa opzione è disponibile se all'utente è stata assegnata l'identità dell'entità di Identity and Access Management (IAM) Per saperne di più, consulta Entità IAM. Se selezioni questa opzione, devi concedere manualmente il ruolo
cloudsqlsuperusere l'autorizzazioneCREATEROLEal tuo utente:- Nella Google Cloud console, vai alla pagina Istanze Cloud SQL.
- Seleziona l'istanza Cloud SQL.
- Nel menu di navigazione, fai clic su Cloud SQL Studio ed esegui l'accesso.
- Nel riquadro Explorer, esegui la seguente query per il tuo utente:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE;
- Autenticazione del database integrata: fornisci il nome utente e la
password di un utente con il ruolo
cloudsqlsuperuser. Se selezioni questa opzione, assicurati che l'utente disponga delle autorizzazioniGRANTsulle tabelle di cui vuole eseguire la replica.
Esamina i dettagli aggiuntivi dello stream, come regione, criptaggio ed etichette. Espandi la sezione Dettagli aggiuntivi dello stream per applicare le modifiche, se necessario.
Fai clic su Continua.
Configura origine
Nella pagina Configura l'origine dello stream, seleziona il database di cui vuoi eseguire la replica dei dati.
L'elenco Oggetti da includere seleziona per impostazione predefinita tutti gli oggetti disponibili. Gli oggetti nell'elenco sono quelli per cui disponi delle autorizzazioni necessarie per lo streaming. Per modificare gli oggetti selezionati, modifica le selezioni nell'elenco.
Esamina le configurazioni avanzate dello stream, come la modalità di backfill e il numero massimo di connessioni di backfill simultanee. Espandi la sezione Configurazioni avanzate dello stream per applicare le modifiche, se necessario.
Fai clic su Continua.
Configura destinazione
- Nella pagina Configura destinazione, modifica le impostazioni della destinazione BigQuery, se necessario. Per saperne di più, consulta Configurare le informazioni sulla destinazione dello stream.
Creare e avviare lo stream
Fai clic su Crea e avvia più tardi per creare lo stream e avviarlo in un secondo momento in Datastream oppure su Avvia per creare e avviare subito lo stream.
Riceverai una notifica delle attività eseguite automaticamente per te:
- Datastream crea le risorse Virtual Private Cloud richieste, come l'intervallo di indirizzi IP interni, la subnet e il collegamento di rete.
- Datastream configura le tabelle per CDC, configura gli slot di replica, configura una pubblicazione per tutte le tabelle del database e crea un utente Datastream dedicato.
- Datastream crea una configurazione di connettività privata e profili di connessione di origine e destinazione.
Conferma di voler creare o creare e avviare lo stream.
Monitorare lo stream
Puoi monitorare i dettagli di base dello stream dalla pagina di panoramica dell'istanza di origine in la Google Cloud consolle. La pagina mostra informazioni come lo stato dello stream, il nome dello stream, il set di dati BigQuery di destinazione e l'identificatore del progetto di destinazione.
Dalla pagina di panoramica puoi anche eseguire azioni come avviare o mettere in pausa lo stream. Per informazioni di monitoraggio più granulari, fai clic sul nome dello stream per passare a Datastream.
Eliminare lo stream
Quando elimini uno stream creato utilizzando il flusso automatico, alcune risorse, come lo slot di replica PostgreSQL, vengono eliminate automaticamente. Tuttavia, ci sono risorse che devi eliminare manualmente:
- La pubblicazione. La pubblicazione viene creata utilizzando l'utente amministratore del database e può essere eliminata solo dal suo proprietario, quindi per impostazione predefinita dall'utente che l'ha creata.
- L'utente Datastream Reader.
- I profili di connessione di origine e destinazione di Datastream
- Le risorse di connettività privata.
- Tutte le risorse di rete create durante il flusso automatico, come la subnet e il collegamento di rete.
Passaggi successivi
- Scopri come creare uno stream manualmente.
- Scopri di più su come monitorare gli stream.