Utilizza il modello di flusso delle modifiche di Bigtable a BigQuery

In questa guida rapida imparerai a configurare una tabella Bigtable con un flusso di modifiche abilitato, eseguire una pipeline di flussi di modifiche, apportare modifiche alla tabella e visualizzare le modifiche trasmesse in streaming.

Prima di iniziare

  1. Nella console Google Cloud , nella pagina di selezione del progetto, seleziona o crea un progetto Google Cloud .

    Ruoli richiesti per selezionare o creare un progetto

    • Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto per il quale ti è stato concesso un ruolo.
    • Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto (roles/resourcemanager.projectCreator), che contiene l'autorizzazione resourcemanager.projects.create. Scopri come concedere i ruoli.

    Vai al selettore di progetti

  2. Verifica che la fatturazione sia abilitata per il tuo progetto Google Cloud .

  3. Abilita le API Dataflow, API Cloud Bigtable, API Cloud Bigtable Admin e API BigQuery.

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    Abilita le API

  4. Nella console Google Cloud , attiva Cloud Shell.

    Attiva Cloud Shell

Crea un set di dati BigQuery

Utilizza la console Google Cloud per creare un set di dati in cui sono archiviati i dati.

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, fai clic sul nome del progetto.

  3. Espandi l'opzione Azioni di e fai clic su Crea set di dati.

  4. Nella pagina Crea set di dati, segui questi passaggi:

    1. In ID set di dati, inserisci bigtable_bigquery_quickstart.
    2. Lascia invariate le restanti impostazioni predefinite e fai clic su Crea set di dati.

Crea una tabella con un flusso di modifiche abilitato

  1. Nella console Google Cloud , vai alla pagina Istanze di Bigtable.

    Vai a Istanze

  2. Fai clic sull'ID dell'istanza che utilizzi per questa guida rapida.

    Se non hai un'istanza disponibile, creane una con le configurazioni predefinite in una regione vicina.

  3. Nel riquadro di navigazione a sinistra, fai clic su Tabelle.

  4. Fai clic su Crea una tabella.

  5. Assegna un nome alla tabella bigquery-changestream-quickstart.

  6. Aggiungi una famiglia di colonne denominata cf.

  7. Seleziona Abilita flusso di modifiche.

  8. Fai clic su Crea.

  9. Nella pagina Tabelle di Bigtable, trova la tua tabella bigquery-changestream-quickstart.

  10. Nella colonna Stream di modifiche, fai clic su Connetti.

  11. Nella finestra di dialogo, seleziona BigQuery.

  12. Fai clic su Crea job Dataflow.

  13. Nei campi dei parametri forniti, inserisci i valori dei parametri. Non devi fornire parametri facoltativi.

    1. Imposta l'ID profilo dell'applicazione Bigtable su default.
    2. Imposta il set di dati BigQuery su bigtable_bigquery_quickstart.
  14. Fai clic su Esegui job.

  15. Attendi che lo stato del job sia Avvio o In esecuzione prima di procedere. Una volta messo in coda, il job richiede circa 5 minuti.

  16. Mantieni aperto il job in una scheda, in modo da poterlo arrestare durante la pulizia delle risorse.

Scrivere alcuni dati in Bigtable

  1. In Cloud Shell, scrivi alcune righe in Bigtable in modo che il log delle modifiche possa scrivere alcuni dati in BigQuery. Se scrivi i dati dopo la creazione del job, le modifiche vengono visualizzate. Non devi attendere che lo stato del job diventi running.

    cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \
        set bigquery-changestream-quickstart user123 cf:col1=abc
    cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \
        set bigquery-changestream-quickstart user546 cf:col1=def
    cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \
        set bigquery-changestream-quickstart user789 cf:col1=ghi
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto che stai utilizzando
    • BIGTABLE_INSTANCE_ID: l'ID dell'istanza che contiene la tabella bigquery-changestream-quickstart

Visualizza i log delle modifiche in BigQuery

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e il set di dati bigtable_bigquery_quickstart.

  3. Fai clic sulla tabella bigquery-changestream-quickstart_changelog.

  4. Per visualizzare il registro modifiche, fai clic su Anteprima.

    Anteprima del log delle modifiche in BigQuery

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

  1. Disattiva il flusso di modifiche nella tabella:

    gcloud bigtable instances tables update bigquery-changestream-quickstart \
    --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \
    --clear-change-stream-retention-period
    
  2. Elimina la tabella bigquery-changestream-quickstart:

    cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstart
    
  3. Arresta la pipeline di modifiche in tempo reale:

    1. Nella console Google Cloud , vai alla pagina Job di Dataflow.

      Vai a Job

    2. Seleziona il tuo lavoro di streaming dall'elenco dei lavori.

    3. Nella navigazione, fai clic su Stop.

    4. Nella finestra di dialogo Arresta job, seleziona Annulla, quindi fai clic su Arresta job.

  4. Elimina il set di dati BigQuery:

    1. Nella console Google Cloud , vai alla pagina BigQuery.

      Vai a BigQuery

    2. Nel riquadro Spazio di esplorazione, trova il set di dati bigtable_bigquery_quickstart e fai clic.

    3. Fai clic su Elimina, digita delete e poi fai clic su Elimina per confermare.

  5. (Facoltativo) Elimina l'istanza se ne hai creata una nuova per questa guida rapida:

    cbt deleteinstance BIGTABLE_INSTANCE_ID
    

Passaggi successivi