Introduzione alle connessioni
BigQuery consente di creare connessioni esterne per eseguire query sui dati archiviati al di fuori di BigQuery in servizi come Cloud Storage o Spanner o in origini di terze parti come Amazon Web Services (AWS) o Microsoft Azure. Google Cloud Queste connessioni esterne utilizzano l'API BigQuery Connection.
Supponiamo, ad esempio, di archiviare i dettagli degli ordini dei clienti in Cloud SQL e i dati sulle vendite in BigQuery e di voler unire le due tabelle in un'unica query. Puoi creare una connessione Cloud SQL al database esterno utilizzando l'API BigQuery Connection. Con le connessioni, non invii mai le credenziali del database come testo non crittografato.
Una connessione viene criptata e archiviata in modo sicuro nel servizio di connessione BigQuery. Puoi concedere agli utenti l'accesso alle connessioni assegnando loro i ruoli Identity and Access Management (IAM) di connessione BigQuery
Tipi di connessione
BigQuery fornisce diversi tipi di connessione per le seguenti origini dati esterne:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Azure Blob Storage
- Google Cloud Risorse come modelli remoti di Vertex AI, funzioni remote e BigLake
- Spanner
- Cloud SQL
- AlloyDB per PostgreSQL
- SAP Datasphere
Connessioni Amazon S3
Per creare una connessione Amazon S3 con BigQuery Omni, consulta Connettersi ad Amazon S3.
Una volta creata una connessione Amazon S3, puoi:
- Creare tabelle esterne su Amazon S3
- Eseguire query sui dati di Amazon S3
- Esportare i risultati in Amazon S3
- Creare set di dati basati sui database AWS Glue.
Connessioni Spark
Le stored procedure per Spark consentono di eseguire stored procedure scritte in Python utilizzando BigQuery. Una connessione Spark consente di connettersi a Managed Service for Apache Spark ed eseguire le stored procedure per Spark.
Per creare questa connessione, consulta Creare connessioni.
Connessioni Blob Storage
Per creare una connessione Blob Storage con BigQuery Omni, consulta Connettersi a Blob Storage.
Una volta creata una connessione Blob Storage, puoi:
- Creare tabelle esterne basate su Blob Storage
- Eseguire query sui dati di Blob Storage
- Esportare i risultati in Blob Storage
Google Cloud Connessioni alle risorse
Una connessione alle Google Cloud risorse è una connessione per autorizzare l'accesso ad altre Google Cloud risorse come modelli remoti di Vertex AI, funzioni remote e BigLake. Per informazioni dettagliate su come configurare una connessione alle risorse Cloud Google Cloud , consulta Creare e configurare una connessione a una risorsa Cloud.
Una volta creata una connessione alle risorse Google Cloud , puoi creare i seguenti oggetti BigQuery:
- Modelli remoti. Per ulteriori informazioni, consulta l'istruzione CREATE MODEL per i modelli remoti su LLM, l'istruzione CREATE MODEL per i modelli remoti sui servizi AI Cloud e l'istruzione CREATE MODEL per i modelli remoti sui modelli ospitati di Vertex AI.
- Funzioni remote. Le funzioni remote di BigQuery consentono di implementare funzioni con qualsiasi linguaggio supportato in Cloud Run Functions o Cloud Run. Una connessione di funzione remota consente di connettersi a funzioni Cloud Run o Cloud Run ed eseguire queste funzioni. Per creare una connessione di funzione remota BigQuery, consulta Creare una connessione.
- Tabelle BigLake. Le connessioni BigLake collegano le tabelle BigLake a origini dati esterne mantenendo al contempo il controllo dell'accesso e la sicurezza di BigQuery per i dati strutturati e non strutturati in Cloud Storage.
- Tabelle degli oggetti. Per ulteriori informazioni, consulta Introduzione alle tabelle degli oggetti.
Connessioni Spanner
Per creare una connessione Spanner, consulta Connettersi a Spanner.
Una volta creata una connessione Spanner, puoi eseguire query federate.
Connessioni Cloud SQL
Per creare una connessione Cloud SQL, consulta Connettersi a Cloud SQL.
Una volta creata una connessione Cloud SQL, puoi eseguire query federate.
Connessioni AlloyDB
Per creare una connessione AlloyDB, consulta Connettersi ad AlloyDB per PostgreSQL.
Una volta creata una connessione AlloyDB, puoi eseguire query federate.
Connessioni SAP Datasphere
Per creare una connessione SAP Datasphere, consulta Connettersi a SAP Datasphere.
Una volta creata una connessione SAP Datasphere, puoi eseguire query federate.
Audit log
BigQuery registra le richieste di utilizzo e gestione relative alle connessioni. Per ulteriori informazioni, consulta Panoramica degli audit log di BigQuery.
Passaggi successivi
- Scopri come gestire le connessioni.
- Scopri di più sulle connessioni predefinite per il tuo progetto.
- Scopri come analizzare le tabelle degli oggetti utilizzando le funzioni remote.
- Scopri come eseguire query sui dati archiviati:
- Eseguire query sui dati archiviati in Amazon S3.
- Eseguire query sui dati archiviati in Blob Storage.
- Eseguire query sui dati strutturati archiviati in Cloud Storage.
- Eseguire query sui dati non strutturati archiviati in Cloud Storage.
- Eseguire query sui dati archiviati in Spanner.
- Eseguire query sui dati archiviati in Cloud SQL.
- Eseguire query sui dati archiviati in AlloyDB.
- Eseguire query sui dati utilizzando le funzioni remote.
- Eseguire query sui dati non strutturati utilizzando le funzioni remote.
- Eseguire query sui dati utilizzando le stored procedure per Apache Spark.
- Scopri di più sulle tabelle esterne.