Gestire le sessioni e l'I/O di BigQuery DataFrames
Questo documento spiega come gestire le sessioni ed eseguire operazioni di input e output (I/O) quando utilizzi BigQuery DataFrames. Imparerai a creare e utilizzare le sessioni, a lavorare con i dati in memoria e a leggere e scrivere file e tabelle BigQuery.
Sessioni BigQuery
BigQuery DataFrames utilizza internamente un oggetto sessione locale per gestire i metadati. Ogni DataFrame e Series oggetto si connette a una sessione, ogni
sessione si connette a una località, e ogni query in una
sessione viene eseguita nella località in cui hai creato la sessione. Utilizza il seguente esempio di codice per creare manualmente una sessione e utilizzarla per caricare i dati:
Non puoi combinare i dati di più istanze di sessione, anche se le inizializzi con le stesse impostazioni. Il seguente esempio di codice mostra che il tentativo di combinare i dati di istanze di sessione diverse genera un errore:
Sessione globale
BigQuery DataFrames fornisce una sessione globale predefinita a cui puoi
accedere con il bigframes.pandas.get_global_session() metodo. In
Colab, devi fornire un ID progetto per l'attributo
bigframes.pandas.options.bigquery.project prima di utilizzarlo. Puoi
anche impostare una località con l'
bigframes.pandas.options.bigquery.location attributo, che per impostazione predefinita è
la US multi-regione.
Il seguente esempio di codice mostra come impostare le opzioni per la sessione globale:
Per reimpostare la località o il progetto della sessione globale, chiudi la sessione corrente eseguendo il
metodo bigframes.pandas.close_session().
Molte funzioni integrate di BigQuery DataFrames utilizzano la sessione globale per impostazione predefinita. Il seguente esempio di codice mostra come le funzioni integrate utilizzano la sessione globale:
Dati in memoria
Puoi creare oggetti DataFrames e Series con strutture di dati Python o NumPy
integrate, in modo simile a come crei oggetti con pandas. Utilizza il seguente esempio di codice per creare un oggetto:
Per convertire gli oggetti pandas in oggetti DataFrames utilizzando il metodo read_pandas()
o i costruttori, utilizza il seguente esempio di codice:
Per utilizzare il metodo to_pandas() per caricare i dati di BigQuery DataFrames in
memoria, utilizza il seguente esempio di codice:
Stima dei costi con il parametro dry_run
Il caricamento di una grande quantità di dati può richiedere molto tempo e risorse. Per vedere la quantità di dati elaborati, utilizza il dry_run=True parametro nella
to_pandas() chiamata. Utilizza il seguente esempio di codice per eseguire un'esecuzione di prova:
Leggere e scrivere file
Puoi leggere i dati dai file compatibili in un BigQuery DataFrames. Questi file possono essere sulla tua macchina locale o in Cloud Storage. Utilizza il seguente esempio di codice per leggere i dati da un file CSV:
Per salvare BigQuery DataFrames nei file locali o nei file di Cloud Storage
utilizzando il metodo to_csv, utilizza il seguente esempio di codice:
Leggere e scrivere tabelle BigQuery
Per creare BigQuery DataFrames utilizzando i riferimenti alle tabelle BigQuery
e la funzione bigframes.pandas.read_gbq, utilizza il seguente esempio di codice:
Per utilizzare una stringa SQL con la read_gbq() funzione per leggere i dati in
BigQuery DataFrames, utilizza il seguente esempio di codice:
Per salvare l'oggetto DataFrame in una tabella BigQuery, utilizza il metodo
to_gbq() dell'oggetto DataFrame. Il seguente esempio di codice mostra come eseguire questa operazione:
Passaggi successivi
- Scopri di più su BigQuery DataFrames.
- Scopri come lavorare con i tipi di dati in BigQuery DataFrames.
- Scopri come visualizzare i grafici utilizzando BigQuery DataFrames.
- Esplora il riferimento API di BigQuery DataFrames.