Utilizzare le celle SQL

Questa guida descrive come utilizzare le celle SQL per eseguire query sui dati da un notebook Colab Enterprise.

Panoramica

Una cella SQL è una cella di codice per scrivere, modificare ed eseguire query SQL all'interno del notebook Colab Enterprise. Le celle SQL forniscono un flusso di lavoro alternativo a IPython Magics per BigQuery.

Funzionalità

Le celle SQL forniscono le seguenti funzionalità:

  • Supporto per dry run: convalida istruzione SQL e approssimazione de l numero di byte elaborati dalla query
  • Formattazione: linting delle parole chiave ed evidenziazione della sintassi
  • Denominazione delle variabili di output di BigQuery DataFrame: fai riferimento alla variabile di output da altre celle del notebook
  • Sostituzione delle variabili: fai riferimento alle variabili Python e alle celle SQL per supportare la parametrizzazione e la possibilità di eseguire query sui risultati di una query precedente
  • Visualizzatore del set di risultati: visualizzatore leggero del set di risultati tabellari con paginazione per set di risultati di grandi dimensioni
  • Integrazione delle celle di visualizzazione: l'output di una cella SQL può essere utilizzato come input per una cella di visualizzazione

Dialetto SQL e origine dati supportati

  • Le celle SQL di Colab Enterprise supportano GoogleSQL.

  • Puoi eseguire query SQL sui dati BigQuery.

Limitazioni

Tieni presente le seguenti limitazioni quando pianifichi il progetto:

  • Puoi eseguire più istruzioni SQL in una singola cella SQL, ma solo i risultati dell'ultima istruzione SQL vengono salvati in un DataFrame.

Prima di iniziare

  1. Accedi al tuo Google Cloud account. Se non hai mai utilizzato Google Cloud, crea un account per valutare il rendimento dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per eseguire, testare e implementare i carichi di lavoro.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare un notebook Colab Enterprise, eseguire il codice del notebook su un runtime e utilizzare i dati BigQuery nel notebook, chiedi all'amministratore di concederti i seguenti ruoli IAM sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Creare una cella SQL

Per creare una cella SQL in Colab Enterprise:

  1. Nella Google Cloud console, vai a alla pagina I miei notebook di Colab Enterprise.

    Vai a I miei notebook

  2. Nel menu Regione, seleziona la regione che contiene il notebook.

  3. Fai clic sul notebook che vuoi aprire. Se non hai ancora creato un notebook, creane uno.

  4. Nella barra degli strumenti, per aggiungere una cella SQL, fai clic sul  menu Opzioni di inserimento della cella di codice e seleziona Aggiungi cella SQL.

    La cella SQL viene aggiunta al notebook.

Inserire ed eseguire una query

  1. Nella cella SQL, inserisci una query SQL. Per una panoramica delle istruzioni e dei dialetti SQL supportati, consulta Introduzione a SQL in BigQuery.

    Puoi fare riferimento alle variabili Python nelle espressioni racchiudendo il nome della variabile tra parentesi graffe ({ }). Ad esempio, se hai specificato un valore in una variabile Python denominata my_threshold, potresti limitare il set di risultati con una query simile alla seguente:

    SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
        
  2. Tieni il puntatore sulla cella SQL che vuoi eseguire, quindi fai clic sul  Esegui cella pulsante.

L'output della query viene salvato automaticamente come BigQuery DataFrame con lo stesso nome del titolo della cella SQL.

Interagire con il set di risultati

Puoi interagire con il set di risultati come BigQuery DataFrame o pandas DataFrame.

Puoi concatenare le istruzioni SQL utilizzando lo stesso nome della variabile della cella SQL. Ad esempio, puoi utilizzare i BigQuery DataFrame generati dal set di risultati come tabelle in una query successiva racchiudendo il nome del DataFrame tra parentesi graffe ({ }). Vedi l'esempio seguente, che fa riferimento all'output di una query precedente salvata come DataFrame denominato df:

SELECT * FROM {df};

Passaggi successivi