Cómo usar celdas de SQL
En esta guía, se describe cómo usar celdas de SQL para consultar datos desde un notebook de Colab Enterprise.
Descripción general
Una celda de SQL es una celda de código para escribir, editar y ejecutar consultas en SQL desde tu cuaderno de Colab Enterprise. Las celdas de SQL proporcionan un flujo de trabajo alternativo a los comandos mágicos de IPython para BigQuery.
Funciones
Las celdas de SQL proporcionan las siguientes capacidades:
- Compatibilidad con la ejecución de prueba: Validación de la instrucción de SQL y una aproximación de la cantidad de bytes que procesa la consulta
- Formato: Sugerencias de palabras clave y resaltado de sintaxis
- Nombres de variables de salida de BigQuery DataFrame: Consulta la variable de salida desde otras celdas del notebook.
- Reemplazo de variables: Consulta las variables de Python y las celdas de SQL para admitir la parametrización y la capacidad de consultar los resultados de una consulta anterior.
- Visor de conjuntos de resultados: Visor de conjuntos de resultados tabulares liviano con paginación para conjuntos de resultados grandes
Dialecto de SQL y fuente de datos compatibles
Las celdas de SQL de Colab Enterprise admiten GoogleSQL.
Puedes ejecutar consultas en SQL sobre los datos de BigQuery.
Limitaciones
Ten en cuenta las siguientes limitaciones cuando planifiques tu proyecto:
- Puedes ejecutar varias instrucciones de SQL en una sola celda de SQL, pero solo los resultados de la última instrucción de SQL se guardan en un DataFrame.
Antes de comenzar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Usuario de BigQuery (
roles/bigquery.user
) -
Usuario de Colab Enterprise (
roles/aiplatform.colabEnterpriseUser
) -
En la consola de Google Cloud , ve a la página Mis notebooks de Colab Enterprise.
-
En el menú Región, selecciona la región que contiene el notebook.
-
Haz clic en el notebook que quieras abrir. Si aún no creaste un notebook, crea uno.
-
En la barra de herramientas, para agregar una celda de SQL, haz clic en el menú
Opciones de insertar celda de código y selecciona Agregar celda de SQL.Se agregará la celda de SQL a tu notebook.
-
En tu celda de SQL, ingresa una consulta en SQL. Para obtener una descripción general de las instrucciones y los dialectos de SQL compatibles, consulta Introducción a SQL en BigQuery.
Puedes hacer referencia a las variables de Python en las expresiones encerrando el nombre de la variable entre llaves (
{ }
). Por ejemplo, si especificaste un valor en una variable de Python llamadamy_threshold
, puedes limitar tu conjunto de resultados con una consulta similar a la siguiente:SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
-
Mantén el cursor sobre la celda de SQL que desees ejecutar y, luego, haz clic en el botón
Ejecutar celda.
Roles requeridos
Para obtener los permisos que necesitas para crear un notebook de Colab Enterprise, ejecutar el código del notebook en un entorno de ejecución y usar datos de BigQuery en el notebook, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Crea una celda de SQL
Para crear una celda de SQL en Colab Enterprise, haz lo siguiente:
Ingresa y ejecuta una consulta
El resultado de la consulta se guarda automáticamente como un DataFrame de BigQuery con el mismo nombre que el título de la celda de SQL.
Interactúa con el conjunto de resultados
Puedes interactuar con el conjunto de resultados como un DataFrame de BigQuery o un DataFrame de pandas.
Puedes encadenar instrucciones de SQL con el mismo nombre de variable de celda de SQL. Por ejemplo, puedes usar los DataFrames de BigQuery generados por el conjunto de resultados como tablas en una consulta posterior. Para ello, encierra el nombre del DataFrame entre llaves ({ }
). Consulta el siguiente ejemplo, que hace referencia al resultado de una consulta anterior que se guardó como un DataFrame llamado df
:
SELECT * FROM {df};