Puedes explorar los resultados de consultas de BigQuery con los notebooks de Colab Enterprise en BigQuery.
En este instructivo, consultarás datos de un conjunto de datos públicos de BigQuery y explorarás los resultados de las consultas en un notebook.
Permisos necesarios
Para crear y ejecutar notebooks, necesitas los siguientes roles de Identity and Access Management (IAM):
- Usuario de BigQuery (
roles/bigquery.user
) - Usuario del entorno de ejecución del notebook (
roles/aiplatform.notebookRuntimeUser
) - Creador de código (
roles/dataform.codeCreator
)
Abre los resultados de una consulta en un notebook
Puedes ejecutar una consulta en SQL y, luego, usar un notebook para explorar los datos. Este enfoque es útil si deseas modificar los datos en BigQuery antes de trabajar con ellos, o si solo necesitas un subconjunto de los campos de la tabla.
En la consola de Google Cloud , ve a la página BigQuery.
En el campo Comienza a escribir para buscar, ingresa
bigquery-public-data
.Si no se muestra el proyecto, ingresa
bigquery
en el campo de búsqueda y, luego, haz clic en Ampliar la búsqueda a todos los proyectos para que la string de búsqueda coincida con los conjuntos de datos existentes.Selecciona bigquery-public-data > ml_datasets > pingüinos.
Para la tabla pingüinos, haz clic en
Ver acciones y, luego, en Consultar.Agrega un asterisco (
*
) para la selección de campos a la consulta generada, de modo que se lea como el siguiente ejemplo:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Haz clic en
Ejecutar.En la sección Resultados de la consulta, haz clic en Explorar datos y, luego, en Explorar con el notebook de Python.
Prepara el notebook para usarlo
Prepara el notebook para usarlo a través de la conexión a un entorno de ejecución y la configuración de valores predeterminados de la aplicación.
- En el encabezado del notebook, haz clic en Conectar para conectarte al entorno de ejecución predeterminado.
- En el bloque de código Configuración, haz clic en Ejecutar celda.
Explore los datos
- Para cargar los datos de los pingüinos en un DataFrame de BigQuery y mostrar los resultados, haz clic en Ejecutar celda en la bloque de código en la sección Conjunto de resultados cargado desde un trabajo de BigQuery como un DataFrame.
- Para obtener métricas descriptivas de los datos, haz clic en Ejecutar celda en el bloque de código de la sección Mostrar estadísticas descriptivas mediante describe().
- Opcional: Usa otras funciones o paquetes de Python para explorar y analizar los datos.
En el siguiente ejemplo de código, se muestra cómo usar bigframes.pandas
para analizar datos y bigframes.ml
a fin de crear un modelo de regresión lineal de pingüinos en un DataFrame de BigQuery: