Puedes explorar los resultados de las consultas de BigQuery con cuadernos de Colab Enterprise en BigQuery.
En este tutorial, consultarás datos de un conjunto de datos público de BigQuery y explorarás los resultados de la consulta en un cuaderno.
Permisos obligatorios
Para crear y ejecutar cuadernos, necesitas los siguientes roles de Gestión de Identidades y Accesos (IAM):
- Usuario de BigQuery (
roles/bigquery.user
) - Usuario de tiempo de ejecución de cuaderno (
roles/aiplatform.notebookRuntimeUser
) - Creador de código (
roles/dataform.codeCreator
)
Abrir los resultados de una consulta en un cuaderno
Puedes ejecutar una consulta de SQL y, a continuación, usar un cuaderno para explorar los datos. Este método es útil si quieres modificar los datos de BigQuery antes de trabajar con ellos o si solo necesitas un subconjunto de los campos de la tabla.
En la Google Cloud consola, ve a la página BigQuery.
En el campo Escribe para buscar, introduce
bigquery-public-data
.Si no aparece el proyecto, introduce
bigquery
en el campo de búsqueda y, a continuación, haz clic en Buscar en todos los proyectos para buscar la cadena en los proyectos.Selecciona bigquery-public-data > ml_datasets > penguins.
En la tabla penguins (pingüinos), haga clic en
Ver acciones y, a continuación, en Consulta.Añade un asterisco (
*
) para seleccionar el campo en la consulta generada, de modo que quede como en el ejemplo siguiente:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Haz clic en
Ejecutar.En la sección Resultados de la consulta, haga clic en Explorar datos y, a continuación, en Explorar con cuaderno de Python.
Preparar el cuaderno para usarlo
Prepara el cuaderno para usarlo conectándote a un tiempo de ejecución y definiendo los valores predeterminados de la aplicación.
- En el encabezado del cuaderno, haz clic en Conectar para conectarte al tiempo de ejecución predeterminado.
- En el bloque de código Configuración, haz clic en Ejecutar celda.
Explora los datos disponibles
- Para cargar los datos de penguins en un DataFrame de BigQuery y mostrar los resultados, haz clic en Ejecutar celda en el bloque de código de la sección Conjunto de resultados cargado de la tarea de BigQuery como DataFrame.
- Para obtener métricas descriptivas de los datos, haz clic en Ejecutar celda en el bloque de código de la sección Mostrar estadísticas descriptivas con describe().
- Opcional: Usa otras funciones o paquetes de Python para explorar y analizar los datos.
En el siguiente ejemplo de código se muestra cómo usar bigframes.pandas
para analizar datos y bigframes.ml
para crear un modelo de regresión lineal a partir de los datos de pingüinos de un DataFrame de BigQuery: