Crea y ejecuta un notebook con la galería de notebooks

Comienza a analizar datos con la galería de notebooks en BigQuery Studio.

Antes de comenzar

  1. Accede a tu Google Cloud cuenta de. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  6. Habilita la API de BigQuery.

    Roles necesarios para habilitar las APIs

    Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (roles/serviceusage.serviceUsageAdmin), que contiene el permiso serviceusage.services.enable. Obtén más información para otorgar roles.

    Habilitar la API

    Para los proyectos nuevos, la API de BigQuery se habilita de forma automática.

  7. Opcional: Habilita la facturación para el proyecto. Si no deseas habilitar la facturación ni proporcionar una tarjeta de crédito, los pasos que se indican en este documento seguirán funcionando. BigQuery proporciona una zona de pruebas para realizar los pasos. Para obtener más información, consulta Habilita la zona de pruebas de BigQuery.

Roles obligatorios

Para obtener los permisos que necesitas para crear un notebook de ejecución, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Si no conoces los notebooks en BigQuery, consulta los permisos necesarios en la página Crea notebooks.

La galería de notebooks es un centro principal para descubrir y usar plantillas de notebooks precompiladas. Estas plantillas te permiten realizar tareas comunes, como la preparación, el análisis y la visualización de datos. Las plantillas de notebooks también te ayudan a explorar las funciones de BigQuery Studio, administrar flujos de trabajo y promover prácticas recomendadas.

Puedes usar plantillas de la galería de notebooks para optimizar todo el flujo de trabajo de intención a estadísticas en cada etapa del ciclo de vida de los datos, desde la transferencia y la exploración hasta el análisis avanzado y BigQuery ML.

La galería de notebooks proporciona plantillas para todos los niveles de habilidad. La galería incluye plantillas fundamentales para SQL, Python, Apache Spark y DataFrames. También puedes explorar temas como la IA generativa y el análisis de datos multimodales en BigQuery.

Para obtener más información sobre el uso de plantillas de la galería de notebooks, consulta Crea un notebook con la galería de notebooks.

En el siguiente ejemplo, se usa la plantilla Introducción a los notebooks en BigQuery Studio. En este notebook, se muestra cómo realizar las siguientes tareas:

  • Consultar datos: Ejecuta consultas con celdas de SQL.
  • Visualizar los resultados de las consultas: Crea visualizaciones sin código con celdas de visualización.
  • Limpiar y transformar datos: Ordena, anula la duplicación y filtra tus datos con la API de BigQuery DataFrames (Pandas).
  • Ejecutar predicciones de IA: Genera predicciones con la (AI.FORECAST función) en BigQuery DataFrames. La función AI.FORECAST usa el modelo de base TimesFM para generar predicciones directamente desde un conjunto de datos sin necesidad de entrenamiento de modelos.
  • Trazar datos: Traza datos con las bibliotecas de visualización integradas de Python. Los datos se trazan con la biblioteca de visualización de BigQuery DataFrames, con tecnología de Matplotlib y Pandas.

Para usar el notebook, abre la plantilla, conviértela en un notebook ejecutable, conéctate al entorno de ejecución del notebook y, luego, ejecuta el notebook.

Abre la plantilla y conviértela en un notebook ejecutable

Antes de poder usar un notebook creado a partir de una plantilla de la galería de notebooks, debes convertir la plantilla en un notebook ejecutable.

Para abrir la plantilla Introducción a los notebooks en BigQuery Studio en la galería de notebooks y convertirla en un notebook ejecutable, sigue estos pasos:

  1. Ve a la página de Studio.

    Ir a Studio

  2. Haz clic en la flecha desplegable y, luego, elige Notebook > Todas las plantillas.

  3. Como alternativa, en la página principal de BigQuery Studio, haz clic en Ver galería de notebooks.

    El vínculo Ver galería de notebooks en la página principal de BigQuery Studio

  4. Haz clic en la tarjeta Introducción a los notebooks en BigQuery Studio o búscalo en la galería.

  5. Después de que se abra la plantilla, haz clic en Usar esta plantilla para convertirla en un notebook ejecutable.

Conéctate al entorno de ejecución predeterminado

Antes de poder ejecutar el notebook, debes conectarlo a un entorno de ejecución de Vertex AI. Un entorno de ejecución es un recurso de procesamiento que ejecuta el código en tu notebook. El entorno de ejecución debe estar en la misma región que tu notebook.

Para obtener más información sobre los entornos de ejecución, consulta Entornos de ejecución y plantillas de entorno de ejecución. Para obtener más información sobre la configuración regional, consulta Configura la región predeterminada para los elementos de código assets.

En este instructivo, usarás el entorno de ejecución predeterminado. El entorno de ejecución predeterminado es un entorno de ejecución preestablecido que requiere una configuración mínima. Para conectarte al entorno de ejecución predeterminado, sigue estos pasos:

  1. Con el notebook abierto, haz clic en Conectar.

    Es posible que la conexión al entorno de ejecución predeterminado tarde varios minutos si aún no tienes un entorno de ejecución activo.

  2. Cuando el entorno de ejecución esté listo, verás una marca de verificación con gráficos de RAM y disco. Si colocas el cursor sobre los gráficos, verás el tipo de entorno de ejecución y su configuración.

    La configuración del tiempo de ejecución predeterminado

Ejecuta el notebook

Introducción a los notebooks en BigQuery Studio contiene texto, SQL, visualización y celdas de código. Las celdas que no son de texto se pueden ejecutar de forma individual o puedes ejecutar todas las celdas en orden de la primera a la última.

En este instructivo, ejecutarás las celdas del notebook de forma individual para que puedas ver los resultados por etapas. Para ejecutar el notebook, haz lo siguiente:

  1. En la sección Consulta tus datos con celdas de SQL, coloca el cursor sobre la celda de SQL, y, luego, haz clic en Ejecutar celda.

    El botón de ejecución de la celda SQL

    Esta celda de SQL consulta la tabla bigquery-public-data.epa_historical_air_quality.pm25_frm_daily_summary en el conjunto de datos público de Historical Air Quality y muestra el promedio diario de PM2.5 (una métrica común de calidad del aire) para San Francisco en los últimos años.

  2. Observa los resultados. Los resultados de la consulta se muestran en un DataFrame.

    Los resultados de la consulta en BigQuery DataFrames

  3. En la sección Visualiza datos, coloca el cursor sobre la celda de visualización y, luego, haz clic en Ejecutar celda.

  4. Observa la visualización generada.

    El gráfico generado por la celda de visualización

    El resultado muestra un gráfico de series temporales que traza los valores promedio diarios de PM2.5 en el DataFrame df que generaste anteriormente. En este gráfico, se muestra la tendencia en los niveles de PM2.5 a lo largo del tiempo.

  5. En la sección Limpia los datos , coloca el cursor sobre la celda de código y, luego, haz clic en Ejecutar celda.

  6. Observa los resultados. Los resultados se muestran en un DataFrame.

    Los resultados en un DataFrame de BigQuery

    El código hace lo siguiente:

    • Importa la biblioteca bigframes.pandas.
    • Asegúrate de que el campo date_local sea una marca de tiempo.
    • Ordena los resultados por fecha, lo que es necesario para la previsión.
    • Quita las filas duplicadas.
    • Quita las filas en las que avg_pm25 es null.
    • Filtra los valores atípicos.
    • Muestra los resultados en un BigQuery DataFrames llamado df_cleaned.
  7. En la sección Predice valores con AI.FORECAST, coloca el cursor sobre la celda de SQL y, luego, haz clic en Ejecutar celda.

  8. Observa los resultados. Los resultados de la consulta se muestran en un DataFrame.

    Los resultados que produce la función `AI.FORECAST`

    Esta celda de SQL ejecuta una consulta que usa la función AI.FORECAST para predecir el promedio diario futuro de PM2.5 con el DataFrame df_cleaned que generaste anteriormente.

  9. En la sección Visualiza datos con Python, coloca el cursor sobre la celda de código, y, luego, haz clic en Ejecutar celda.

  10. Observa los resultados. Los resultados se muestran en un gráfico.

    El gráfico generado por la celda de código de Python

    El código de Python hace lo siguiente:

    • Importa el módulo datetime.
    • Traza primero los datos históricos y obtén los ejes.
    • Traza los datos previstos en los mismos ejes.
    • Traza el intervalo de confianza.

    Esta visualización se asemeja al trazado estándar de Python, pero df_cleaned.plot es un comando de BigQuery DataFrames. El comando recupera solo los datos necesarios (una muestra) para renderizar el gráfico, no todo el conjunto de datos.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu Google Cloud cuenta de por los recursos que usaste en esta página.

  1. En la Google Cloud consola, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que tú quieres borrar y haz clic en Borrar.
  3. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Como alternativa, para conservar el proyecto y borrar los recursos que se usaron en este instructivo, sigue estos pasos:

  1. Ve a la página de Studio.

    Ir a Studio

  2. En el panel izquierdo, expande tu proyecto y, luego, haz clic en Notebooks.

  3. Para el notebook que borras, haz clic en Abrir acciones > Borrar.

  4. En el diálogo Borrar notebook, haz clic en Borrar para confirmar.

¿Qué sigue?

Para ejecutar otras plantillas de notebooks de muestra en la galería de notebooks, consulta lo siguiente:

Para obtener más información sobre DataFrames, consulta lo siguiente:

Para obtener más información sobre la IA generativa y las funciones de AA en BigQuery, consulta la descripción general de la IA generativa.