Cómo usar celdas de visualización
En esta guía, se describe cómo usar celdas de visualización para visualizar datos desde un notebook de Colab Enterprise.
Las celdas de visualización pueden generar visualizaciones interactivas y editables basadas en los datos de un DataFrame en tu notebook. Puedes configurar una celda de visualización para explorar datos y descubrir estadísticas. Las opciones de configuración de la celda de visualización incluyen las siguientes:
- Especifica qué campos se usan en la visualización.
- Selecciona un tipo de gráfico, como un diagrama de dispersión o un gráfico de barras.
- Especifica cómo se agregan los datos.
- Cambia los colores, las etiquetas y el título de tu visualización.
Limitaciones
Ten en cuenta las siguientes limitaciones cuando planifiques tu proyecto:
- Si vuelves a ejecutar una celda de visualización, se restablece la configuración de visualización existente.
- La opción Visualizar en Próximos pasos no siempre aparece cuando se trabaja con DataFrames de pandas.
- Gemini en Colab Enterprise no puede interactuar con las celdas de visualización. Esto significa que Gemini no puede leer ni sugerir cambios en las celdas de visualización, y es posible que no pueda explicar ni ayudar a corregir los errores que generen las celdas de visualización.
Antes de comenzar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Usuario de BigQuery (
roles/bigquery.user
) -
Usuario de Colab Enterprise (
roles/aiplatform.colabEnterpriseUser
) -
En la consola de Google Cloud , ve a la página Mis notebooks de Colab Enterprise.
-
En el menú Región, selecciona la región que contiene el notebook.
-
Haz clic en el notebook que quieras abrir. Si aún no creaste un notebook, crea uno.
-
En la barra de herramientas, para agregar una celda de SQL, haz clic en el menú
Opciones de insertar celda de código y selecciona Agregar celda de SQL.Se agregará la celda de SQL a tu notebook.
-
En tu celda de SQL, ingresa una consulta en SQL. Por ejemplo, para consultar datos del conjunto de datos públicos de BigQuery sobre pingüinos, puedes ingresar lo siguiente:
SELECT * FROM `bigquery-public-data.ml_datasets.penguins`;
-
Mantén el puntero sobre la celda de SQL y, luego, haz clic en el botón
Ejecutar celda. -
Usa uno de los siguientes métodos para agregar una celda de visualización a tu notebook:
-
En la barra de herramientas, para agregar una celda de visualización, haz clic en el menú
Opciones para insertar celdas de código y selecciona Agregar celda de visualización. -
Mantén el puntero entre dos celdas de tu notebook para indicar dónde quieres agregar la celda de visualización y haz clic en el botón
Visualización.
Se agregará una celda de visualización a tu notebook.
-
-
En la celda de visualización, para seleccionar el DataFrame que deseas visualizar, haz clic en el menú Choose a dataframe y, luego, selecciona df.
-
Mantén el puntero sobre la celda de visualización y, luego, haz clic en el botón
Ejecutar celda.Colab Enterprise genera una visualización predeterminada. Para cambiar la visualización, consulta la siguiente sección.
-
Si hay una sección Próximos pasos debajo de un DataFrame generado, haz clic en el botón Visualizar con DATAFRAME_NAME.
Se agregará una celda de visualización a tu notebook. El DataFrame de la celda anterior se establece automáticamente como la fuente de datos de esta celda de visualización.
-
Mantén el puntero sobre la celda de visualización y, luego, haz clic en el botón
Ejecutar celda.Colab Enterprise genera una visualización predeterminada. Para cambiar la visualización, consulta la siguiente sección.
-
En la celda de visualización, haz clic en el botón Datos para ver los datos subyacentes que se usan en la visualización.
-
Haz clic en el botón Gráfico para volver al modo Gráfico y ver la visualización.
-
Para mostrar u ocultar la configuración, haz clic en el botón
Alternar configuración. -
En el panel de configuración, para seleccionar un tipo de gráfico diferente, haz clic en el menú de tipo de gráfico
y selecciona el tipo de gráfico que desees. Algunos tipos de gráficos solo usan un subconjunto de campos del DataFrame disponible. -
En la pestaña Configuración, selecciona diferentes dimensiones y métricas para cambiar los campos que se usan en la visualización. En general, las dimensiones son campos categóricos en tus datos, y las métricas son valores numéricos.
-
Para cambiar la agregación de una métrica, haz clic en el parámetro de configuración de agregación a la izquierda del nombre de la métrica y, luego, selecciona una agregación diferente.
-
Para cambiar la métrica que se usa para ordenar, haz clic en la métrica Ordenar y selecciona otra. También puedes cambiar la agregación y elegir si deseas ordenar los valores de forma descendente o ascendente.
-
En la pestaña Estilo, puedes cambiar el texto y la apariencia de la visualización, incluidos los siguientes elementos:
- Indica si se deben mostrar u ocultar el título y las etiquetas.
- Texto del título
- Texto de la etiqueta del eje
- Fuente, tamaño y color del texto
- Colores de las métricas visualizadas
-
En la parte superior de la celda de visualización, haz clic en Agregar filtro.
-
Selecciona un campo para filtrar los datos.
-
Para completar el diálogo de filtro, realiza una de las siguientes acciones según el tipo de datos que filtres:
- En el caso de las dimensiones o los datos categóricos, selecciona las categorías que deseas incluir en la visualización.
- En el caso de las métricas o los datos numéricos, ajusta los controles deslizantes a los valores más bajos y más altos que desees incluir en tu visualización.
-
Haz clic en Aplicar.
Obtén más información sobre BigQuery DataFrames.
Usa celdas de SQL en un notebook de Colab Enterprise.
Usar Gemini para explicar y corregir errores
Roles requeridos
Para obtener los permisos que necesitas para crear un notebook de Colab Enterprise, ejecutar el código del notebook en un entorno de ejecución y usar datos de BigQuery en el notebook, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Crea un DataFrame
Para usar una celda de visualización, necesitarás datos almacenados en un DataFrame dentro de tu notebook. Para crear un DataFrame, puedes ejecutar una consulta en SQL en una celda de SQL. Para obtener más información sobre las celdas de SQL, consulta Cómo usar celdas de SQL.
Para ejecutar una consulta en SQL y crear un DataFrame, haz lo siguiente:
El resultado de la consulta se guarda automáticamente en un DataFrame llamado df
.
Crear una visualización
Para crear una visualización a partir de un DataFrame en tu notebook, puedes agregar una celda de visualización y, luego, configurarla para que use un DataFrame específico. O bien, si aparece una sección Próximos pasos debajo de un DataFrame generado, puedes hacer clic en el botón Visualizar con DATAFRAME_NAME.
Agregar celda de visualización
Visualiza con DataFrame
Configura la visualización
Una celda de visualización genera una visualización predeterminada que puedes configurar con el panel lateral de la celda. Las opciones de configuración varían según los datos que uses y el tipo de gráfico de la visualización.
Para ver la configuración de una celda de visualización, haz lo siguiente:
Cómo filtrar los datos en tu visualización
Puedes filtrar los datos de tu visualización según el valor de un campo. Para filtrar los datos, haz lo siguiente: