Crear notebooks
En este documento se describe cómo administrar notebooks de Colab Enterprise en BigQuery. Los notebooks son recursos de código de BigQuery Studio con tecnología de Dataform.
Antes de comenzar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. - Usuario de sesión de lectura de BigQuery (
roles/bigquery.readSessionUser
) Usuario de BigQuery Studio (
roles/bigquery.studioUser
) El rol de usuario de BigQuery Studio combina los siguientes roles de IAM:bigquery.config.get
bigquery.jobs.create
bigquery.readsessions.create
bigquery.readsessions.getData
bigquery.readsessions.update
resourcemanager.projects.get
resourcemanager.projects.list
dataform.locations.get
dataform.locations.list
dataform.repositories.create
dataform.repositories.list
dataform.collections.create
dataform.collections.list
aiplatform.notebookRuntimeTemplates.apply
aiplatform.notebookRuntimeTemplates.get
aiplatform.notebookRuntimeTemplates.list
aiplatform.notebookRuntimeTemplates.getIamPolicy
aiplatform.notebookRuntimes.assign
aiplatform.notebookRuntimes.get
aiplatform.notebookRuntimes.list
aiplatform.operations.list
- Usuario de trabajo de BigQuery (
roles/bigquery.jobUser
) - Usuario de sesión de lectura de BigQuery (
roles/bigquery.readSessionUser
) - Usuario del entorno de ejecución del notebook (
roles/aiplatform.notebookRuntimeUser
) - Editor de código (
roles/dataform.codeEditor
) - Usuario de trabajo de BigQuery (
roles/bigquery.jobUser
) - Usuario de sesión de lectura de BigQuery (
roles/bigquery.readSessionUser
) - Usuario del entorno de ejecución del notebook (
roles/aiplatform.notebookRuntimeUser
) - Visualizador de código (
roles/dataform.codeViewer
) Ve a la página de BigQuery.
En el panel Explorador, busca el proyecto en el que habilitaste los elementos de código.
Haz clic en
Ver acciones junto al proyecto y, luego, en Cambiar mi región de código predeterminada.En Región, selecciona la región que deseas usar para los recursos de código.
Haz clic en Seleccionar.
Ve a la página de BigQuery.
Para abrir la galería, en la barra de pestañas del panel del editor, haz clic en la flecha > Todas las plantillas.
junto a Consulta en SQL y, luego, en NotebookEn la galería de notebooks, selecciona una plantilla. Por ejemplo, puedes seleccionar Introducción a BigQuery DataFrames.
Se abrirá el notebook nuevo, el cual contiene celdas que muestran consultas de ejemplo en el conjunto de datos públicos
bigquery-public-data.ml_datasets.penguins
.Como alternativa, puedes hacer clic en la flecha > Notebook vacío, Notebook > Plantilla de BigQuery o Notebook > Plantilla de Spark para abrir estas plantillas específicas.
junto a Consulta SQL y, luego, en NotebookPara crear un notebook ejecutable a partir de la plantilla, haz clic en Usar esta plantilla.
Opcional: Para ver los detalles del notebook o el historial de versiones, agregar comentarios nuevos, responder a un comentario existente o obtener un vínculo a él, usa la siguiente barra de herramientas:
Las funciones de la barra de herramientas Detalles, Historial de versiones y Comentarios están en versión preliminar. Para enviar comentarios o solicitar asistencia para estas funciones, envía un correo electrónico a bqui-workspace-pod@google.com.
Opcional: En la barra de herramientas, puedes usar el panel Referencia para obtener una vista previa de los detalles del esquema de tablas, instantáneas, vistas o vistas materializadas, o bien abrirlos en una pestaña nueva. El panel también tiene una lista de recursos recientes y destacados.
Ve a la página de BigQuery.
En el panel de la izquierda, haz clic en
Explorar:Si no ves el panel izquierdo, haz clic en
Expandir panel izquierdo para abrirlo.En el panel Explorador, expande tu proyecto, haz clic en Conjuntos de datos y, luego, en tu conjunto de datos.
Haz clic en Descripción general > Tablas y busca la tabla que deseas consultar.
Junto a la tabla, haz clic en > notebook de Python.
Acciones y, luego, en Abrir enSe abrirá el notebook nuevo que contiene celdas que muestran consultas de ejemplo en la tabla seleccionada.
Ve a la página de BigQuery.
En el panel del editor, ejecuta una consulta que genere un resultado.
En el panel Resultados de la consulta, haz clic en Abrir en > Notebook.
Se abrirá el notebook nuevo, que contiene celdas con código para devolver el SQL de la consulta y los resultados de la consulta.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Selecciona un notebook
Haz clic en
Historial de versiones.Haz clic en
Ver acciones junto a la versión de un notebook y, luego, en Abrir como notebook nuevo de Python.Se abrirá una copia del notebook como un notebook nuevo.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:En el panel Explorador, expande tu proyecto y, luego, realiza una de las siguientes acciones:
- Junto a Notebooks, haz clic en > Subir a Notebooks. Ver acciones
- Junto al nombre del proyecto Google Cloud , haz clic en > Subir al proyecto > Notebook. Ver acciones
En el cuadro de diálogo Subir notebook, en el campo Seleccionar notebook, haz clic en Explorar y selecciona el notebook que deseas subir.
En el campo Nombre del notebook, edita el nombre del archivo de notebook (opcional).
En el campo Región, selecciona la región en la que deseas subir tu notebook.
Haz clic en Subir.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Haz clic en el nombre de un notebook para abrirlo.
En el notebook, haz clic en Conectar o ejecuta cualquier celda.
Es posible que la conexión al entorno de ejecución predeterminado tarde varios minutos si aún no tienes un entorno de ejecución activo.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Haz clic en el nombre de un notebook para abrirlo.
En el notebook, haz clic en el menú desplegable
junto a Conectar y, luego, en Conectar a un entorno de ejecución.Haz clic en Conéctate a un entorno de ejecución existente.
En Entornos de ejecución, selecciona el entorno de ejecución que deseas usar. El entorno de ejecución debe estar en la misma ubicación que el notebook.
Haz clic en Conectar.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Haz clic en el nombre de un notebook para abrirlo.
En el notebook, haz clic en el menú desplegable
junto a Conectar y, luego, en Conectar a un entorno de ejecución.Haz clic en Crear un nuevo entorno de ejecución.
En Plantilla del entorno de ejecución, selecciona la plantilla de entorno de ejecución de Vertex AI para usarla.
En Nombre del entorno de ejecución, escribe un nombre para el entorno de ejecución.
Haz clic en Conectar.
- Celda de texto: Usa una celda de texto para agregar explicaciones e imágenes a tu notebook en Markdown.
- Celda de código: Usa una celda de código para agregar Python a tu notebook. Puedes ejecutar cada celda de código de forma individual. Una celda de código puede hacer referencia a cualquier variable creada en otra celda que ya hayas ejecutado.
Celda de SQL (versión preliminar): Usa una celda de SQL para ejecutar consultas de GoogleSQL. El resultado de la consulta se guarda automáticamente como un DataFrame con el mismo nombre que el título de la celda. Puedes ejecutar varias instrucciones de SQL en una sola celda de SQL, pero solo los resultados de la última instrucción se guardan en un DataFrame.
Puedes hacer referencia a variables de Python en expresiones o usar DataFrames de BigQuery como tablas en tu consulta. Para ello, debes incluir el nombre de la variable entre llaves (
{ }
):# Refer to the Python variable my_threshold in a SQL expression. SELECT * FROM my_dataset.my_table WHERE x > {my_threshold}; # Reference previous query results to iterate on your queries. SELECT * FROM {df};
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:Si no ves el panel izquierdo, haz clic en
Expandir panel izquierdo para abrirlo.En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Busca el notebook al que quieres otorgar acceso.
Haz clic en
Abrir acciones junto al notebook y, luego, en Compartir.En el panel Permisos de uso compartido, haz clic en Agregar usuario o grupo.
En el campo Principales nuevas, ingresa una principal.
En la lista Rol, selecciona uno de los siguientes roles:
- Propietario del código: Puede realizar cualquier acción en el notebook, incluida la eliminación o el uso compartido.
- Editor de código: Puede editar el notebook.
- Visualizador de código: Puede ver el notebook.
Opcional: Para ver una lista completa de las funciones y la configuración de uso compartido avanzada, haz clic en Uso compartido avanzado.
Haz clic en Guardar.
Para volver a la página de información del notebook, haz clic en Cerrar.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:Si no ves el panel izquierdo, haz clic en
Expandir panel izquierdo para abrirlo.En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Busca la carpeta que quieras compartir. Puedes usar la función de búsqueda o los filtros para encontrar tu notebook.
Haz clic en > Copiar vínculo.
Ver acciones junto al notebook y, luego, en CompartirComparte el vínculo con otros usuarios.
- Ejecuta el notebook para ver su resultado actual. No se guardó este resultado.
- Visualiza una versión de archivo del notebook y su resultado en el historial de revisión.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:Si no ves el panel izquierdo, haz clic en
Expandir panel izquierdo para abrirlo.En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Haz clic en el notebook en el que deseas inhabilitar el guardado de resultados.
Para expandir la barra de menú, haz clic en keyboard_arrow_down Alternar visibilidad del encabezado.
Haz clic en Editar > Configuración del notebook.
En la ventana Configuración del notebook, selecciona Omitir el resultado de la celda de código cuando guardas este notebook.
Haz clic en Guardar.
Haz clic en Volver a cargar.
- Haz clic en el vínculo
Show diff
. Se abrirá el cuadro de diálogo Revisa los cambios remotos. - Opcional: Para comparar el código fuente del notebook, selecciona la casilla de verificación Fuente sin procesar.
- Opcional: Para comparar las versiones intercaladas en lugar de en paneles separados, selecciona la casilla de verificación Diferencia intercalada.
- Revisa los cambios y decide cuáles conservar. Si es necesario, revisa tu entrada.
- Haz clic en Guardar los cambios.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel de la izquierda, haz clic en
Explorar:En el panel Explorador, expande tu proyecto y haz clic en Notebooks.
Haz clic en el notebook al que quieres cambiarle el nombre.
Haz clic en keyboard_arrow_down Alternar visibilidad del encabezado para expandir la barra de menú.
Haz clic en Archivo > Cambiar nombre.
En el cuadro de diálogo Cambiar nombre de notebook, escribe un nombre para el notebook y, luego, haz clic en Cambiar nombre.
- Obtén más información sobre cómo administrar notebooks.
- Obtén más información para programar notebooks.
Permisos necesarios
Configura los permisos adecuados para crear, editar o ver notebooks.
Todos los usuarios con el rol Administrador de Dataform (roles/dataform.admin
) tienen acceso de propietario a todos los notebooks creados en el proyecto.
Para obtener más información sobre Identity and Access Management (IAM) de BigQuery, consulta Control de acceso con IAM.
Permisos para crear notebooks
Para obtener los permisos que necesitas para crear y ejecutar notebooks, pídele a tu administrador que te otorgue los siguientes roles de IAM:
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido. Para ver los permisos exactos que se requieren para crear y ejecutar notebooks, expande la sección Permisos requeridos:
Permisos necesarios
Roles para editar notebooks
Para editar y ejecutar notebooks, necesitas los siguientes roles de IAM:
Roles para ver notebooks
Para ver y ejecutar notebooks, necesitas los siguientes roles de IAM:
Crear notebooks
Usa las siguientes secciones para aprender a crear un notebook.
Configura la región predeterminada para los elementos de código
Si es la primera vez que creas un recurso de código, debes configurar la región predeterminada para los recursos de código. No puedes cambiar la región de un recurso de código después de crearlo.
Todos los recursos de código en BigQuery Studio usan la misma región predeterminada. Para configurar la región predeterminada de los recursos de código, sigue estos pasos:
Para obtener una lista de las regiones admitidas, consulta Ubicaciones de BigQuery Studio.
Crea un notebook con la galería de notebooks
La galería de notebooks en la consola de Google Cloud BigQuery es tu centro central para descubrir y usar plantillas de notebooks prediseñadas.
Para crear un notebook a partir de una plantilla en la galería de notebooks, sigue estos pasos:
Crea un notebook a partir de una tabla
Para crear un notebook que contenga una consulta predeterminada para una tabla específica, sigue estos pasos:
Crea un notebook para explorar el conjunto de resultados de una consulta
Para crear un notebook que explore el conjunto de resultados de una consulta, sigue estos pasos:
Crea un notebook a partir de uno ya existente
Para abrir cualquier versión de un notebook existente como nuevo, sigue estos pasos:
Subir notebooks
Puedes subir un notebook local para usarlo en BigQuery Studio. El notebook subido se puede ver en la página de BigQuery de la Google Cloud consola.
Para borrar un notebook, sigue estos pasos:
Se puede acceder a tu notebook a través del panel Explorador.
Conéctate a un entorno de ejecución
Usa las siguientes secciones para aprender a conectar un notebook a un entorno de ejecución de Vertex AI. Un entorno de ejecución es un recurso de procesamiento que ejecuta el código en tu notebook. El entorno de ejecución debe estar en la misma región que tu notebook.
Para obtener más información sobre los entornos de ejecución, consulta Entornos de ejecución y plantillas de entorno de ejecución.
.Conéctate al entorno de ejecución predeterminado
El entorno de ejecución predeterminado es un entorno de ejecución preestablecido que requiere una configuración mínima.
Para conectarte al entorno de ejecución predeterminado, sigue estos pasos:
Conéctate a un entorno de ejecución no predeterminado
Si deseas usar un entorno de ejecución que no sea el predeterminado, primero debes crear ese entorno de ejecución adicional en Vertex AI.
Para conectarte al entorno de ejecución no predeterminado, sigue estos pasos:
Conectar a un nuevo entorno de ejecución
Para conectarte a un entorno de ejecución nuevo, sigue estos pasos:
Información sobre las celdas
Un notebook se compone de celdas que puedes editar. Se admiten los siguientes tipos de celdas:
Otorga acceso a los notebooks
Para otorgar acceso a un notebook a otros usuarios, agrégalos a un rol de IAM adecuada.
Comparte notebooks
Para compartir un notebook con otros usuarios, puedes generar y compartir un vínculo al notebook. Para que otros usuarios vean el notebook que compartes, primero debes otorgar acceso al notebook.
Para ejecutar un notebook, los usuarios deben tener acceso a los datos a los que accede el notebook. Para obtener más información, consulta Otorga acceso a un conjunto de datos.
Inhabilita el guardado de resultados de notebook
Puedes evitar que se comparta el resultado del notebook guardado con otros usuarios que tengan acceso al archivo del notebook si inhabilitas el guardado de resultados del notebook.
Cuando inhabilitas el guardado de resultados para un notebook seleccionado, BigQuery borra todos los resultados guardados en el archivo del notebook y no guarda el resultado de las ejecuciones posteriores.
Sin embargo, los usuarios que tienen acceso al notebook aún pueden ver el resultado de las siguientes maneras:
Para inhabilitar el guardado de resultados en un notebook seleccionado, sigue estos pasos:
Resolver conflictos
Si tú y otro usuario realizan cambios conflictivos en un notebook, el servicio genera el error Automatic saving failed. This file was updated remotely or
in another tab.
y proporciona un vínculo Show diff
. Para resolver el conflicto, sigue estos pasos:
Cambia el nombre de los notebooks
Para borrar un notebook, sigue estos pasos:
Soluciona problemas
Para obtener más información, consulta Soluciona problemas de Colab Enterprise.