Dónde procesa tus datos Gemini en BigQuery

Este documento te ayuda a comprender dónde procesa tus datos Gemini en BigQuery. Este comportamiento se aplica a las siguientes funciones de Gemini en BigQuery:

En el caso de estas funciones, el procesamiento de Gemini se realiza dentro de los límites jurisdiccionales de la ubicación de la búsqueda o donde se almacena el conjunto de datos de BigQuery. Por ejemplo, si la ubicación de tu consulta o conjunto de datos de BigQuery está en la región europe-west1, el procesamiento de Gemini se realiza en una ubicación dentro del límite jurisdiccional de EU. Este diseño minimiza el movimiento de datos y sigue las prácticas recomendadas de administración de datos. Para obtener más información sobre las restricciones en las jurisdicciones disponibles, consulta Limitaciones.

En la mayoría de las funciones de Gemini en BigQuery, un administrador puede controlar la ubicación de procesamiento de Gemini con el parámetro de configuración Ubicación predeterminada global a nivel del proyecto o la organización. Los usuarios de BigQuery pueden anular esta ubicación predeterminada global con el parámetro de configuración Ubicación de la consulta en BigQuery Studio. En los casos en que un administrador no especifica un parámetro de configuración de ubicación de la búsqueda en la configuración o el usuario no lo hace de forma explícita en la búsqueda, Gemini en BigQuery usa la ubicación derivada de la búsqueda que se está editando. Para obtener más información sobre cómo BigQuery determina la ubicación de la consulta, consulta Ejecuta una consulta.

Gemini en BigQuery determina la jurisdicción de US o EU según estos controles. Si no se puede determinar una jurisdicción, se usa la ubicación de procesamiento global según las ubicaciones de servicio de Gemini.

En las siguientes secciones, se explica cómo puedes administrar dónde procesa tus datos cada función de Gemini en BigQuery.

Editor de SQL y lienzo de datos

Cuando generas código con el editor de SQL o usas el lienzo de datos para crear flujos de trabajo de análisis de datos, Gemini en BigQuery usa la siguiente lógica para determinar la ubicación de procesamiento:

  • Un administrador de BigQuery puede especificar una ubicación predeterminada a nivel de la organización o del proyecto. Para obtener información sobre cómo especificar una ubicación predeterminada, consulta Cómo especificar la ubicación predeterminada a nivel de la organización o del proyecto.

  • Un usuario de BigQuery puede especificar una ubicación de consulta en BigQuery Studio que anule el parámetro de configuración del administrador. Para obtener información sobre cómo especificar un parámetro de configuración de ubicación de consulta predeterminado en BigQuery, consulta Especifica ubicaciones.

  • Si no se puede determinar la ubicación de un conjunto de datos o si no se especifica la ubicación de consulta predeterminada del usuario, BigQuery intenta determinar la ubicación del conjunto de datos o de la consulta en función de la ejecución de prueba. Por ejemplo:

    • Ejemplo del editor de SQL: Si tu solicitud de Gemini para Transformar SQL con Gemini hace referencia a un conjunto de datos en europe-west1, Gemini procesa los datos en el límite jurisdiccional de EU.
    • Ejemplo del lienzo de datos: Si tu lienzo de datos visualiza datos de un conjunto de datos ubicado en us-east4, todos los análisis o sugerencias de Gemini en BigQuery se procesan dentro de los límites jurisdiccionales de US.

Especifica la ubicación predeterminada a nivel de la organización o del proyecto

Un administrador de BigQuery puede especificar una ubicación predeterminada a nivel de la organización o del proyecto en la que se procesan las solicitudes de Gemini. La ubicación predeterminada se almacena en caché durante la sesión del usuario mientras este realiza ediciones en la pestaña actual del editor de SQL.

Requisito previo

Para especificar la ubicación predeterminada a nivel de la organización o del proyecto en la que se procesan los datos, un administrador de BigQuery primero debe habilitar la función de BigQuery completando este formulario y, luego, recibir un correo electrónico en el que se confirme que se habilitó la función.

Roles obligatorios

Para especificar una organización o ubicación del proyecto predeterminada, debes tener el rol de administrador de BigQuery (roles/bigquery.admin), que incluye el permiso bigquery.config.update necesario para especificar un parámetro de configuración. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Cómo establecer la ubicación predeterminada

Para establecer una ubicación predeterminada a nivel de la organización o del proyecto, completa los siguientes pasos:

  1. En la consola de Google Cloud , ve a la página BigQuery.

    Ir a BigQuery

  2. En el panel de navegación, haz clic en Explorer.

  3. Selecciona la organización o el proyecto para el que deseas especificar una ubicación predeterminada.

  4. En el editor de SQL de BigQuery, ingresa la siguiente instrucción:

    • Configuración a nivel de la organización:
      ALTER ORGANIZATION SET OPTIONS(default_location='my-default-region');
    • Configuración a nivel del proyecto:
      ALTER PROJECT SET OPTIONS(default_location='my-default-region');

Este comando establece el valor de default_location en my-default-region.

Verifica la ubicación predeterminada para el procesamiento de datos

Para verificar la ubicación predeterminada del procesamiento de datos de una consulta en SQL asistida por Gemini en BigQuery, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la página BigQuery.

    Ir a BigQuery

  2. En el editor de SQL de BigQuery Studio, ejecuta la siguiente consulta:

    SELECT
        COALESCE(
            (
                SELECT
                    option_value
                FROM INFORMATION_SCHEMA.PROJECT_OPTIONS
                WHERE option_name = 'default_location'
            ),
            (
                SELECT
                    option_value
                FROM INFORMATION_SCHEMA.ORGANIZATION_OPTIONS
                WHERE option_name = 'default_location'
            ));

El resultado muestra el valor default_location establecido en el valor que definiste como my-default-region. Esta consulta devuelve la ubicación predeterminada del proyecto si se definió. De lo contrario, la búsqueda devolverá la ubicación predeterminada de la organización. El usuario no especifica de forma explícita la ubicación en la que se ejecutan las operaciones de Gemini en BigQuery.

Estadísticas de datos de BigQuery

Para generar estadísticas con las estadísticas de datos de BigQuery, puedes ejecutar operaciones de análisis de datos en los recursos de tablas y conjuntos de datos seleccionados. Estos análisis se crean en la misma ubicación que el recurso del conjunto de datos de BigQuery. En las jurisdicciones de US o US, el procesamiento de Gemini en BigQuery se restringe a la jurisdicción en la que se ejecuta el análisis.EU Fuera de las jurisdicciones de US y EU, el procesamiento se ejecuta a nivel global. Para obtener información sobre dónde se realiza el procesamiento de datos global de Gemini, consulta Ubicaciones de servicio de Gemini.

Preparación de datos de BigQuery

La ubicación en la que BigQuery Data Preparation procesa los datos depende de la función de preparación de datos que uses.

  • Para la preparación de datos independiente, la ubicación de procesamiento de Gemini en BigQuery es la ubicación en la que se encuentra el conjunto de datos de BigQuery.
  • Si ejecutas la preparación de datos como parte de las canalizaciones de Dataform o BigQuery, la ubicación de procesamiento de datos de Gemini en BigQuery se determina según el parámetro de configuración defaultLocation de Dataform, si está configurado. El parámetro de configuración defaultLocation también determina la ubicación del trabajo de BigQuery. Esto garantiza que el procesamiento de Gemini en BigQuery se realice dentro de los mismos límites jurisdiccionales.
  • Si no se configura defaultLocation para Dataform o la canalización de BigQuery que contiene tu preparación de datos, la región de procesamiento de Gemini en BigQuery se determina con la configuración de región del repositorio. Una canalización sin un parámetro de configuración de defaultLocation especificado puede ejecutar diferentes trabajos de BigQuery en diferentes ubicaciones según la ubicación de las tablas que se usan en los nodos de la canalización. Como práctica recomendada, debes establecer defaultLocation para garantizar una ubicación de procesamiento coherente.

Limitaciones

Se aplican las siguientes limitaciones cuando identificas dónde Gemini en BigQuery procesa los datos:

  • Gemini en BigQuery no proporciona residencia de datos para ubicaciones individuales. El procesamiento de datos se puede especificar para las jurisdicciones compatibles con US y EU. Los datos fuera de estas jurisdicciones se procesan a nivel global.
  • El procesamiento de jurisdicción de Gemini en BigQuery solo está disponible para las funciones de Gemini en BigQuery que están disponibles de forma general (DG). Para obtener una lista de las funciones de Gemini en BigQuery, consulta la Descripción general de Gemini en BigQuery.
  • La asistencia de código para notebooks de Python de BigQuery y el agente de ciencia de datos para Colab Enterprise en BigQuery solo admiten el procesamiento global de Gemini.

  • Gemini en el chat de Cloud Assist (GCA) solo admite el procesamiento global de Gemini. Puedes denegar el acceso al panel de chat de la GCA quitando el permiso cloudaicompanion.instances.completeTask de Identity and Access Management (IAM) para tus usuarios. Para obtener más información sobre cómo crear roles personalizados, consulta Crea y administra roles personalizados.

¿Qué sigue?