Dónde Gemini en BigQuery procesa tus datos

En este documento, se explica dónde Gemini en BigQuery procesa tus datos. Este comportamiento se aplica a las siguientes funciones de Gemini en BigQuery:

Para estas funciones, el procesamiento de Gemini se realiza dentro de los límites jurisdiccionales de la ubicación de la consulta o donde se almacena el conjunto de datos de BigQuery. Por ejemplo, si la ubicación de la consulta o el conjunto de datos de BigQuery se encuentra en la europe-west1 región, el procesamiento de Gemini se realiza en una ubicación dentro del EU límite jurisdiccional. Este diseño minimiza el movimiento de datos y sigue las prácticas recomendadas de administración de datos. Para obtener más información sobre las restricciones en las jurisdicciones disponibles, consulta Limitaciones.

En la mayoría de las funciones de Gemini en BigQuery, un administrador puede controlar la ubicación de procesamiento de Gemini con el parámetro de configuración Ubicación predeterminada global a nivel del proyecto o de la organización. Los usuarios de BigQuery pueden anular esta ubicación predeterminada global con el parámetro de configuración Ubicación de la consulta en BigQuery Studio. En los casos en los que un administrador no especifica un parámetro de configuración de ubicación de la consulta en los parámetros de configuración o el usuario no lo hace de forma explícita en la consulta, Gemini en BigQuery usa la ubicación derivada de la consulta que se está editando. Para obtener más información sobre cómo BigQuery determina la ubicación de la consulta, consulta Ejecuta una consulta.

Gemini en BigQuery determina la jurisdicción de US o EU en función de estos controles. Si no se puede determinar una jurisdicción, se usa la ubicación de procesamiento global según las ubicaciones de entrega de Gemini.

En las siguientes secciones, se explica cómo puedes administrar dónde cada función de Gemini en BigQuery procesa tus datos.

Editor de SQL y lienzo de datos

Cuando generas código con el editor de SQL, o usas el lienzo de datos para crear flujos de trabajo de análisis de datos, Gemini en BigQuery usa la siguiente lógica para determinar la ubicación de procesamiento:

  • Un administrador de BigQuery puede especificar una ubicación predeterminada a nivel de la organización o a nivel de proyecto. Para obtener información sobre cómo especificar una ubicación predeterminada, consulta Especifica la ubicación predeterminada a nivel de la organización o del proyecto.

  • Un usuario de BigQuery puede especificar una ubicación de la consulta en BigQuery Studio que anule la configuración del administrador. Para obtener información sobre cómo especificar un parámetro de configuración de ubicación de la consulta predeterminado en BigQuery, consulta Especifica ubicaciones.

  • Si no se puede determinar la ubicación de un conjunto de datos o si no se especifica la ubicación de la consulta predeterminada del usuario , BigQuery intenta determinar la ubicación del conjunto de datos o la consulta en función de la ejecución de prueba. Por ejemplo:

    • Ejemplo del editor de SQL: Si tu solicitud de Gemini para Transformar SQL con Gemini hace referencia a un conjunto de datos en europe-west1, Gemini procesa los datos en el límite jurisdiccional EU.
    • Ejemplo del lienzo de datos: Si tu lienzo de datos visualiza datos de un conjunto de datos ubicado en us-east4, cualquier análisis o sugerencia de Gemini en BigQuery se procesa en los US límites jurisdiccionales.

Especifica la ubicación predeterminada a nivel de la organización o a nivel de proyecto

Un administrador de BigQuery puede especificar una ubicación predeterminada a nivel de la organización o a nivel de proyecto en la que se procesan las solicitudes de Gemini. La ubicación predeterminada se almacena en caché durante la sesión del usuario mientras edita en la pestaña actual del editor de SQL. La ubicación predeterminada se usa cuando las operaciones de Gemini en BigQuery no especifican una ubicación de forma explícita y no se puede inferir una ubicación de la solicitud.

Para obtener más información sobre la configuración de la ubicación predeterminada, consulta Especifica la configuración global.

Para obtener más información sobre la verificación de la configuración de la ubicación predeterminada, consulta Recupera los parámetros de configuración.

Agente de ingeniería de datos de BigQuery

El Agente de ingeniería de datos admite la regionalización a nivel de la jurisdicción que proporciona extremos de servicio dedicados para las regiones us, eu y globales. La preferencia regional se asigna automáticamente según la ubicación del espacio de trabajo de Dataform asociado.

Cuando interactúas con el agente en la Google Cloud consola, todo el procesamiento interno, incluido el motor de razonamiento y el almacenamiento temporal del contexto de la conversación, se mantiene estrictamente dentro del límite jurisdiccional definido por la región del espacio de trabajo de Dataform.

Cuando interactúas con el agente mediante la API pública, selecciona us o eu para asegurarte de que todas las llamadas de procesamiento, razonamiento y servicio descendente permanezcan dentro de esa jurisdicción. Si la región de la API especificada no se alinea con la región del espacio de trabajo, el sistema muestra un error.

Para cambiar tu región de procesamiento, debes crear un nuevo repositorio de Dataform y configurarlo en la región actualizada.

Agente de ciencia de datos de BigQuery

El Agente de ciencia de datos de BigQuery está disponible en una cantidad limitada de regiones de Colab Enterprise. La región se determina automáticamente según la ubicación de tu notebook de Colab Enterprise. Para obtener más información, consulta Ubicaciones de Colab Enterprise.

Cuando interactúas con el Agente de ciencia de datos en la Google Cloud consola, los datos de la sesión , incluido el historial de conversaciones y el almacenamiento temporal del contexto de la conversación , se almacenan en la misma región que tu notebook. Los datos almacenados en reposo en tu notebook también se almacenan en la ubicación del notebook.

Las solicitudes de modelos de Gemini se enrutan a extremos regionales o globales según la versión y la región del modelo. Este enrutamiento es dinámico y puede cambiar a medida que se lanzan nuevas versiones del modelo. Por ejemplo, las versiones más recientes del modelo pueden usar inicialmente un extremo global y expandirse a extremos regionales o multirregionales con el tiempo.

Para obtener más información sobre la residencia de datos, consulta Data residency.

Estadísticas de datos de BigQuery

Para generar estadísticas con las estadísticas de datos de BigQuery, puedes ejecutar operaciones de análisis de datos en las tablas y los recursos del conjunto de datos seleccionados. Estos análisis se crean en la misma ubicación que el recurso del conjunto de datos de BigQuery. Dentro de las jurisdicciones de US o EU, el procesamiento de Gemini en BigQuery se restringe a la jurisdicción en la que se ejecuta el análisis. Fuera de las jurisdic0/} y EU jurisdicciones, el procesamiento se ejecuta de forma global.US Para obtener información sobre dónde se realiza el procesamiento de datos global de Gemini, consulta Ubicaciones de entrega de Gemini.

Preparación de datos de BigQuery

La ubicación en la que la preparación de datos de BigQuery procesa los datos depende de la función de preparación de datos que uses.

  • Para la preparación de datos independiente, la ubicación de procesamiento de Gemini en BigQuery es la ubicación en la que se encuentra el conjunto de datos de BigQuery.
  • Si ejecutas la preparación de datos como parte de las canalizaciones de Dataform o BigQuery, la ubicación de procesamiento de datos de Gemini en BigQuery se determina con el parámetro de configuración Dataform defaultLocation setting, si está configurado. El parámetro de configuración defaultLocation también determina la ubicación del trabajo de BigQuery. Esto garantiza que el procesamiento de Gemini en BigQuery se realice dentro de los mismos límites jurisdiccionales.
  • Si no se configura defaultLocation para Dataform o la canalización de BigQuery que contiene tu preparación de datos, la región de procesamiento de Gemini en BigQuery se determina con el parámetro de configuración de región del repositorio. Una canalización sin un parámetro de configuración defaultLocation especificado puede ejecutar diferentes trabajos de BigQuery en diferentes ubicaciones según la ubicación de las tablas que se usan en los nodos de la canalización. Como práctica recomendada, debes configurar defaultLocation para garantizar una ubicación de procesamiento coherente.

Limitaciones

Se aplican las siguientes limitaciones cuando identificas dónde Gemini en BigQuery procesa los datos:

  • Gemini en BigQuery no proporciona residencia de datos para ubicaciones individuales. El procesamiento de datos se puede especificar para US y EU jurisdicciones compatibles. Los datos fuera de estas jurisdicciones se procesan de forma global.
  • El procesamiento de jurisdicciones de Gemini en BigQuery solo está disponible para las funciones de Gemini en BigQuery que están disponibles de forma general (DG). Para obtener una lista de las funciones de Gemini en BigQuery, consulta Descripción general de Gemini en BigQuery.
  • La asistencia para código de notebook de Python de BigQuery solo admite el procesamiento global de Gemini.
  • El chat de Gemini en Cloud Assist (GCA) solo admite el procesamiento global de Gemini. Puedes denegar el acceso al panel de chat de GCA si quitas el permiso de Identity and Access Management (IAM) geminicloudassist.agents.invoke para tus usuarios. Para obtener más información sobre cómo crear funciones personalizadas, consulta Crea y administra funciones personalizadas.

¿Qué sigue?