Vertex AI y la retención de datos cero

Google fue el primero en el sector en publicar un compromiso de privacidad con la IA y el AA, que describe nuestra creencia de que los clientes deben tener el nivel más alto de seguridad y control sobre sus datos que se almacenan en la nube. Ese compromiso se extiende a los productos de IA generativa de Google Cloud. Google garantiza que sus equipos cumplan con estos compromisos a través de prácticas sólidas de administración de datos, que incluyen revisiones de los datos que Google Cloud utiliza en el desarrollo de sus productos. Puedes encontrar más detalles sobre cómo Google procesa los datos en el Anexo de Tratamiento de Datos de Cloud (CDPA) de Google.

Restricción de entrenamiento

Como se describe en el Artículo 17 "Restricción de Entrenamiento" de la sección de Condiciones del Servicio de las Condiciones Específicas del Servicio, Google no usará tus datos para entrenar ni ajustar ningún modelo de IA o AA sin tu permiso o instrucción previos. Esto se aplica a todos los modelos administrados en Vertex AI, incluidos los modelos disponibles de forma general y los modelos previos a la disponibilidad general.

Retención de datos del cliente y logro de la retención cero de datos

En los siguientes casos y condiciones, los datos del cliente se retienen en Vertex AI para los modelos de Google durante períodos limitados. Para lograr la retención cero de datos, los clientes deben realizar acciones específicas en cada una de estas áreas:

  • Registro de instrucciones para la supervisión del abuso de los modelos de Google: Como se describe en la sección 4.3 "Seguridad y abuso de la IA generativa" de las Condiciones del Servicio de Google Cloud Platform, Google puede registrar instrucciones para detectar posibles abusos y violaciones de su Política de Uso Aceptable y su Política de Uso Prohibido como parte de la prestación de servicios de IA generativa a los clientes. Solo los clientes cuyo uso de Google Cloud se rige por las Condiciones del Servicio de Google Cloud Platform y que no tienen una cuenta de facturación de Cloud facturada están sujetos al registro inmediato para la supervisión del abuso. Si tu caso está dentro del alcance del registro de instrucciones para la supervisión del abuso y deseas que no se retengan datos, puedes solicitar una excepción para la supervisión del abuso. Consulta Supervisión de abusos.
  • Fundamentación con la Búsqueda de Google: Como se describe en la Sección 19 "Servicios de IA generativa: Fundamentación con la Búsqueda de Google" de las Condiciones Específicas del Servicio, Google almacena las instrucciones y la información contextual que los clientes pueden proporcionar, así como el resultado generado, durante treinta (30) días con el fin de crear resultados fundamentados y sugerencias de búsqueda. Esta información almacenada se puede usar para depurar y probar los sistemas que admiten la fundamentación con la Búsqueda de Google. No hay forma de inhabilitar el almacenamiento de esta información si usas la Fundamentación con la Búsqueda de Google. Si necesitas una retención de datos nula, te recomendamos que uses Web Grounding for Enterprise.
  • Fundamentación con Google Maps: Como se describe en la Sección 19 "Servicios de IA generativa: fundamentación con Google Maps" de las Condiciones Específicas del Servicio, Google almacena las instrucciones y la información contextual que los clientes pueden proporcionar, así como el resultado generado, durante treinta (30) días para crear resultados fundamentados. Esta información almacenada solo se puede usar para la ingeniería de confiabilidad, como la depuración en caso de problemas del servicio, de los sistemas que admiten la fundamentación con Google Maps. No hay forma de inhabilitar el almacenamiento de esta información si usas Grounding con Google Maps.
  • Reanudación de sesión para la API de Gemini Live: Esta función está inhabilitada de forma predeterminada. El usuario debe habilitarlo cada vez que llama a la API especificando el campo en la solicitud a la API, y se aplica la privacidad a nivel del proyecto para los datos almacenados en caché. Si habilitas la reanudación de sesión, el usuario podrá volver a conectarse a una sesión anterior en un plazo de 24 horas almacenando datos en caché, incluidos los datos de instrucciones de texto, audio y video, y los resultados del modelo, durante un máximo de 24 horas. Para lograr una retención de datos nula, no habilites esta función. Para obtener más información sobre esta función, incluido cómo habilitarla, consulta la API de Live.

Esto se aplica a todos los modelos administrados en Vertex AI, incluidos los modelos en DG y en versión previa a la DG.

Almacenamiento en caché de datos en memoria

De forma predeterminada, los modelos de Gemini publicados por Google almacenan en caché los Datos del Cliente (entradas, salidas y datos derivados) en la memoria para reducir la latencia y acelerar las respuestas. Estos datos se almacenan solo en la memoria (no en reposo), están aislados a nivel del proyecto y tienen un TTL de 24 horas. Los datos almacenados en caché solo se usan para mejorar el rendimiento del servicio, cumplen con todos los requisitos de residencia de datos para la ubicación seleccionada y no incumplen la política de retención de datos cero. Esta función se puede inhabilitar a nivel del proyecto.

Cómo habilitar y cómo inhabilitar el almacenamiento en caché de datos

Puedes usar los siguientes comandos curl para obtener el estado de almacenamiento en caché, inhabilitar o volver a habilitar el almacenamiento en caché. Cuando inhabilitas o vuelves a habilitar el almacenamiento en caché, el cambio se aplica a todas las regiones de Google Cloud . Si deseas obtener más información sobre el uso de Identity and Access Management para otorgar los permisos necesarios y habilitar o inhabilitar el almacenamiento en caché, consulta Control de acceso de Vertex AI con la IAM. Expande las siguientes secciones para obtener información sobre cómo obtener la configuración de caché actual, inhabilitar el almacenamiento en caché y habilitarlo.

Obtén los parámetros de configuración actuales del almacenamiento en caché

Ejecuta el siguiente comando para determinar si el almacenamiento en caché está habilitado o inhabilitado en un proyecto. Para ejecutar este comando, un usuario debe tener uno de los siguientes roles: roles/aiplatform.viewer, roles/aiplatform.user o roles/aiplatform.admin.

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# GetCacheConfig
$ curl -X GET -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig

# Response if caching is enabled (caching is enabled by default).
{
  "name": "projects/PROJECT_ID/cacheConfig"
}

# Response if caching is disabled.
{
  "name": "projects/PROJECT_ID/cacheConfig"
  "disableCache": true
}
    

Inhabilitar memoria caché

Ejecuta el siguiente comando curl para inhabilitar el almacenamiento en caché en un proyecto de Google Cloud . Para ejecutar este comando, un usuario debe tener el rol de administrador de Vertex AI, roles/aiplatform.admin.

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt-out of caching.
$ curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": true
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_ID}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}
    

Habilita el almacenamiento en caché

Si inhabilitaste el almacenamiento en caché para un proyecto Google Cloud y deseas volver a habilitarlo, ejecuta el siguiente comando curl. Para ejecutar este comando, un usuario debe tener el rol de administrador de Vertex AI, roles/aiplatform.admin.

PROJECT_ID=PROJECT_ID
LOCATION_ID="us-central1"
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt in to caching.
$ curl -X PATCH     -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": false
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_NUMBER}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}
    

¿Qué sigue?