Controles de Pub/Sub para casos prácticos de IA generativa

En este documento se incluyen las prácticas recomendadas y las directrices de Pub/Sub para ejecutar cargas de trabajo de IA generativa en Google Cloud. Usa Pub/Sub con Vertex AI para habilitar la comunicación y la automatización eficientes en tus flujos de trabajo de aprendizaje automático.

Estos son algunos casos prácticos de Pub/Sub con Vertex AI:

  • Arquitectura asíncrona basada en eventos: Pub/Sub permite la comunicación basada en eventos para que puedas activar las canalizaciones de Vertex AI en función de los eventos que se publiquen en temas de Pub/Sub. Estos eventos pueden incluir datos nuevos y actualizaciones de modelos.
  • Escalabilidad y fiabilidad: Pub/Sub es altamente escalable, lo que te permite gestionar numerosos eventos sin que afecte al rendimiento. La escalabilidad es fundamental para procesar grandes conjuntos de datos o ejecutar varios trabajos de aprendizaje automático simultáneos. Pub/Sub también ofrece un envío de mensajes fiable y un orden dentro de un tema, lo que garantiza la coherencia del procesamiento incluso en cargas de trabajo elevadas.
  • Flexibilidad: puedes integrar Vertex AI con otros servicios, como funciones de Cloud Run o Dataflow, mediante Pub/Sub, lo que te permite crear pipelines de aprendizaje automático flexibles y dinámicos.
  • Monitorización y alertas en tiempo real: Pub/Sub te permite suscribirte a temas específicos para recibir notificaciones en tiempo real sobre eventos en tus pipelines de Vertex AI. La monitorización en tiempo real te ayuda a supervisar el progreso del entrenamiento del modelo, los resultados del preprocesamiento de datos y los resultados de las predicciones. Puedes configurar alertas basadas en eventos específicos, como trabajos fallidos o anomalías detectadas durante la predicción. Las alertas permiten intervenir de forma proactiva y solucionar los problemas a tiempo.

Por ejemplo, puedes usar Pub/Sub para las siguientes actividades:

  • Activa el entrenamiento de modelos cuando lleguen datos nuevos a un segmento de Cloud Storage.
  • Envía predicciones en tiempo real de un modelo desplegado a sistemas posteriores para su procesamiento.
  • Monitorizar y reaccionar ante los cambios en las métricas de rendimiento del modelo.
  • Activa alertas para eventos críticos, como predicciones fallidas o problemas de calidad de los datos.

En función de tus casos prácticos con la IA generativa, te recomendamos que apliques controles adicionales. Entre estos controles se incluyen los controles de conservación de datos y otros controles basados en políticas que se rigen por las políticas de tu empresa.

Usar CMEK para mensajes de Pub/Sub

ID de control de Google PS-CO-6.1
Categoría Recomendado
Descripción
Si habilitas las claves de cifrado gestionadas por el cliente (CMEK) en Pub/Sub, tendrás más control sobre las claves de cifrado que Pub/Sub usa para proteger tus mensajes. En la capa de aplicación, Pub/Sub cifra individualmente los mensajes entrantes cuando los recibe. Antes de que Pub/Sub publique mensajes en una suscripción, los cifra con la clave de cifrado de datos (DEK) más reciente que se haya generado para el tema. Pub/Sub descifra los mensajes poco antes de que se entreguen a los suscriptores. Pub/Sub usa una Google Cloud cuenta de servicio para acceder a Cloud Key Management Service. Pub/Sub mantiene la cuenta de servicio internamente para cada proyecto, por lo que no se muestra en tu lista de cuentas de servicio.
Productos aplicables
  • Cloud KMS
  • Pub/Sub
Controles relacionados de NIST 800-53
  • SC-12
  • SC-13
Controles relacionados con el perfil de CRI
  • PR.DS-1.1
  • PR.DS-1.2
  • PR.DS-2.1
  • PR.DS-2.2
  • PR.DS-5.1
Información relacionada

Controles opcionales de Pub/Sub

Estos controles son opcionales. Plantéate aplicarlas cuando se ajusten a tus casos prácticos específicos.

Configurar políticas de almacenamiento de mensajes

ID de control de Google PS-CO-4.1
Categoría Opcional
Descripción
Si publicas mensajes en el punto final global de Pub/Sub, Pub/Sub los almacenará automáticamente en la región más cercana. Google Cloud Para controlar en qué regiones se almacenan tus mensajes, configura una política de almacenamiento de mensajes en tu tema. Puede configurar las políticas de almacenamiento de mensajes de los temas de una de estas formas:
  • Define una política de almacenamiento de mensajes mediante la restricción de política de organización de restricción de ubicación de recursos (gcp.resourceLocations).
  • Configura una política de almacenamiento de mensajes al crear un tema. Por ejemplo:

    gcloud pubsub topics create TOPIC_ID \--message-storage-policy-allowed-regions=REGION1, REGION2

Productos aplicables
  • Servicio de política de organización
  • Pub/Sub
Controles relacionados de NIST 800-53
  • AC-3
  • AC-17
  • AC-20
Controles relacionados con el perfil de CRI
  • PR.AC-3.1
  • PR.AC-3.2
  • PR.AC-4.1
  • PR.AC-4.2
  • PR.AC-4.3
  • PR.AC-6.1
  • PR.PT-3.1
  • PR.PT-4.1
Información relacionada

Siguientes pasos