Controles do Pub/Sub para casos de uso da IA generativa

Este documento inclui as práticas recomendadas e as diretrizes do Pub/Sub ao executar cargas de trabalho de IA generativa no Google Cloud. Use o Pub/Sub com a Vertex AI para permitir uma comunicação e automação eficientes nos seus fluxos de trabalho de machine learning.

Considere os seguintes casos de uso do Pub/Sub com a Vertex AI:

  • Arquitetura assíncrona orientada a eventos: o Pub/Sub permite a comunicação orientada a eventos para que você possa acionar pipelines da Vertex AI com base em eventos publicados em tópicos do Pub/Sub. Esses eventos podem incluir novos dados e atualizações de modelos.
  • Escalonabilidade e confiabilidade: o Pub/Sub é altamente escalonável, permitindo que você processe vários eventos sem afetar a performance. A escalonabilidade é essencial para processar grandes conjuntos de dados ou executar vários jobs de ML simultâneos. O Pub/Sub também oferece entrega e ordem de mensagens confiáveis em um tópico, garantindo a consistência do processamento mesmo em cargas de trabalho pesadas.
  • Flexibilidade: é possível integrar a Vertex AI a outros serviços, como funções do Cloud Run ou Dataflow, usando o Pub/Sub, criando pipelines de ML flexíveis e dinâmicos.
  • Alertas e monitoramento em tempo real: o Pub/Sub permite que você se inscreva em tópicos específicos para receber notificações em tempo real sobre eventos nos seus pipelines da Vertex AI. O monitoramento em tempo real ajuda a acompanhar o progresso do treinamento de modelo, os resultados do pré-processamento de dados e a saída de previsão. É possível configurar alertas com base em eventos específicos, como jobs com falha ou anomalias detectadas durante a previsão. Os alertas permitem intervenções proativas e solução de problemas oportuna.

Por exemplo, é possível usar o Pub/Sub para as seguintes atividades:

  • Acionar treinamento de modelo quando novos dados chegarem a um bucket do Cloud Storage.
  • Envie previsões em tempo real de um modelo implantado para sistemas downstream para processamento adicional.
  • Monitore e reaja a mudanças nas métricas de desempenho do modelo.
  • Acione alertas para eventos críticos, como previsões com falha ou problemas de qualidade de dados.

Dependendo dos seus casos de uso de IA generativa, recomendamos controles adicionais. Esses controles incluem retenção de dados e outros controles orientados por políticas com base nas políticas da sua empresa.

Usar o CMEK para mensagens do Pub/Sub

ID de controle do Google PS-CO-6.1
Categoria Recomendado
Descrição
Ao ativar as chaves de criptografia gerenciadas pelo cliente (CMEK) para o Pub/Sub, você tem mais controle sobre as chaves de criptografia que o Pub/Sub usa para proteger suas mensagens. Na camada do aplicativo, o Pub/Sub criptografa individualmente as mensagens recebidas quando as recebe. Antes de o Pub/Sub publicar mensagens em uma assinatura, ele as criptografa usando a chave de criptografia de dados (DEK) mais recente gerada para o tópico. O Pub/Sub descriptografa as mensagens pouco antes de elas serem entregues aos assinantes. O Pub/Sub usa uma conta de serviço Google Cloud para acessar o Cloud Key Management Service. A conta de serviço é mantida internamente pelo Pub/Sub para cada projeto e não fica visível na sua lista de contas de serviço.
Produtos aplicáveis
  • Cloud KMS
  • Pub/Sub
Controles relacionados do NIST-800-53
  • SC-12
  • SC-13
Controles relacionados ao perfil de CRI
  • PR.DS-1.1
  • PR.DS-1.2
  • PR.DS-2.1
  • PR.DS-2.2
  • PR.DS-5.1
Informações relacionadas

Controles opcionais do Pub/Sub

Esses controles são opcionais. Considere aplicá-las quando forem relevantes para seus casos de uso específicos.

Configurar políticas de armazenamento de mensagens

ID de controle do Google PS-CO-4.1
Categoria Opcional
Descrição
Se você publicar mensagens no endpoint global do Pub/Sub, o Pub/Sub vai armazenar de modo automático as mensagens na região Google Cloud mais próxima. Para controlar em que regiões as mensagens são armazenadas, configure uma política de armazenamento de mensagens no seu tópico. Use uma das seguintes maneiras para configurar políticas de armazenamento de mensagens para tópicos:
  • Defina uma política de armazenamento de mensagens usando a restrição de política da organização de restrição de local do recurso (gcp.resourceLocations).
  • Configure uma política de armazenamento de mensagens ao criar um tópico. Exemplo:

    gcloud pubsub topics create TOPIC_ID \--message-storage-policy-allowed-regions=REGION1, REGION2

Produtos aplicáveis
  • Serviço de política da organização
  • Pub/Sub
Controles relacionados do NIST-800-53
  • AC-3
  • AC-17
  • AC-20
Controles relacionados ao perfil de CRI
  • PR.AC-3.1
  • PR.AC-3.2
  • PR.AC-4.1
  • PR.AC-4.2
  • PR.AC-4.3
  • PR.AC-6.1
  • PR.PT-3.1
  • PR.PT-4.1
Informações relacionadas

A seguir