O que é o Pub/Sub?

O Pub/Sub é um serviço de mensagens assíncrono e escalonável que separa os serviços que produzem mensagens dos serviços que processam essas mensagens.

Com o Pub/Sub, os serviços se comunicam de maneira assíncrona, com latências normalmente na ordem de 100 milissegundos.

O Pub/Sub é usado na análise de streaming e em pipelines de integração de dados para carregar e distribuir dados. Ele é igualmente eficaz como um middleware orientado a mensagens para integração de serviços ou como uma fila para carregar tarefas em paralelo.

O Pub/Sub permite criar sistemas de produtores e consumidores de eventos, chamados de publicadores e assinantes. Os publicadores se comunicam com os assinantes de forma assíncrona transmitindo eventos, em vez de realizar chamadas de procedimento remoto (RPCs) síncronas.

Os publicadores enviam eventos ao serviço Pub/Sub sem considerar como ou quando eles vão ser processados. Depois o Pub/Sub entrega eventos para todos os serviços que precisam responder a eles. Nos sistemas que se comunicam por RPCs, os publicadores precisam esperar que os assinantes recebam os dados. No entanto, a integração assíncrona no Pub/Sub aumenta a flexibilidade e a robustez do sistema como um todo.

Para começar a usar o Pub/Sub, confira o Guia de início rápido sobre como usar o Google Cloud console. Para uma introdução mais abrangente, consulte Como criar um sistema de mensagens do Pub/Sub.

Casos de uso comuns

  • Ingestão de eventos do servidor e interação do usuário. Para usar eventos de interação do usuário de apps de usuário final ou eventos do servidor do seu sistema, encaminhe-os ao Pub/Sub. Em seguida, use uma ferramenta de processamento de stream, como o Dataflow, que entrega os eventos aos bancos de dados. Exemplos desses bancos de dados são BigQuery, Bigtable e Cloud Storage. O Pub/Sub permite coletar eventos de muitos clientes simultaneamente.
  • Distribuição de eventos em tempo real. Eventos, brutos ou processados, podem ser disponibilizados para vários aplicativos em toda a sua equipe e organização para processamento em tempo real. O Pub/Sub oferece suporte a um "barramento de eventos empresariais" e padrões de design de aplicativos orientados a eventos. O Pub/Sub permite a integração com muitos sistemas que exportam eventos para ele.
  • Replicação de dados entre bancos de dados. O Pub/Sub é usado com frequência para distribuir eventos de alteração de bancos de dados. Esses eventos podem ser usados para criar uma visualização do estado do banco de dados e do histórico de estados no BigQuery e em outros sistemas de armazenamento.
  • Processamento e fluxos de trabalho paralelos. É possível distribuir muitas tarefas entre vários workers usando mensagens do Pub/Sub para se comunicar com eles. Exemplos dessas tarefas são a compactação de arquivos de texto, o envio de notificações por e-mail, a avaliação de modelos de IA, e a reformatação de imagens.
  • Barramento de eventos empresariais. Crie um barramento de compartilhamento de dados em tempo real para toda a empresa . Com ele, você distribui eventos empresariais e de análise e atualizações de bancos de dados por toda a organização.
  • Streaming de dados de aplicativos, serviços ou dispositivos IoT. Por exemplo, um aplicativo SaaS pode publicar um feed de eventos em tempo real. Ou, um sensor residencial pode transmitir dados para o Pub/Sub para uso em outros Google Cloud produtos por um pipeline de processamento de dados.
  • Atualizar caches distribuídos. Por exemplo, um aplicativo pode publicar eventos de invalidação para atualizar os IDs dos objetos que foram alterados.
  • Balanceamento de carga para aumentar a confiabilidade. Por exemplo, é possível implantar as instâncias de um serviço no Compute Engine em várias zonas, mas assinar um tópico em comum. Quando o serviço falha em uma zona, as outras assumem a carga automaticamente.

Comparação entre o Pub/Sub e outras tecnologias de mensagens

O Pub/Sub combina a escalonabilidade horizontal do Apache Kafka e do Pulsar com os recursos de middlewares de mensagens, como o Apache ActiveMQ e o RabbitMQ. Exemplos desses recursos são as filas de mensagens inativas e a filtragem.

Outro recurso de middleware de mensagens incluído no Pub/Sub é o paralelismo por mensagem, em vez de mensagens baseadas em partição. O Pub/Sub "concede" mensagens individuais aos clientes do assinante e acompanha se alguma delas foi processada com sucesso.

Em comparação, outros sistemas de mensagens usam partições na escalonabilidade horizontal. Isso obriga os assinantes a processar mensagens em cada partição na ordem e limita o número de clientes simultâneos à quantidade de partições. O processamento por mensagem maximiza o paralelismo dos aplicativos do assinante e garante a independência do publicador e do assinante.

Comparar a comunicação entre serviços e entre serviço e cliente

O Pub/Sub é voltado para a comunicação entre serviços, e não para a comunicação com clientes de IoT ou usuários finais. Outros produtos oferecem um suporte melhor aos demais padrões:

É possível combinar esses serviços para criar padrões "cliente -> serviços -> banco de dados". Por exemplo, consulte o tutorial Como fazer streaming de mensagens do Pub/Sub para WebSockets.

Integrações

O Pub/Sub oferece muitas integrações com outros Google Cloud produtos para você criar um sistema de mensagens completo:

  • Integração de dados e processamento de stream. Compatível com o Dataflow, incluindo os modelos dessa ferramenta e o SQL. Eles permitem o processamento e a integração de dados no BigQuery e data lakes no Cloud Storage. Os modelos do Dataflow para mover dados do Pub/Sub ao Cloud Storage, BigQuery e outros produtos estão disponíveis nas IUs do Pub/Sub e do Dataflow no Google Cloud console. A integração com o Apache Spark, principalmente quando gerenciada com o Serviço Gerenciado para Apache Spark, também está disponível. Com o Data Fusion, você visualiza os pipelines de integração e processamento executados no Spark e no Serviço Gerenciado para Apache Spark .
  • Monitoramento, alertas e geração de registros. Compatível com os produtos Monitoring e Logging.
  • Autenticação e IAM. O Pub/Sub inclui a autenticação OAuth padrão usada pelos outros Google Cloud produtos e é compatível com o IAM granular, o que possibilita o controle de acesso de recursos individuais.
  • APIs. O Pub/Sub usa tecnologias padrão da API REST e gRPC com bibliotecas de cliente em várias linguagens.
  • Gatilhos, notificações e webhooks. O Pub/Sub entrega mensagens por push como solicitações POST HTTP feitas para webhooks. É possível implementar a automação do fluxo de trabalho usando Cloud Functions ou outros produtos sem servidor.
  • Orquestração. O Pub/Sub pode ser integrado de maneira declarativa a fluxos de trabalho sem servidor com várias etapas. A orquestração analítica e de big data geralmente são feitas com o Cloud Composer, que é compatível com os gatilhos do Pub/Sub. Também é possível integrar o Pub/Sub com a Application Integration (prévia), que é uma solução de plataforma de integração como serviço (iPaaS). A Application Integration oferece um gatilho do Pub/Sub para acionar ou iniciar integrações.
  • Integration Connectors(prévia). Esses conectores permitem que você se conecte a várias fontes de dados. Com os conectores, os Google Cloud serviços e os aplicativos empresariais de terceiros são expostos às integrações por uma interface padrão e transparente. Para o Pub/Sub, é possível criar uma conexão do Pub/Sub conexão para uso nas integrações.

Próximas etapas