Guias de arquitetura de IA generativa

Last reviewed 2025-01-06 UTC

Este documento na Central de arquitetura fornece guias para ajudar você a criar e implantar cargas de trabalho de IA generativa em Google Cloud.

Para saber como configurar, implantar, avaliar e operar aplicativos de IA generativa em modelos de fundação, consulte Implantar e operar aplicativos de IA generativa.

Arquiteturas de alto nível

Os guias a seguir fornecem arquiteturas de alto nível para casos de uso técnicos e comerciais específicos da IA generativa:

Guia Descrição
Gerar campanhas de marketing personalizadas Gere recursos de mídia para campanhas de marketing personalizadas.
Gerar recomendações personalizadas de produtos Gerar recomendações personalizadas de produtos com base nas preferências do usuário para aplicativos de varejo.
Gerar podcasts com arquivos de áudio Gerar podcasts com base em arquivos de mídia, como comentários ao vivo de um evento esportivo.
Gerar soluções para solicitações de suporte ao cliente Gerar respostas para perguntas de clientes, como solicitações de suporte técnico.

Arquiteturas de referência

Os guias a seguir fornecem exemplos detalhados de arquitetura e recomendações de design para implantar cargas de trabalho e infraestrutura de IA generativa em casos de uso específicos:

Guia Descrição
Automatizar a análise de utilização de sinistros de seguros Melhorar o processo de autorização prévia (PA) e análise de utilização (UR) para solicitações de planos de saúde.
Infraestrutura de RAG usando o Gemini Enterprise e a Vertex AI Orquestre um fluxo de trabalho de RAG com agentes e disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura de RAG usando a Vertex AI e a Vector Search Oferecer pesquisa vetorial otimizada e de alto desempenho para aplicativos em grande escala.
Infraestrutura de RAG usando a Vertex AI e o AlloyDB para PostgreSQL Armazene embeddings de vetor com dados operacionais em um banco de dados totalmente gerenciado do AlloyDB para PostgreSQL.
Infraestrutura de RAG usando a Vertex AI e o Cloud SQL Armazena embeddings vetoriais junto com dados operacionais em um banco de dados do Cloud SQL totalmente gerenciado.
Infraestrutura de RAG usando o GKE e o Cloud SQL Crie aplicativos RAG personalizados usando ferramentas de código aberto, como Ray, Hugging Face e LangChain.
Infraestrutura do GraphRAG usando a Vertex AI e o Spanner Graph Combine a pesquisa vetorial com consultas de mapa de informações para recuperar dados contextuais interconectados.
Conectividade particular para aplicativos de IA generativa com capacidade de RAG Proteja a infraestrutura de rede para aplicativos de IA generativa com capacidade de RAG usando a VPC compartilhada.
Aproveitar o pipeline de CI/CD para aplicativos RAG Configure um pipeline de integração contínua (CI) e implantação contínua (CD) para aplicativos RAG.