Guias de arquitetura de IA generativa

Last reviewed 2025-01-06 UTC

Este documento na Central de arquitetura fornece guias para ajudar você a criar e implantar cargas de trabalho de IA generativa em Google Cloud.

Para saber como configurar, implantar, avaliar e operar aplicativos de IA generativa em modelos de fundação, consulte Implantar e operar aplicativos de IA generativa.

Arquiteturas de alto nível

Os guias a seguir fornecem arquiteturas de alto nível para casos de uso técnicos e comerciais específicos da IA generativa:

Guia	Descrição
Gerar campanhas de marketing personalizadas	Gere recursos de mídia para campanhas de marketing personalizadas.
Gerar recomendações personalizadas de produtos	Gerar recomendações personalizadas de produtos com base nas preferências do usuário para aplicativos de varejo.
Gerar podcasts com arquivos de áudio	Gerar podcasts com base em arquivos de mídia, como comentários ao vivo de um evento esportivo.
Gerar soluções para solicitações de suporte ao cliente	Gerar respostas para perguntas de clientes, como solicitações de suporte técnico.

Arquiteturas de referência

Os guias a seguir fornecem exemplos detalhados de arquitetura e recomendações de design para implantar cargas de trabalho e infraestrutura de IA generativa em casos de uso específicos:

Guia	Descrição
Automatizar a análise de utilização de sinistros de seguros	Melhorar o processo de autorização prévia (PA) e análise de utilização (UR) para solicitações de planos de saúde.
Infraestrutura de RAG usando o Gemini Enterprise e a Vertex AI	Orquestre um fluxo de trabalho de RAG com agentes e disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura de RAG usando a Vertex AI e a Vector Search	Oferecer pesquisa vetorial otimizada e de alto desempenho para aplicativos em grande escala.
Infraestrutura de RAG usando a Vertex AI e o AlloyDB para PostgreSQL	Armazene embeddings de vetor com dados operacionais em um banco de dados totalmente gerenciado do AlloyDB para PostgreSQL.
Infraestrutura de RAG usando a Vertex AI e o Cloud SQL	Armazena embeddings vetoriais junto com dados operacionais em um banco de dados do Cloud SQL totalmente gerenciado.
Infraestrutura de RAG usando o GKE e o Cloud SQL	Crie aplicativos RAG personalizados usando ferramentas de código aberto, como Ray, Hugging Face e LangChain.
Infraestrutura do GraphRAG usando a Vertex AI e o Spanner Graph	Combine a pesquisa vetorial com consultas de mapa de informações para recuperar dados contextuais interconectados.
Conectividade particular para aplicativos de IA generativa com capacidade de RAG	Proteja a infraestrutura de rede para aplicativos de IA generativa com capacidade de RAG usando a VPC compartilhada.
Aproveitar o pipeline de CI/CD para aplicativos RAG	Configure um pipeline de integração contínua (CI) e implantação contínua (CD) para aplicativos RAG.

Guias de arquitetura de IA generativa Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Arquiteturas de alto nível

Arquiteturas de referência

Guias de arquitetura de IA generativa