Guias de arquitetura de IA generativa

Last reviewed 2025-01-06 UTC

Este documento no Architecture Center fornece guias de arquitetura para ajudar a criar e implementar cargas de trabalho de IA generativa no Google Cloud.

Para saber como configurar, implementar, avaliar e operar aplicações de IA generativa em modelos de base, consulte o artigo Implemente e opere aplicações de IA generativa.

Arquiteturas de nível elevado

Os seguintes guias fornecem arquiteturas de alto nível para exemplos de utilização específicos de empresas e técnicos da IA generativa:

Guia Descrição
Gere campanhas de marketing personalizadas Gere recursos de multimédia para campanhas de marketing personalizadas.
Gere recomendações de produtos personalizadas Gerar recomendações de produtos personalizadas com base nas preferências dos utilizadores para aplicações de retalho.
Gere podcasts a partir de ficheiros de áudio Gerar podcasts com base em ficheiros multimédia, como comentários em direto de um evento desportivo.
Gere soluções para pedidos de apoio ao cliente Gerar respostas a perguntas dos clientes, como pedidos de apoio técnico.

Arquiteturas de referência

Os seguintes guias fornecem exemplos de arquitetura detalhados e recomendações de design para implementar cargas de trabalho e infraestrutura de IA generativa para exemplos de utilização específicos:

Guia Descrição
Automatize a revisão da utilização de reclamações de seguros Melhorar o processo de autorização prévia (PA) e revisão de utilização (UR) para reclamações de seguros de saúde.
Infraestrutura de RAG com o Gemini Enterprise e a Vertex AI Orquestre um fluxo de trabalho RAG com base em agentes com disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura de RAG com a Vertex AI e a pesquisa vetorial Fornecer uma pesquisa vetorial otimizada de elevado desempenho para aplicações de grande escala.
Infraestrutura de RAG com o Vertex AI e o AlloyDB para PostgreSQL Armazene incorporações de vetores juntamente com dados operacionais numa base de dados do AlloyDB para PostgreSQL totalmente gerida.
Infraestrutura de RAG com o Vertex AI e o Cloud SQL Armazena incorporações de vetores juntamente com dados operacionais numa base de dados do Cloud SQL totalmente gerida.
Infraestrutura de RAG com o GKE e o Cloud SQL Crie aplicações RAG personalizadas através de ferramentas de código aberto, como o Ray, o Hugging Face e o LangChain.
Infraestrutura GraphRAG com o Vertex AI e o Spanner Graph Combine a pesquisa vetorial com consultas ao gráfico de conhecimento para obter dados contextuais interligados.
Conetividade privada para aplicações de IA generativa com capacidade de RAG Proteja a infraestrutura de rede para aplicações de IA generativa com capacidade de RAG usando a VPC partilhada.
Tire partido da pipeline de CI/CD para aplicações RAG Configure um pipeline de integração contínua (CI) e implementação contínua (CD) para aplicações RAG.