Guias de arquitetura de IA generativa

Last reviewed 2025-01-06 UTC

Este documento no Architecture Center fornece guias de arquitetura para ajudar a criar e implementar cargas de trabalho de IA generativa no Google Cloud.

Para saber como configurar, implementar, avaliar e operar aplicações de IA generativa em modelos de base, consulte o artigo Implemente e opere aplicações de IA generativa.

Arquiteturas de nível elevado

Os seguintes guias fornecem arquiteturas de alto nível para exemplos de utilização específicos de empresas e técnicos da IA generativa:

Guia	Descrição
Gere campanhas de marketing personalizadas	Gere recursos de multimédia para campanhas de marketing personalizadas.
Gere recomendações de produtos personalizadas	Gerar recomendações de produtos personalizadas com base nas preferências dos utilizadores para aplicações de retalho.
Gere podcasts a partir de ficheiros de áudio	Gerar podcasts com base em ficheiros multimédia, como comentários em direto de um evento desportivo.
Gere soluções para pedidos de apoio ao cliente	Gerar respostas a perguntas dos clientes, como pedidos de apoio técnico.

Arquiteturas de referência

Os seguintes guias fornecem exemplos de arquitetura detalhados e recomendações de design para implementar cargas de trabalho e infraestrutura de IA generativa para exemplos de utilização específicos:

Guia	Descrição
Automatize a revisão da utilização de reclamações de seguros	Melhorar o processo de autorização prévia (PA) e revisão de utilização (UR) para reclamações de seguros de saúde.
Infraestrutura de RAG com o Gemini Enterprise e a Vertex AI	Orquestre um fluxo de trabalho RAG com base em agentes com disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura de RAG com a Vertex AI e a pesquisa vetorial	Fornecer uma pesquisa vetorial otimizada de elevado desempenho para aplicações de grande escala.
Infraestrutura de RAG com o Vertex AI e o AlloyDB para PostgreSQL	Armazene incorporações de vetores juntamente com dados operacionais numa base de dados do AlloyDB para PostgreSQL totalmente gerida.
Infraestrutura de RAG com o Vertex AI e o Cloud SQL	Armazena incorporações de vetores juntamente com dados operacionais numa base de dados do Cloud SQL totalmente gerida.
Infraestrutura de RAG com o GKE e o Cloud SQL	Crie aplicações RAG personalizadas através de ferramentas de código aberto, como o Ray, o Hugging Face e o LangChain.
Infraestrutura GraphRAG com o Vertex AI e o Spanner Graph	Combine a pesquisa vetorial com consultas ao gráfico de conhecimento para obter dados contextuais interligados.
Conetividade privada para aplicações de IA generativa com capacidade de RAG	Proteja a infraestrutura de rede para aplicações de IA generativa com capacidade de RAG usando a VPC partilhada.
Tire partido da pipeline de CI/CD para aplicações RAG	Configure um pipeline de integração contínua (CI) e implementação contínua (CD) para aplicações RAG.

Guias de arquitetura de IA generativa Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Arquiteturas de nível elevado

Arquiteturas de referência

Guias de arquitetura de IA generativa