Este documento no Architecture Center fornece guias de arquitetura para ajudar a criar e implementar cargas de trabalho de IA generativa no Google Cloud.
Para saber como configurar, implementar, avaliar e operar aplicações de IA generativa em modelos de base, consulte o artigo Implemente e opere aplicações de IA generativa.
Arquiteturas de nível elevado
Os seguintes guias fornecem arquiteturas de alto nível para exemplos de utilização específicos de empresas e técnicos da IA generativa:
| Guia | Descrição |
|---|---|
| Gere campanhas de marketing personalizadas | Gere recursos de multimédia para campanhas de marketing personalizadas. |
| Gere recomendações de produtos personalizadas | Gerar recomendações de produtos personalizadas com base nas preferências dos utilizadores para aplicações de retalho. |
| Gere podcasts a partir de ficheiros de áudio | Gerar podcasts com base em ficheiros multimédia, como comentários em direto de um evento desportivo. |
| Gere soluções para pedidos de apoio ao cliente | Gerar respostas a perguntas dos clientes, como pedidos de apoio técnico. |
Arquiteturas de referência
Os seguintes guias fornecem exemplos de arquitetura detalhados e recomendações de design para implementar cargas de trabalho e infraestrutura de IA generativa para exemplos de utilização específicos:
| Guia | Descrição |
|---|---|
| Automatize a revisão da utilização de reclamações de seguros | Melhorar o processo de autorização prévia (PA) e revisão de utilização (UR) para reclamações de seguros de saúde. |
| Infraestrutura de RAG com o Gemini Enterprise e a Vertex AI | Orquestre um fluxo de trabalho RAG com base em agentes com disponibilidade de dados em tempo real e pesquisa contextual enriquecida. |
| Infraestrutura de RAG com a Vertex AI e a pesquisa vetorial | Fornecer uma pesquisa vetorial otimizada de elevado desempenho para aplicações de grande escala. |
| Infraestrutura de RAG com o Vertex AI e o AlloyDB para PostgreSQL | Armazene incorporações de vetores juntamente com dados operacionais numa base de dados do AlloyDB para PostgreSQL totalmente gerida. |
| Infraestrutura de RAG com o Vertex AI e o Cloud SQL | Armazena incorporações de vetores juntamente com dados operacionais numa base de dados do Cloud SQL totalmente gerida. |
| Infraestrutura de RAG com o GKE e o Cloud SQL | Crie aplicações RAG personalizadas através de ferramentas de código aberto, como o Ray, o Hugging Face e o LangChain. |
| Infraestrutura GraphRAG com o Vertex AI e o Spanner Graph | Combine a pesquisa vetorial com consultas ao gráfico de conhecimento para obter dados contextuais interligados. |
| Conetividade privada para aplicações de IA generativa com capacidade de RAG | Proteja a infraestrutura de rede para aplicações de IA generativa com capacidade de RAG usando a VPC partilhada. |
| Tire partido da pipeline de CI/CD para aplicações RAG | Configure um pipeline de integração contínua (CI) e implementação contínua (CD) para aplicações RAG. |