Este documento na Central de arquitetura fornece guias para ajudar você a criar e implantar cargas de trabalho de IA generativa em Google Cloud.
Para saber como configurar, implantar, avaliar e operar aplicativos de IA generativa em modelos de fundação, consulte Implantar e operar aplicativos de IA generativa.
Arquiteturas de alto nível
Os guias a seguir fornecem arquiteturas de alto nível para casos de uso técnicos e comerciais específicos da IA generativa:
| Guia | Descrição |
|---|---|
| Gerar campanhas de marketing personalizadas | Gere recursos de mídia para campanhas de marketing personalizadas. |
| Gerar recomendações personalizadas de produtos | Gerar recomendações personalizadas de produtos com base nas preferências do usuário para aplicativos de varejo. |
| Gerar podcasts com arquivos de áudio | Gerar podcasts com base em arquivos de mídia, como comentários ao vivo de um evento esportivo. |
| Gerar soluções para solicitações de suporte ao cliente | Gerar respostas para perguntas de clientes, como solicitações de suporte técnico. |
Arquiteturas de referência
Os guias a seguir fornecem exemplos detalhados de arquitetura e recomendações de design para implantar cargas de trabalho e infraestrutura de IA generativa em casos de uso específicos:
| Guia | Descrição |
|---|---|
| Automatizar a análise de utilização de sinistros de seguros | Melhorar o processo de autorização prévia (PA) e análise de utilização (UR) para solicitações de planos de saúde. |
| Infraestrutura de RAG usando o Gemini Enterprise e a Vertex AI | Orquestre um fluxo de trabalho de RAG com agentes e disponibilidade de dados em tempo real e pesquisa contextual enriquecida. |
| Infraestrutura de RAG usando a Vertex AI e a Vector Search | Oferecer pesquisa vetorial otimizada e de alto desempenho para aplicativos em grande escala. |
| Infraestrutura de RAG usando a Vertex AI e o AlloyDB para PostgreSQL | Armazene embeddings de vetor com dados operacionais em um banco de dados totalmente gerenciado do AlloyDB para PostgreSQL. |
| Infraestrutura de RAG usando a Vertex AI e o Cloud SQL | Armazena embeddings vetoriais junto com dados operacionais em um banco de dados do Cloud SQL totalmente gerenciado. |
| Infraestrutura de RAG usando o GKE e o Cloud SQL | Crie aplicativos RAG personalizados usando ferramentas de código aberto, como Ray, Hugging Face e LangChain. |
| Infraestrutura do GraphRAG usando a Vertex AI e o Spanner Graph | Combine a pesquisa vetorial com consultas de mapa de informações para recuperar dados contextuais interconectados. |
| Conectividade particular para aplicativos de IA generativa com capacidade de RAG | Proteja a infraestrutura de rede para aplicativos de IA generativa com capacidade de RAG usando a VPC compartilhada. |
| Aproveitar o pipeline de CI/CD para aplicativos RAG | Configure um pipeline de integração contínua (CI) e implantação contínua (CD) para aplicativos RAG. |