IA generativa com RAG

Use os seguintes guias de arquitetura para projetar e implantar aplicativos de IA generativa com geração aumentada de recuperação (RAG) em Google Cloud.

Guia de arquitetura Descrição
Infraestrutura de RAG para IA generativa usando o Gemini Enterprise e a Vertex AI Uma arquitetura orientada por agentes que usa o Gemini Enterprise como uma plataforma unificada para orquestrar um fluxo de dados RAG de ponta a ponta para aplicativos empresariais que exigem disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura de RAG para IA generativa usando a Vertex AI e a Vector Search Uma arquitetura sem servidor totalmente gerenciada que oferece pesquisa vetorial otimizada e de alta performance para aplicativos em grande escala.
Infraestrutura de RAG para IA generativa usando a Vertex AI e o AlloyDB para PostgreSQL Uma arquitetura que armazena embeddings de vetores junto com seus dados operacionais em um banco de dados totalmente gerenciado, como o AlloyDB para PostgreSQL.
Solução de início rápido: RAG de IA generativa usando a Vertex AI e o Cloud SQL Uma arquitetura que armazena embeddings vetoriais junto com seus dados operacionais em um banco de dados totalmente gerenciado, como o Cloud SQL.
Infraestrutura de RAG para IA generativa usando o GKE e o Cloud SQL Uma arquitetura flexível baseada em contêineres que oferece controle máximo para criar aplicativos personalizados com ferramentas de código aberto, como Ray, Hugging Face e LangChain.
Infraestrutura do GraphRAG para IA generativa usando a Vertex AI e o Spanner Graph Uma arquitetura avançada de RAG que combina a pesquisa vetorial com consultas do Mapa de Informações para recuperar dados interconectados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes.
Usar o pipeline de CI/CD para aplicativos RAG Uma arquitetura para um pipeline de integração contínua (CI) e implantação contínua (CD) de um aplicativo RAG em Google Cloud.