Use os seguintes guias de arquitetura para projetar e implantar aplicativos de IA generativa com geração aumentada de recuperação (RAG) em Google Cloud.
| Guia de arquitetura | Descrição |
|---|---|
| Infraestrutura de RAG para IA generativa usando o Gemini Enterprise e a Vertex AI | Uma arquitetura orientada por agentes que usa o Gemini Enterprise como uma plataforma unificada para orquestrar um fluxo de dados RAG de ponta a ponta para aplicativos empresariais que exigem disponibilidade de dados em tempo real e pesquisa contextual enriquecida. |
| Infraestrutura de RAG para IA generativa usando a Vertex AI e a Vector Search | Uma arquitetura sem servidor totalmente gerenciada que oferece pesquisa vetorial otimizada e de alta performance para aplicativos em grande escala. |
| Infraestrutura de RAG para IA generativa usando a Vertex AI e o AlloyDB para PostgreSQL | Uma arquitetura que armazena embeddings de vetores junto com seus dados operacionais em um banco de dados totalmente gerenciado, como o AlloyDB para PostgreSQL. |
| Solução de início rápido: RAG de IA generativa usando a Vertex AI e o Cloud SQL | Uma arquitetura que armazena embeddings vetoriais junto com seus dados operacionais em um banco de dados totalmente gerenciado, como o Cloud SQL. |
| Infraestrutura de RAG para IA generativa usando o GKE e o Cloud SQL | Uma arquitetura flexível baseada em contêineres que oferece controle máximo para criar aplicativos personalizados com ferramentas de código aberto, como Ray, Hugging Face e LangChain. |
| Infraestrutura do GraphRAG para IA generativa usando a Vertex AI e o Spanner Graph | Uma arquitetura avançada de RAG que combina a pesquisa vetorial com consultas do Mapa de Informações para recuperar dados interconectados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes. |
| Usar o pipeline de CI/CD para aplicativos RAG | Uma arquitetura para um pipeline de integração contínua (CI) e implantação contínua (CD) de um aplicativo RAG em Google Cloud. |