IA generativa com RAG

Use os seguintes guias de arquitetura para criar e implementar aplicações de IA generativa com geração aumentada de recuperação (RAG) no Google Cloud.

Guia de arquitetura Descrição
Infraestrutura de RAG para IA generativa com o Gemini Enterprise e o Vertex AI Uma arquitetura orientada por agentes que usa o Gemini Enterprise como uma plataforma unificada para orquestrar um fluxo de dados RAG ponto a ponto para aplicações empresariais que requerem disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura de RAG para IA generativa com o Vertex AI e a pesquisa vetorial Uma arquitetura sem servidor totalmente gerida que oferece uma pesquisa vetorial otimizada e de alto desempenho para aplicações de grande escala.
Infraestrutura de RAG para IA generativa com o Vertex AI e o AlloyDB para PostgreSQL Uma arquitetura que armazena incorporações de vetores juntamente com os seus dados operacionais numa base de dados totalmente gerida, como o AlloyDB para PostgreSQL.
Jump Start Solution: IA generativa RAG com o Vertex AI e o Cloud SQL Uma arquitetura que armazena incorporações vetoriais juntamente com os seus dados operacionais numa base de dados totalmente gerida, como o Cloud SQL.
Infraestrutura de RAG para IA generativa com o GKE e o Cloud SQL Uma arquitetura flexível baseada em contentores que oferece o máximo de controlo para criar aplicações personalizadas com ferramentas de código aberto, como Ray, Hugging Face e LangChain.
Infraestrutura GraphRAG para IA generativa com o Vertex AI e o Spanner Graph Uma arquitetura RAG avançada que combina a pesquisa vetorial com consultas de grafos de conhecimentos para obter dados interligados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes.
Tire partido da pipeline de CI/CD para aplicações RAG Uma arquitetura para uma pipeline de integração contínua (CI) e implementação contínua (CD) para uma aplicação RAG no Google Cloud.