Use os seguintes guias de arquitetura para criar e implementar aplicações de IA generativa com geração aumentada de recuperação (RAG) no Google Cloud.
| Guia de arquitetura | Descrição |
|---|---|
| Infraestrutura de RAG para IA generativa com o Gemini Enterprise e o Vertex AI | Uma arquitetura orientada por agentes que usa o Gemini Enterprise como uma plataforma unificada para orquestrar um fluxo de dados RAG ponto a ponto para aplicações empresariais que requerem disponibilidade de dados em tempo real e pesquisa contextual enriquecida. |
| Infraestrutura de RAG para IA generativa com o Vertex AI e a pesquisa vetorial | Uma arquitetura sem servidor totalmente gerida que oferece uma pesquisa vetorial otimizada e de alto desempenho para aplicações de grande escala. |
| Infraestrutura de RAG para IA generativa com o Vertex AI e o AlloyDB para PostgreSQL | Uma arquitetura que armazena incorporações de vetores juntamente com os seus dados operacionais numa base de dados totalmente gerida, como o AlloyDB para PostgreSQL. |
| Jump Start Solution: IA generativa RAG com o Vertex AI e o Cloud SQL | Uma arquitetura que armazena incorporações vetoriais juntamente com os seus dados operacionais numa base de dados totalmente gerida, como o Cloud SQL. |
| Infraestrutura de RAG para IA generativa com o GKE e o Cloud SQL | Uma arquitetura flexível baseada em contentores que oferece o máximo de controlo para criar aplicações personalizadas com ferramentas de código aberto, como Ray, Hugging Face e LangChain. |
| Infraestrutura GraphRAG para IA generativa com o Vertex AI e o Spanner Graph | Uma arquitetura RAG avançada que combina a pesquisa vetorial com consultas de grafos de conhecimentos para obter dados interligados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes. |
| Tire partido da pipeline de CI/CD para aplicações RAG | Uma arquitetura para uma pipeline de integração contínua (CI) e implementação contínua (CD) para uma aplicação RAG no Google Cloud. |