AI generativa con RAG

Utilizza le seguenti guide all'architettura per progettare ed eseguire il deployment di applicazioni di AI generativa con Retrieval-Augmented Generation (RAG) in Google Cloud.

Guida all'architettura Descrizione
Infrastruttura RAG per l'AI generativa utilizzando Gemini Enterprise e Vertex AI Un'architettura basata su agenti che utilizza Gemini Enterprise come piattaforma unificata per orchestrare un flusso di dati RAG end-to-end per applicazioni aziendali che richiedono la disponibilità di dati in tempo reale e una ricerca contestuale arricchita.
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e Vector Search Un'architettura serverless completamente gestita che fornisce una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e AlloyDB per PostgreSQL Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come AlloyDB per PostgreSQL.
Soluzione già pronta: RAG di AI generativa utilizzando Vertex AI e Cloud SQL Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come Cloud SQL.
Infrastruttura RAG per l'AI generativa utilizzando GKE e Cloud SQL Un'architettura flessibile basata su container che offre il massimo controllo per creare applicazioni personalizzate con strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG per l'AI generativa utilizzando Vertex AI e Spanner Graph Un'architettura RAG avanzata che combina la ricerca vettoriale con query del knowledge graph per recuperare dati contestuali interconnessi, il che si traduce in risposte dell'AI generativa più dettagliate e pertinenti.
Sfrutta la pipeline CI/CD per le applicazioni RAG Un'architettura per una pipeline di integrazione continua (CI) e deployment continuo (CD) per un'applicazione RAG in Google Cloud.