AI generativa con RAG

Last reviewed 2025-09-22 UTC

Utilizza le seguenti guide all'architettura per progettare ed eseguire il deployment di applicazioni di AI generativa con Retrieval Augmented Generation (RAG) in Google Cloud.

Guida all'architettura Descrizione
Infrastruttura RAG per l'AI generativa che utilizza Gemini Enterprise e Vertex AI Un'architettura basata su agenti che utilizza Gemini Enterprise come piattaforma unificata per orchestrare un flusso di dati RAG end-to-end per applicazioni aziendali che richiedono la disponibilità di dati in tempo reale e la ricerca contestuale arricchita.
Infrastruttura RAG per l'AI generativa che utilizza Vertex AI e Vector Search Un'architettura serverless completamente gestita che fornisce una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG per l'AI generativa che utilizza Vertex AI e AlloyDB per PostgreSQL Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come AlloyDB per PostgreSQL.
Soluzione già pronta: RAG per l'AI generativa che utilizza Vertex AI e Cloud SQL Un'architettura che archivia gli incorporamenti vettoriali insieme ai tuoi dati operativi in un database completamente gestito come Cloud SQL.
Infrastruttura RAG per l'AI generativa che utilizza GKE e Cloud SQL Un'architettura flessibile basata su container che offre il massimo controllo per creare applicazioni personalizzate con strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG per l'AI generativa che utilizza Vertex AI e Spanner Graph Un'architettura RAG avanzata che combina la ricerca vettoriale con le query del grafo di conoscenza per recuperare dati contestuali interconnessi, il che si traduce in risposte di AI generativa più dettagliate e pertinenti.
Sfrutta la pipeline CI/CD per le applicazioni RAG Un'architettura per una pipeline di integrazione continua (CI) e deployment continuo (CD) per un'applicazione RAG in Google Cloud.