AI generativa con RAG

Last reviewed 2025-09-22 UTC

Utilizza le seguenti guide all'architettura per progettare ed eseguire il deployment di applicazioni di AI generativa con Retrieval-Augmented Generation (RAG) in Google Cloud.

Guida all'architettura	Descrizione
Infrastruttura RAG per l'AI generativa utilizzando Gemini Enterprise e Vertex AI	Un'architettura basata su agenti che utilizza Gemini Enterprise come piattaforma unificata per orchestrare un flusso di dati RAG end-to-end per applicazioni aziendali che richiedono la disponibilità di dati in tempo reale e una ricerca contestuale arricchita.
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e Vector Search	Un'architettura serverless completamente gestita che fornisce una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e AlloyDB per PostgreSQL	Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come AlloyDB per PostgreSQL.
Soluzione Jump Start: RAG di AI generativa utilizzando Vertex AI e Cloud SQL	Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come Cloud SQL.
Infrastruttura RAG per l'AI generativa utilizzando GKE e Cloud SQL	Un'architettura flessibile basata su container che offre il massimo controllo per creare applicazioni personalizzate con strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG per l'AI generativa utilizzando Vertex AI e Spanner Graph	Un'architettura RAG avanzata che combina la ricerca vettoriale con query del knowledge graph per recuperare dati contestuali interconnessi, il che si traduce in risposte dell'AI generativa più dettagliate e pertinenti.
Sfrutta la pipeline CI/CD per le applicazioni RAG	Un'architettura per una pipeline di integrazione continua (CI) e deployment continuo (CD) per un'applicazione RAG in Google Cloud.

Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.

Ultimo aggiornamento 2025-09-22 UTC.