Utilizza le seguenti guide all'architettura per progettare ed eseguire il deployment di applicazioni di AI generativa con Retrieval-Augmented Generation (RAG) in Google Cloud.
| Guida all'architettura | Descrizione |
|---|---|
| Infrastruttura RAG per l'AI generativa utilizzando Gemini Enterprise e Vertex AI | Un'architettura basata su agenti che utilizza Gemini Enterprise come piattaforma unificata per orchestrare un flusso di dati RAG end-to-end per applicazioni aziendali che richiedono la disponibilità di dati in tempo reale e una ricerca contestuale arricchita. |
| Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e Vector Search | Un'architettura serverless completamente gestita che fornisce una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala. |
| Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e AlloyDB per PostgreSQL | Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come AlloyDB per PostgreSQL. |
| Soluzione già pronta: RAG di AI generativa utilizzando Vertex AI e Cloud SQL | Un'architettura che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come Cloud SQL. |
| Infrastruttura RAG per l'AI generativa utilizzando GKE e Cloud SQL | Un'architettura flessibile basata su container che offre il massimo controllo per creare applicazioni personalizzate con strumenti open source come Ray, Hugging Face e LangChain. |
| Infrastruttura GraphRAG per l'AI generativa utilizzando Vertex AI e Spanner Graph | Un'architettura RAG avanzata che combina la ricerca vettoriale con query del knowledge graph per recuperare dati contestuali interconnessi, il che si traduce in risposte dell'AI generativa più dettagliate e pertinenti. |
| Sfrutta la pipeline CI/CD per le applicazioni RAG | Un'architettura per una pipeline di integrazione continua (CI) e deployment continuo (CD) per un'applicazione RAG in Google Cloud. |