Guide all'architettura dell'AI generativa

Last reviewed 2025-01-06 UTC

Questo documento nell'Architecture Center fornisce guide all'architettura per aiutarti a creare ed eseguire il deployment di carichi di lavoro di AI generativa in Google Cloud.

Per scoprire come configurare, eseguire il deployment, valutare e utilizzare applicazioni di AI generativa su modelli di base, consulta Esegui il deployment e utilizza applicazioni di AI generativa.

Architetture di alto livello

Le seguenti guide forniscono architetture di alto livello per casi d'uso tecnici e aziendali specifici dell'AI generativa:

Guida Descrizione
Genera campagne di marketing personalizzate Genera asset multimediali per campagne di marketing personalizzate.
Genera consigli sui prodotti personalizzati Genera consigli personalizzati sui prodotti in base alle preferenze degli utenti per le applicazioni retail.
Generare podcast da file audio Genera podcast basati su file multimediali come i commenti in diretta di un evento sportivo.
Genera soluzioni per le richieste di assistenza clienti Genera risposte alle domande dei clienti, ad esempio richieste di assistenza tecnologica.

Architetture di riferimento

Le seguenti guide forniscono esempi di architettura dettagliati e consigli di progettazione per il deployment di carichi di lavoro e infrastrutture di AI generativa per casi d'uso specifici:

Guida Descrizione
Automatizzare la revisione dell'utilizzo delle richieste di rimborso assicurativo Migliorare la procedura di autorizzazione preventiva (PA) e revisione dell'utilizzo (UR) per le richieste di rimborso dell'assicurazione sanitaria.
Infrastruttura RAG che utilizza Gemini Enterprise e Gemini Enterprise Agent Platform Orchestra un flusso di lavoro RAG agentico con disponibilità di dati in tempo reale e ricerca contestuale arricchita.
Infrastruttura RAG che utilizza Agent Platform e Vector Search Fornire una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG che utilizza Agent Platform e AlloyDB per PostgreSQL Archivia gli embedding vettoriali insieme ai dati operativi in un database AlloyDB per PostgreSQL completamente gestito.
Infrastruttura RAG che utilizza Agent Platform e Cloud SQL Archivia gli incorporamenti vettoriali insieme ai dati operativi in un database Cloud SQL completamente gestito.
Infrastruttura RAG che utilizza GKE e Cloud SQL Crea applicazioni RAG personalizzate utilizzando strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG che utilizza Agent Platform e Spanner Graph Combina la ricerca vettoriale con le query del Knowledge Graph per recuperare dati contestuali interconnessi.
Connettività privata per applicazioni di AI generativa compatibili con RAG Proteggi l'infrastruttura di rete per le applicazioni di AI generativa compatibili con RAG utilizzando il VPC condiviso.
Sfrutta la pipeline CI/CD per le applicazioni RAG Configura una pipeline di integrazione continua (CI) e deployment continuo (CD) per le applicazioni RAG.