Guide all'architettura dell'AI generativa

Last reviewed 2025-01-06 UTC

Questo documento del Centro architettura fornisce guide all'architettura per aiutarti a creare e implementare carichi di lavoro di AI generativa in Google Cloud.

Per scoprire come configurare, eseguire il deployment, valutare e utilizzare applicazioni di AI generativa sui modelli di base, consulta Esegui il deployment e utilizza applicazioni di AI generativa.

Architetture di alto livello

Le seguenti guide forniscono architetture di alto livello per casi d'uso tecnici e aziendali specifici dell'AI generativa:

Guida	Descrizione
Genera campagne di marketing personalizzate	Genera asset multimediali per campagne di marketing personalizzate.
Genera consigli sui prodotti personalizzati	Generare consigli personalizzati sui prodotti in base alle preferenze degli utenti per le applicazioni retail.
Generare podcast da file audio	Generare podcast basati su file multimediali come i commenti in diretta di un evento sportivo.
Genera soluzioni per le richieste di assistenza clienti	Genera risposte alle domande dei clienti, ad esempio richieste di assistenza tecnologica.

Architetture di riferimento

Le seguenti guide forniscono esempi di architettura dettagliati e consigli di progettazione per il deployment di workload e infrastrutture di AI generativa per casi d'uso specifici:

Guida	Descrizione
Automatizzare la revisione dell'utilizzo delle richieste di rimborso assicurativo	Migliora la procedura di autorizzazione preventiva (PA) e revisione dell'utilizzo (UR) per le richieste di rimborso dell'assicurazione sanitaria.
Infrastruttura RAG utilizzando Gemini Enterprise e Vertex AI	Orchestra un flusso di lavoro RAG agentico con disponibilità di dati in tempo reale e ricerca contestuale arricchita.
Infrastruttura RAG che utilizza Vertex AI e Vector Search	Fornire una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG che utilizza Vertex AI e AlloyDB per PostgreSQL	Archivia gli embedding vettoriali insieme ai dati operativi in un database AlloyDB per PostgreSQL completamente gestito.
Infrastruttura RAG utilizzando Vertex AI e Cloud SQL	Archivia gli incorporamenti vettoriali insieme ai dati operativi in un database Cloud SQL completamente gestito.
Infrastruttura RAG utilizzando GKE e Cloud SQL	Crea applicazioni RAG personalizzate utilizzando strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG che utilizza Vertex AI e Spanner Graph	Combina la ricerca vettoriale con le query del Knowledge Graph per recuperare dati contestuali interconnessi.
Connettività privata per applicazioni di AI generativa compatibili con RAG	Proteggi l'infrastruttura di rete per le applicazioni di AI generativa compatibili con RAG utilizzando il VPC condiviso.
Sfrutta la pipeline CI/CD per le applicazioni RAG	Configura una pipeline di integrazione continua (CI) e deployment continuo (CD) per le applicazioni RAG.

Guide all'architettura dell'AI generativa Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Architetture di alto livello

Architetture di riferimento

Guide all'architettura dell'AI generativa