Guide all'architettura dell'AI generativa

Last reviewed 2025-01-06 UTC

Questo documento del Centro architettura fornisce guide all'architettura per aiutarti a creare e implementare carichi di lavoro di AI generativa in Google Cloud.

Per scoprire come configurare, eseguire il deployment, valutare e utilizzare applicazioni di AI generativa sui modelli di base, consulta Esegui il deployment e utilizza applicazioni di AI generativa.

Architetture di alto livello

Le seguenti guide forniscono architetture di alto livello per casi d'uso tecnici e aziendali specifici dell'AI generativa:

Guida Descrizione
Genera campagne di marketing personalizzate Genera asset multimediali per campagne di marketing personalizzate.
Genera consigli sui prodotti personalizzati Generare consigli personalizzati sui prodotti in base alle preferenze degli utenti per le applicazioni retail.
Generare podcast da file audio Generare podcast basati su file multimediali come i commenti in diretta di un evento sportivo.
Genera soluzioni per le richieste di assistenza clienti Genera risposte alle domande dei clienti, ad esempio richieste di assistenza tecnologica.

Architetture di riferimento

Le seguenti guide forniscono esempi di architettura dettagliati e consigli di progettazione per il deployment di workload e infrastrutture di AI generativa per casi d'uso specifici:

Guida Descrizione
Automatizzare la revisione dell'utilizzo delle richieste di rimborso assicurativo Migliora la procedura di autorizzazione preventiva (PA) e revisione dell'utilizzo (UR) per le richieste di rimborso dell'assicurazione sanitaria.
Infrastruttura RAG utilizzando Gemini Enterprise e Vertex AI Orchestra un flusso di lavoro RAG agentico con disponibilità di dati in tempo reale e ricerca contestuale arricchita.
Infrastruttura RAG che utilizza Vertex AI e Vector Search Fornire una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG che utilizza Vertex AI e AlloyDB per PostgreSQL Archivia gli embedding vettoriali insieme ai dati operativi in un database AlloyDB per PostgreSQL completamente gestito.
Infrastruttura RAG utilizzando Vertex AI e Cloud SQL Archivia gli incorporamenti vettoriali insieme ai dati operativi in un database Cloud SQL completamente gestito.
Infrastruttura RAG utilizzando GKE e Cloud SQL Crea applicazioni RAG personalizzate utilizzando strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG che utilizza Vertex AI e Spanner Graph Combina la ricerca vettoriale con le query del Knowledge Graph per recuperare dati contestuali interconnessi.
Connettività privata per applicazioni di AI generativa compatibili con RAG Proteggi l'infrastruttura di rete per le applicazioni di AI generativa compatibili con RAG utilizzando il VPC condiviso.
Sfrutta la pipeline CI/CD per le applicazioni RAG Configura una pipeline di integrazione continua (CI) e deployment continuo (CD) per le applicazioni RAG.