Questo documento del Centro architettura fornisce guide all'architettura per aiutarti a creare e implementare carichi di lavoro di AI generativa in Google Cloud.
Per scoprire come configurare, eseguire il deployment, valutare e utilizzare applicazioni di AI generativa sui modelli di base, consulta Esegui il deployment e utilizza applicazioni di AI generativa.
Architetture di alto livello
Le seguenti guide forniscono architetture di alto livello per casi d'uso tecnici e aziendali specifici dell'AI generativa:
| Guida | Descrizione |
|---|---|
| Genera campagne di marketing personalizzate | Genera asset multimediali per campagne di marketing personalizzate. |
| Genera consigli sui prodotti personalizzati | Generare consigli personalizzati sui prodotti in base alle preferenze degli utenti per le applicazioni retail. |
| Generare podcast da file audio | Generare podcast basati su file multimediali come i commenti in diretta di un evento sportivo. |
| Genera soluzioni per le richieste di assistenza clienti | Genera risposte alle domande dei clienti, ad esempio richieste di assistenza tecnologica. |
Architetture di riferimento
Le seguenti guide forniscono esempi di architettura dettagliati e consigli di progettazione per il deployment di workload e infrastrutture di AI generativa per casi d'uso specifici:
| Guida | Descrizione |
|---|---|
| Automatizzare la revisione dell'utilizzo delle richieste di rimborso assicurativo | Migliora la procedura di autorizzazione preventiva (PA) e revisione dell'utilizzo (UR) per le richieste di rimborso dell'assicurazione sanitaria. |
| Infrastruttura RAG utilizzando Gemini Enterprise e Vertex AI | Orchestra un flusso di lavoro RAG agentico con disponibilità di dati in tempo reale e ricerca contestuale arricchita. |
| Infrastruttura RAG che utilizza Vertex AI e Vector Search | Fornire una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala. |
| Infrastruttura RAG che utilizza Vertex AI e AlloyDB per PostgreSQL | Archivia gli embedding vettoriali insieme ai dati operativi in un database AlloyDB per PostgreSQL completamente gestito. |
| Infrastruttura RAG utilizzando Vertex AI e Cloud SQL | Archivia gli incorporamenti vettoriali insieme ai dati operativi in un database Cloud SQL completamente gestito. |
| Infrastruttura RAG utilizzando GKE e Cloud SQL | Crea applicazioni RAG personalizzate utilizzando strumenti open source come Ray, Hugging Face e LangChain. |
| Infrastruttura GraphRAG che utilizza Vertex AI e Spanner Graph | Combina la ricerca vettoriale con le query del Knowledge Graph per recuperare dati contestuali interconnessi. |
| Connettività privata per applicazioni di AI generativa compatibili con RAG | Proteggi l'infrastruttura di rete per le applicazioni di AI generativa compatibili con RAG utilizzando il VPC condiviso. |
| Sfrutta la pipeline CI/CD per le applicazioni RAG | Configura una pipeline di integrazione continua (CI) e deployment continuo (CD) per le applicazioni RAG. |