Questo documento nell'Architecture Center fornisce guide all'architettura per aiutarti a creare ed eseguire il deployment di carichi di lavoro di AI generativa in Google Cloud.
Per scoprire come configurare, eseguire il deployment, valutare e utilizzare applicazioni di AI generativa su modelli di base, consulta Esegui il deployment e utilizza applicazioni di AI generativa.
Architetture di alto livello
Le seguenti guide forniscono architetture di alto livello per casi d'uso tecnici e aziendali specifici dell'AI generativa:
| Guida | Descrizione |
|---|---|
| Genera campagne di marketing personalizzate | Genera asset multimediali per campagne di marketing personalizzate. |
| Genera consigli sui prodotti personalizzati | Genera consigli personalizzati sui prodotti in base alle preferenze degli utenti per le applicazioni retail. |
| Generare podcast da file audio | Genera podcast basati su file multimediali come i commenti in diretta di un evento sportivo. |
| Genera soluzioni per le richieste di assistenza clienti | Genera risposte alle domande dei clienti, ad esempio richieste di assistenza tecnologica. |
Architetture di riferimento
Le seguenti guide forniscono esempi di architettura dettagliati e consigli di progettazione per il deployment di carichi di lavoro e infrastrutture di AI generativa per casi d'uso specifici:
| Guida | Descrizione |
|---|---|
| Automatizzare la revisione dell'utilizzo delle richieste di rimborso assicurativo | Migliorare la procedura di autorizzazione preventiva (PA) e revisione dell'utilizzo (UR) per le richieste di rimborso dell'assicurazione sanitaria. |
| Infrastruttura RAG che utilizza Gemini Enterprise e Gemini Enterprise Agent Platform | Orchestra un flusso di lavoro RAG agentico con disponibilità di dati in tempo reale e ricerca contestuale arricchita. |
| Infrastruttura RAG che utilizza Agent Platform e Vector Search | Fornire una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala. |
| Infrastruttura RAG che utilizza Agent Platform e AlloyDB per PostgreSQL | Archivia gli embedding vettoriali insieme ai dati operativi in un database AlloyDB per PostgreSQL completamente gestito. |
| Infrastruttura RAG che utilizza Agent Platform e Cloud SQL | Archivia gli incorporamenti vettoriali insieme ai dati operativi in un database Cloud SQL completamente gestito. |
| Infrastruttura RAG che utilizza GKE e Cloud SQL | Crea applicazioni RAG personalizzate utilizzando strumenti open source come Ray, Hugging Face e LangChain. |
| Infrastruttura GraphRAG che utilizza Agent Platform e Spanner Graph | Combina la ricerca vettoriale con le query del Knowledge Graph per recuperare dati contestuali interconnessi. |
| Connettività privata per applicazioni di AI generativa compatibili con RAG | Proteggi l'infrastruttura di rete per le applicazioni di AI generativa compatibili con RAG utilizzando il VPC condiviso. |
| Sfrutta la pipeline CI/CD per le applicazioni RAG | Configura una pipeline di integrazione continua (CI) e deployment continuo (CD) per le applicazioni RAG. |