Ce document du centre d'architecture fournit des guides d'architecture pour vous aider à créer et à déployer des charges de travail d'IA générative dans Google Cloud.
Pour savoir comment configurer, déployer, évaluer et utiliser des applications d'IA générative sur des modèles de fondation, consultez Déployer et utiliser des applications d'IA générative.
Architectures de haut niveau
Les guides suivants fournissent des architectures générales pour des cas d'utilisation spécifiques de l'IA générative, tant au niveau commercial que technique :
| Guide | Description |
|---|---|
| Générer des campagnes marketing personnalisées | Générez des composants média pour des campagnes marketing personnalisées. |
| Générez des recommandations de produits personnalisées. | Générez des recommandations de produits personnalisées en fonction des préférences des utilisateurs pour les applications de vente au détail. |
| Générer des podcasts à partir de fichiers audio | Générez des podcasts à partir de fichiers multimédias, comme des commentaires en direct pour un événement sportif. |
| Générer des solutions pour les demandes d'assistance client | Générez des réponses aux questions des clients, comme les demandes d'assistance technique. |
Architectures de référence
Les guides suivants fournissent des exemples d'architecture détaillés et des recommandations de conception pour déployer des charges de travail et une infrastructure d'IA générative pour des cas d'utilisation spécifiques :
| Guide | Description |
|---|---|
| Automatiser l'examen de l'utilisation des demandes d'assurance | Améliorez le processus d'autorisation préalable (AP) et d'examen de l'utilisation (UR) pour les demandes de remboursement d'assurance santé. |
| Infrastructure RAG utilisant Gemini Enterprise et Vertex AI | Orchestrez un workflow RAG agentif avec disponibilité des données en temps réel et recherche contextuelle enrichie. |
| Infrastructure RAG utilisant Vertex AI et Vector Search | Fournir une recherche vectorielle optimisée et hautes performances pour les applications à grande échelle. |
| Infrastructure RAG utilisant Vertex AI et AlloyDB pour PostgreSQL | Stockez les embeddings vectoriels à côté des données opérationnelles dans une base de données AlloyDB pour PostgreSQL entièrement gérée. |
| Infrastructure RAG utilisant Vertex AI et Cloud SQL | Stocke les embeddings vectoriels à côté des données opérationnelles dans une base de données Cloud SQL entièrement gérée. |
| Infrastructure RAG utilisant GKE et Cloud SQL | Créez des applications RAG personnalisées à l'aide d'outils Open Source tels que Ray, Hugging Face et LangChain. |
| Infrastructure GraphRAG utilisant Vertex AI et Spanner Graph | Combinez la recherche vectorielle avec les requêtes du Knowledge Graph pour récupérer des données contextuelles interconnectées. |
| Connectivité privée pour les applications d'IA générative compatibles avec RAG | Sécurisez l'infrastructure réseau des applications d'IA générative compatibles avec RAG à l'aide d'un VPC partagé. |
| Exploiter le pipeline CI/CD pour les applications RAG | Configurez un pipeline d'intégration continue (CI) et de déploiement continu (CD) pour les applications RAG. |