Last reviewed 2025-09-22 UTC
Utilisez les guides d'architecture suivants pour concevoir et déployer des applications d'IA générative avec la génération augmentée par récupération (RAG) dans Google Cloud.
| Guide d'architecture | Description |
|---|---|
| Infrastructure RAG pour l'IA générative à l'aide de Gemini Enterprise et de Vertex AI | Architecture basée sur un agent qui utilise Gemini Enterprise comme plate-forme unifiée pour orchestrer un flux de données RAG de bout en bout pour les applications d'entreprise qui nécessitent une disponibilité des données en temps réel et une recherche contextuelle enrichie. |
| Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et de Vector Search | Architecture sans serveur entièrement gérée qui fournit une recherche vectorielle optimisée et hautes performances pour les applications à grande échelle. |
| Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL | Architecture qui stocke les embeddings vectoriels avec vos données opérationnelles dans une base de données entièrement gérée comme AlloyDB for PostgreSQL. |
| Solution de démarrage rapide : RAG d'IA générative à l'aide de Vertex AI et de Cloud SQL | Architecture qui stocke les embeddings vectoriels avec vos données opérationnelles dans une base de données entièrement gérée comme Cloud SQL. |
| Infrastructure RAG pour l'IA générative à l'aide de GKE et de Cloud SQL | Architecture flexible basée sur des conteneurs qui offre un contrôle maximal pour créer des applications personnalisées avec des outils Open Source tels que Ray, Hugging Face et LangChain. |
| Infrastructure GraphRAG pour l'IA générative à l'aide de Vertex AI et de Spanner Graph | Architecture RAG avancée qui combine la recherche vectorielle avec des requêtes de graphe de connaissances pour récupérer des données interconnectées et contextuelles, ce qui génère des réponses d'IA générative plus détaillées et pertinentes. |
| Exploiter le pipeline CI/CD pour les applications RAG | Architecture pour un pipeline d'intégration continue (CI) et de déploiement continu (CD) pour une application RAG dans Google Cloud. |