Utilisez les guides d'architecture suivants pour concevoir et déployer des applications d'IA générative avec la génération augmentée de récupération (RAG) dans Google Cloud.
| Guide d'architecture | Description |
|---|---|
| Infrastructure RAG pour l'IA générative avec Gemini Enterprise et Vertex AI | Une architecture pilotée par des agents qui utilise Gemini Enterprise comme plate-forme unifiée pour orchestrer un flux de données RAG de bout en bout pour les applications d'entreprise qui nécessitent une disponibilité des données en temps réel et une recherche contextuelle enrichie. |
| Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et Vector Search | Architecture sans serveur entièrement gérée qui fournit une recherche vectorielle hautes performances et optimisée pour les applications à grande échelle. |
| Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL | Une architecture qui stocke les embeddings vectoriels à côté de vos données opérationnelles dans une base de données entièrement gérée comme AlloyDB pour PostgreSQL. |
| Solution de démarrage rapide : RAG d'IA générative avec Vertex AI et Cloud SQL | Une architecture qui stocke les embeddings vectoriels à côté de vos données opérationnelles dans une base de données entièrement gérée comme Cloud SQL. |
| Infrastructure RAG pour l'IA générative à l'aide de GKE et Cloud SQL | Une architecture flexible basée sur des conteneurs qui offre un contrôle maximal pour créer des applications personnalisées avec des outils Open Source tels que Ray, Hugging Face et LangChain. |
| Infrastructure GraphRAG pour l'IA générative à l'aide de Vertex AI et Spanner Graph | Une architecture RAG avancée qui combine la recherche vectorielle avec des requêtes Knowledge Graph pour récupérer des données contextuelles interconnectées, ce qui permet d'obtenir des réponses d'IA générative plus détaillées et pertinentes. |
| Pipeline CI/CD Harness pour les applications RAG | Architecture d'un pipeline d'intégration continue (CI) et de déploiement continu (CD) pour une application RAG dans Google Cloud. |