Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Facturation du moteur RAG Vertex AI

Cette page décrit la tarification et la facturation du moteur RAG Vertex AI en fonction des composants que vous utilisez, tels que les modèles, le reranking et le stockage vectoriel.

Pour en savoir plus, consultez la page Présentation du moteur RAG Vertex AI.

Tarification et facturation

Ce tableau explique comment fonctionne la facturation lorsque vous utilisez les composants RAG.

Composant	Fonctionnement de la facturation avec le moteur RAG Vertex AI
Ingestion de données	Le moteur RAG Vertex AI est compatible avec l'ingestion de données provenant de différentes sources. Par exemple, l'importation de fichiers locaux, Cloud Storage et Google Drive. L'accès aux fichiers de ces sources de données à partir du moteur RAG Vertex AI est sans frais, mais ces sources de données peuvent facturer le transfert de données. Par exemple, les coûts de sortie des données.
Transformation des données (analyse de fichiers)	Analyseur par défaut : sans frais. Analyseur LLM : le moteur RAG Vertex AI utilise le modèle LLM que vous avez spécifié pour analyser votre fichier. Vous verrez et paierez les coûts du modèle LLM directement depuis votre projet. Analyseur de mise en page Document AI : le moteur RAG Vertex AI utilise l'analyseur de mise en page Document AI que vous avez spécifié pour traiter votre fichier. Vous verrez et paierez l'utilisation de l'analyseur de mise en page Document AI directement depuis votre projet.
Transformation des données (segmentation de fichiers)	Compatible avec la segmentation de taille fixe, qui est sans frais.
Génération d'embeddings	Le moteur RAG Vertex AI orchestre la génération d'embeddings à l'aide du modèle d'embedding que vous avez spécifié, et votre projet est facturé pour les coûts associés à ce modèle. Pour en savoir plus sur les tarifs, consultez Coût de création et de déploiement de modèles d'IA dans Vertex AI.
Indexation et récupération de données	Remarque : Le moteur RAG Vertex AI utilise Spanner comme backend pour ses opérations d'indexation et de récupération de données. L'utilisation de Spanner entraîne des frais de facturation associés. Pour en savoir plus, consultez la page Tarifs de Spanner. Le moteur RAG est compatible avec deux catégories de bases de données vectorielles pour la recherche vectorielle : Base de données gérée par RAG Base de données vectorielle que vous fournissez Une base de données gérée par RAG a deux objectifs : Une base de données gérée par RAG stocke les ressources RAG, telles que les corpus et les fichiers RAG. Le contenu des fichiers est exclu. Indexation et récupération d'embeddings pour la recherche vectorielle, selon votre choix. Une base de données gérée par RAG utilise une instance Spanner comme backend. Pour chacun de vos projets, le moteur RAG Vertex AI provisionne un projet spécifique au client Google Cloud et gère les ressources gérées par RAG stockées dans le moteur RAG Vertex AI, de sorte que vos données soient physiquement isolées. Si vous choisissez le niveau de service de base `RagManagedDB`ou le niveau de service à la demande, le moteur RAG Vertex AI provisionne une instance Spanner Enterprise Edition dans le projet correspondant : Niveau de service de base : 100 unités de traitement avec sauvegarde Niveau de service à la demande : à partir d'un nœud (1 000 unités de traitement) et autoscaling jusqu'à 10 nœuds avec sauvegarde Si un corpus RAG de votre projet choisit d'utiliser une base de données gérée par RAG pour la recherche vectorielle, l'instance Spanner gérée par RAG vous sera facturée. Le moteur RAG Vertex AI affiche les coûts Spanner de votre projet géré par RAG correspondant dans votre Google Cloud projet, afin que vous puissiez voir et payer les coûts de l'instance Spanner. Pour en savoir plus sur les tarifs de Spanner, consultez la page Tarifs de Spanner.
Reranking pour le moteur RAG Vertex AI	Les outils de classement suivants sont compatibles après la récupération : Reranker LLM : le moteur RAG Vertex AI utilise le modèle LLM que vous avez spécifié pour classer à nouveau les résultats de récupération. Vous verrez et paierez les coûts du modèle LLM directement depuis votre projet. API de classement Agent Search : le moteur RAG Vertex AI utilise l'API de classement Agent Search pour classer à nouveau les résultats de récupération. Vous verrez et paierez l'API de classement directement depuis votre projet.

Supprimer le moteur RAG Vertex AI

Les exemples de code suivants montrent comment supprimer un moteur RAG Vertex AI pour la Google Cloud console, Python et REST :

Paramètres d'API et exemples de code de la version 1 (v1).
Paramètres d'API v1beta1 et exemples de code.

Étape suivante

Pour savoir comment utiliser le SDK Vertex AI pour exécuter des tâches du moteur RAG Vertex AI, consultez Démarrage rapide avec RAG pour Python.
Pour en savoir plus sur l'ancrage, consultez Présentation de l'ancrage.
Pour en savoir plus sur les réponses du moteur RAG, consultez Résultats de récupération et de génération du moteur RAG de Vertex AI.
Pour en savoir plus sur l'architecture RAG :
- Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Vertex AI et de la recherche vectorielle
- Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL.