Acheter du débit provisionné

Cette page fournit des informations à prendre en compte avant de vous abonner au débit provisionné, les autorisations dont vous devez disposer pour passer ou afficher une commande de débit provisionné, ainsi que les instructions pour passer et afficher vos commandes de débit provisionné standard.

Si vous souhaitez acheter un débit provisionné à zone unique, contactez votre responsable de compte pour obtenir de l'aide. Google Cloud Pour en savoir plus sur le débit provisionné dans une seule zone, consultez Débit provisionné dans une seule zone.

Éléments à prendre en compte avant l'achat

Pour vous aider à décider si vous souhaitez acheter le débit provisionné, tenez compte des éléments suivants :

  • Vous ne pouvez pas annuler votre commande au milieu de votre période.

    Votre achat de débit provisionné est un engagement, ce qui signifie que vous ne pouvez pas annuler la commande en cours de contrat. Toutefois, vous pouvez augmenter le nombre de GSU achetés. Si vous souscrivez un engagement par accident ou si votre configuration pose problème, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.

  • Vous pouvez renouveler automatiquement votre abonnement.

    Lorsque vous envoyez votre commande, vous pouvez choisir de renouveler automatiquement votre abonnement une fois arrivé à échéance ou de le laisser expirer. Vous pouvez annuler le processus de renouvellement automatique. Pour annuler votre abonnement avant son renouvellement automatique, annulez le renouvellement automatique 30 jours avant le début de la période suivante.

    Vous pouvez configurer le renouvellement automatique des abonnements mensuels chaque mois. Les conditions hebdomadaires ne sont pas compatibles avec le renouvellement automatique.

    Pour en savoir plus, consultez Modifier l'ordre du débit provisionné. Vous pouvez également contacter votre responsable de compte pour obtenir de l'aide. Google Cloud

  • Vous pouvez modifier le comportement du renouvellement automatique, le modèle, la version du modèle ou la région avec préavis.

    Une fois que vous avez choisi votre projet, votre région, votre modèle, votre version de modèle et le comportement du renouvellement automatique, et que votre commande a été approuvée et activée, le débit provisionné est activé, sous réserve de la capacité disponible. Vous pouvez modifier le comportement de renouvellement automatique, le modèle, la version du modèle ou la région en modifiant votre commande de débit provisionné existante à l'aide de la console Google Cloud .

    Toutes les modifications sont traitées du mieux possible et sont généralement appliquées dans les 10 jours ouvrés suivant la demande initiale.

    Les modifications du modèle sont limitées à un éditeur spécifique. Par exemple, vous pouvez modifier l'attribution de modèle du débit provisionné de Google Gemini 2.0 Pro à Google Gemini 2.0 Flash, mais vous ne pouvez pas passer de Google Gemini 2.0 Flash à Claude 3.5 Sonnet v2 d'Anthropic.

  • Par défaut, le dépassement est facturé au tarif de paiement à l'usage.

    Si votre débit dépasse le montant de votre commande de débit provisionné, les dépassements sont traités et facturés sous forme de paiement à l'usage standard. Vous pouvez contrôler les dépassements par requête. Pour en savoir plus, consultez Utiliser le débit provisionné.

Pour en savoir plus sur les tarifs, consultez la section Débit provisionné.

Acheter du débit provisionné pour les modèles en preview

Vous pouvez acheter un débit provisionné pour les modèles Google en aperçu, à condition qu'une version en disponibilité générale du modèle n'ait pas été publiée.

Si vous avez une commande de débit provisionné active pour un modèle en version preview et qu'une version en disponibilité générale du modèle est publiée, vous pouvez effectuer l'une des opérations suivantes :

  • Transférez la commande vers la version en disponibilité générale du modèle. Notez qu'une fois votre commande transférée vers le modèle disponible dans le commerce, vous ne pourrez plus la repasser vers le modèle en version Preview. Pour en savoir plus sur la modification d'une commande, consultez Modifier une commande de débit provisionné.

  • Vous pouvez également continuer à utiliser le débit provisionné pour la version Preview d'un modèle tant que cette version est stable. Pour en savoir plus sur les modèles stables et ceux qui ont été abandonnés, consultez Versions et cycle de vie des modèles.

Rôles et autorisations

Le rôle suivant accorde un accès complet à la gestion du débit provisionné Vertex AI :

  • roles/aiplatform.provisionedThroughputAdmin : vous pouvez accéder aux ressources Vertex AI Provisioned Throughput.

Ce rôle inclut les autorisations suivantes :

Autorisations Description
aiplatform.googleapis.com/provisionedThroughputs.create Envoyez une nouvelle commande de débit provisionné.
aiplatform.googleapis.com/provisionedThroughputs.get Affichez une commande de débit provisionné spécifique.
aiplatform.googleapis.com/provisionedThroughputs.list Affichez toutes les commandes de débit provisionné.
aiplatform.googleapis.com/provisionedThroughputs.update Modifier une commande de débit provisionné
aiplatform.googleapis.com/provisionedThroughputs.cancel Annulez une commande ou une mise à jour en attente.

Passer une commande standard de débit provisionné

Si vous pensez que votre nombre de RPM sera supérieur à 30 000, optimisez votre commande de débit provisionné en demandant un ajustement de quota pour votre quota système Vertex AI par défaut à l'aide des informations suivantes :

  • Service : API Vertex AI.
  • Nom : Online prediction requests per minute per region
  • Type de service : un quota.
  • Dimensions : région dans laquelle vous avez commandé le débit provisionné.
  • Valeur : limite de trafic des prédictions en ligne que vous avez choisie.

Les commandes de débit provisionné sont traitées en fonction de la taille de la commande et de la capacité disponible. Selon le nombre d'UGS demandées et la capacité disponible, le traitement de votre commande peut prendre de quelques minutes à quelques semaines. Lorsque vous passez une commande de débit provisionné, vous pouvez utiliser l'outil d'estimation des unités de scaling pour l'IA générative afin de calculer le nombre de GSU que vous devez acheter. Après avoir examiné l'estimation, vous pouvez la valider ou modifier le nombre d'unités de stockage Google à acheter.

Pour souscrire un abonnement standard au débit provisionné, procédez comme suit : Pour obtenir de l'aide concernant l'achat d'un débit provisionné à zone unique, contactez votre responsable de compte. Google Cloud

Console

  1. Dans la console Google Cloud , accédez à la page Débit provisionné.

    Accéder à la page "Débit provisionné"

  2. Pour créer une commande, cliquez sur Nouvelle commande.
  3. Indiquez un nom de commande.
  4. Sélectionnez le modèle.
  5. Sélectionnez la Région.
  6. Cliquez sur Outil d'estimation.
  7. Dans le volet Outil d'estimation des unités de scaling pour l'IA générative, procédez comme suit pour estimer le nombre de GSU dont vous avez besoin.

    1. Sélectionnez votre modèle.
    2. En fonction du modèle sélectionné, saisissez les détails pour estimer le nombre de GSU nécessaires. Pour en savoir plus sur le montant minimal de GSU et les incréments d'achat pour chaque modèle, consultez Modèles compatibles. Pour en savoir plus sur les capacités d'un modèle et les limites d'entrée ou de sortie, consultez la documentation du modèle.

      • Pour les modèles Gemini 3 Pro, Gemini 2.5 Pro, Gemini 2.5 Flash et Gemini 2.5 Flash-Lite, saisissez les informations suivantes :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • % de succès de cache (hit) moyen
        • Jetons de texte de réponse de sortie par requête
        • Jetons de texte de raisonnement de sortie par requête
      • Pour le modèle Gemini 3 Pro Image, saisissez ce qui suit :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons de texte de réponse de sortie par requête
        • Jetons de texte de raisonnement de sortie par requête
        • Jetons d'image de sortie par requête
      • Pour le modèle Gemini 2.5 Flash Image, saisissez ce qui suit :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons de texte de réponse de sortie par requête
        • Jetons d'image de sortie par requête
      • Pour le modèle Gemini 2.5 Flash avec audio natif de l'API Live, saisissez les informations suivantes :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • Jetons de mémoire de session (mis en cache) par requête
        • Jetons de texte de réponse de sortie par requête
        • Jetons audio de sortie par requête
      • Pour Gemini 2.5 Flash avec l'API Live, saisissez ce qui suit :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • Jetons de mémoire de session (mis en cache) par requête
        • Jetons de texte de réponse de sortie par requête
        • Jetons audio de sortie par requête
      • Pour les modèles Gemini 2.0 Flash et Gemini 2.0 Flash-Lite, saisissez les informations suivantes :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • Jetons de texte de sortie par requête
      • Pour les modèles Veo 3 et Veo 3 Fast, saisissez les informations suivantes :

        • Fréquence : indiquez la fréquence à laquelle les résultats sont générés, en secondes. Il ne s'agit pas de la latence.
        • Secondes de sortie vidéo par requête : saisissez le nombre total de secondes de vidéo demandées. Par exemple, 12 secondes représentent 3x4 ou 2x6 secondes de vidéo.
        • Secondes de sortie vidéo et audio par requête : saisissez le nombre total de secondes vidéo et audio demandées. Par exemple, 12 secondes représentent la somme de 3x4 ou 2x6 secondes de vidéo et d'audio.
      • Pour les modèles Imagen, saisissez les éléments suivants :

        • Requêtes par seconde
        • Images de sortie par requête
      • Pour les modèles ouverts, saisissez les informations suivantes :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons de texte de réponse de sortie par requête
    3. Dans la section GSU et prix mensuels estimés, vérifiez le nombre de GSU dont vous avez besoin et les prix.

  8. Cliquez sur Utiliser le calcul.

  9. Facultatif : Modifiez le nombre d'unités de scaling pour l'IA générative (GSU) par mois.

  10. Sélectionnez la durée. Notez que les frais de période ne peuvent pas être annulés pendant la durée de la période et s'appliquent quelle que soit votre utilisation effective ou l'arrêt du modèle. Google vous recommande de modifier le modèle attribué avant sa date d'arrêt. Google n'annulera pas de manière proactive le renouvellement automatique des modèles arrêtés.

    Les options suivantes sont disponibles :

    • 1 semaine (disponible uniquement pour les modèles Google)
    • 1 mois
    • 3 mois
    • 1 an
  11. Facultatif : Sélectionnez la date et l'heure de début de votre période (aperçu).

    Vous pouvez indiquer une date et une heure de début dans les deux semaines suivant la date de la commande. Si vous ne spécifiez pas de date et d'heure de début, la commande est traitée dès que la capacité est disponible. Les dates et heures de début demandées sont respectées dans la mesure du possible. Il n'est pas garanti qu'une commande soit honorée en fonction de ces valeurs tant que l'état de la commande n'est pas défini sur Approuvée.

    Si la date de début que vous avez demandée est trop proche de la date actuelle, il est possible que votre commande soit approuvée et activée après la date de début demandée. Dans ce cas, la date de fin est ajustée en fonction de la durée de la période sélectionnée, à partir de la date d'activation. Pour savoir comment annuler une commande en attente, consultez Modifier une commande de débit provisionné.

  12. Dans la liste Renouvellement, indiquez si vous souhaitez renouveler automatiquement la commande à la fin de la période. Vous ne pouvez spécifier l'option de renouvellement que si vous sélectionnez 1 mois, 3 mois ou 1 an comme durée.

  13. Cliquez sur Continuer.

  14. Dans la section Confirmer et envoyer, vérifiez les estimations de prix et de débit de votre commande. Lisez les conditions indiquées et accessibles dans les liens du formulaire.

  15. Pour finaliser et envoyer votre commande, saisissez CONFIRM dans le champ Confirmation d'achat, puis cliquez sur Envoyer la commande.

    Le traitement d'une commande peut prendre de quelques minutes à quelques semaines, selon sa taille et la capacité disponible. Une fois la commande traitée, son état dans la console Google Cloud passe à Actif. Vous n'êtes facturé pour la commande qu'une fois qu'elle est active.

Modifier une commande de débit provisionné standard

Ce tableau décrit comment modifier vos commandes de débit provisionné dans la console Google Cloud en fonction de l'état de votre commande et des conditions existantes. La modification de vos commandes est une fonctionnalité en aperçu qui n'est disponible que pour les commandes en ligne passées via la console. Pour toute modification concernant les commandes hors connexion, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.

De plus, les modifications apportées à votre modèle ou à la version de votre modèle lorsque vous utilisez la console Google Cloud modifient la commande existante tout en conservant la même date de fin d'abonnement.

Pour modifier une commande de débit provisionné pour un modèle ouvert, contactez votre responsable de compte Google Cloud pour obtenir de l'aide. Vous ne pouvez pas modifier les commandes de débit provisionné pour les modèles Google afin de les remplacer par des modèles ouverts.

État de la commande Action Remarque Étapes à suivre dans la console Google Cloud
En attente d'examen Vous pouvez annuler votre commande.

Si vous souhaitez apporter d'autres modifications à votre commande, annulez la commande en attente et passez-en une nouvelle.

Si vous avez plusieurs modèles, chacun ne peut avoir qu'une seule révision de commande ou commande en attente à la fois.

Pour annuler votre commande en attente dans la console Google Cloud , procédez comme suit :
  1. Accédez à la page Débit provisionné.
  2. Sélectionnez la région dans laquelle se trouve votre commande en attente.
  3. Pour accéder à la page Détails de la commande, cliquez sur l'ID de la commande que vous souhaitez annuler.
  4. Cliquez sur Annuler.
  5. Dans la boîte de dialogue Voulez-vous vraiment annuler la commande ?, cliquez sur Annuler la commande.
Approved Vous ne pouvez pas modifier votre commande. La commande est en attente d'activation. Vous ne pouvez pas modifier votre commande pour le moment. Non applicable
Actif

Vous ne pouvez effectuer les modifications suivantes que si la commande n'expire pas dans les cinq prochains jours ou si elle est renouvelée automatiquement :

  • Augmentez le nombre de GSU sur les commandes existantes. Une augmentation des UGS est appliquée immédiatement après l'approbation, quel que soit le calendrier de renouvellement automatique.
  • Diminuer le nombre d'UGS sur les commandes existantes Une diminution du nombre de GSU est appliquée lors du renouvellement automatique pour la période suivante.
  • Activez ou désactivez le renouvellement automatique.
  • Modifier le modèle ou la version du modèle
  • Modifiez la région.
Vous ne pouvez pas modifier une commande active si elle expire dans moins de cinq jours et si le renouvellement automatique n'est pas configuré. Pour modifier votre commande active dans la console Google Cloud , utilisez l'une des méthodes suivantes :
  • Sur la page Débit provisionné, cliquez sur le symbole  dans la colonne Actions, puis sur Modifier.
  • Sur la page Détails de la commande, cliquez sur le bouton Modifier.

Suivi de la commande

Une fois que vous avez envoyé votre commande de débit provisionné, l'état de la commande peut apparaître comme suit :

  • En attente d'examen : vous avez passé votre commande. L'approbation dépend de la capacité disponible pour provisionner votre commande. Votre commande est donc en attente d'examen et d'approbation. Pour en savoir plus sur l'état de votre commande en attente, contactez votre responsable de compte Google Cloud .
  • Approuvée : Google a approuvé votre commande, qui est en attente d'activation. Vous ne pouvez pas apporter de modifications une fois la commande approuvée.
  • Actif : Google a activé votre commande, et la facturation commence.
  • Expiré : votre commande a expiré.

Afficher les commandes de débit provisionné standards

Pour afficher vos commandes de débit provisionné, procédez comme suit :

Console

  1. Dans la console Google Cloud , accédez à la page "Débit provisionné".

    Accéder à la page "Débit provisionné"

  2. Sélectionnez la Région. Votre liste de commandes s'affiche.

Étapes suivantes