Vista geral do débito aprovisionado

Esta página explica o que é o débito processado e quando o usar.

Introdução ao débito aprovisionado

O débito processado é uma subscrição de custo fixo e prazo fixo disponível em vários prazos que reserva o débito processado para modelos de IA generativa suportados no Vertex AI. Para reservar o débito, tem de especificar o modelo e as localizações disponíveis nas quais o modelo é executado.

Quando usar o débito aprovisionado

Se alguma das seguintes considerações se aplicar ao seu exemplo de utilização, pondere usar o débito processado:

  • Está a criar aplicações de produção de IA generativa em tempo real, como bots de chat e agentes.
  • As suas cargas de trabalho críticas requerem sempre um elevado débito. A medição do débito depende do modelo.
  • Quer oferecer uma experiência consistente e previsível aos utilizadores das suas aplicações.
  • Quer custos de IA generativa determinísticos pagando um preço mensal ou semanal fixo com controlo de excedentes.

A capacidade de processamento aprovisionada é uma das duas formas de consumir os seus modelos de IA generativa. A segunda forma é o pagamento à medida do consumo, também conhecido como a pedido.

O que se segue?