Esta página explica o que é o débito processado e quando o usar.
Introdução ao débito aprovisionado
O débito processado é uma subscrição de custo fixo e prazo fixo disponível em vários prazos que reserva o débito processado para modelos de IA generativa suportados no Vertex AI. Para reservar o débito, tem de especificar o modelo e as localizações disponíveis nas quais o modelo é executado.
Quando usar o débito aprovisionado
Se alguma das seguintes considerações se aplicar ao seu exemplo de utilização, pondere usar o débito processado:
- Está a criar aplicações de produção de IA generativa em tempo real, como bots de chat e agentes.
- As suas cargas de trabalho críticas requerem sempre um elevado débito. A medição do débito depende do modelo.
- Quer oferecer uma experiência consistente e previsível aos utilizadores das suas aplicações.
- Quer custos de IA generativa determinísticos pagando um preço mensal ou semanal fixo com controlo de excedentes.
A capacidade de processamento aprovisionada é uma das duas formas de consumir os seus modelos de IA generativa. A segunda forma é o pagamento à medida do consumo, também conhecido como a pedido.
O que se segue?
- Modelos suportados com débito aprovisionado.