Modelos MiniMax

Os modelos MiniMax estão disponíveis para uso como APIs gerenciadas e modelos autodeployados na Vertex AI. É possível transmitir as respostas para reduzir a percepção de latência do usuário final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.

Modelos MiniMax gerenciados

Os modelos MiniMax oferecem modelos totalmente gerenciados e sem servidor como APIs. Para usar um modelo MiniMax na Vertex AI, envie uma solicitação diretamente ao endpoint de API Vertex AI. Ao usar modelos MiniMax como uma API gerenciada, não é necessário provisionar nem gerenciar a infraestrutura.

Os modelos a seguir estão disponíveis na MiniMax para uso na Vertex AI. Para acessar um modelo da MiniMax, acesse o card de modelo do Model Garden.

MiniMax M2

O MiniMax M2 é um modelo da MiniMax projetado para tarefas de agente e relacionadas a código. Ele foi criado para fluxos de trabalho de desenvolvimento de ponta a ponta e tem recursos avançados para planejar e executar tarefas complexas de chamada de função. O modelo é otimizado para oferecer um equilíbrio entre desempenho, custo e velocidade de inferência.

Acessar o card de modelo do MiniMax M2

Usar modelos MiniMax

Para modelos gerenciados, é possível usar comandos curl para enviar solicitações ao endpoint da Vertex AI usando os seguintes nomes de modelos:

  • Para o MiniMax M2, use minimax-m2-maas

Para saber como fazer chamadas de streaming e não streaming para modelos MiniMax, consulte Chamar APIs de modelo aberto.

Para usar um modelo autoimplantado da Vertex AI:

  1. Navegue até o console do Model Garden.
  2. Encontre o modelo relevante da Vertex AI.
  3. Clique em Ativar e preencha o formulário fornecido para receber as licenças de uso comercial necessárias.

Para mais informações sobre como implantar e usar modelos de parceiros, consulte Implantar um modelo de parceiro e fazer solicitações de previsão .

Disponibilidade regional do modelo MiniMax

Os modelos MiniMax estão disponíveis nas seguintes regiões:

Modelo Regiões
MiniMax M2
  • global
    • Saída máxima: 196.608
    • Tamanho do contexto: 196.608

A seguir

Saiba como chamar APIs de modelos abertos.