Modelos MiniMax

Os modelos MiniMax no Vertex AI oferecem modelos totalmente geridos e sem servidor como APIs. Para usar um modelo MiniMax no Vertex AI, envie um pedido diretamente para o ponto final da API Vertex AI. Uma vez que os modelos MiniMax usam uma API gerida, não é necessário aprovisionar nem gerir a infraestrutura.

Pode transmitir as suas respostas para reduzir a perceção de latência do utilizador final. Uma resposta em stream usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.

Modelos MiniMax disponíveis

Os seguintes modelos estão disponíveis no MiniMax para utilização no Vertex AI. Para aceder a um modelo MiniMax, aceda ao respetivo cartão de modelo do Model Garden.

MiniMax M2

O MiniMax M2 é um modelo da MiniMax concebido para tarefas relacionadas com agentes e código. Foi criado para fluxos de trabalho de desenvolvimento completos e tem capacidades fortes no planeamento e execução de tarefas complexas de chamadas de ferramentas. O modelo está otimizado para oferecer um equilíbrio entre desempenho, custo e velocidade de inferência.

Aceda ao cartão do modelo MiniMax M2

Use modelos MiniMax

Pode usar comandos curl para enviar pedidos para o ponto final da Vertex AI usando os seguintes nomes de modelos:

  • Para o MiniMax M2, use minimax-m2-maas

Para saber como fazer chamadas de streaming e não streaming para modelos MiniMax, consulte o artigo Chame APIs de modelos abertos.

Disponibilidade regional e quotas do modelo MiniMax

Para os modelos MiniMax, aplica-se uma quota a cada região onde o modelo está disponível. A quota é especificada em consultas por minuto (QPM).

Modelo Região Quotas Comprimento do contexto Saída máxima
MiniMax M2
global endpoint
196 608 4096

Se quiser aumentar alguma das suas quotas para a IA generativa no Vertex AI, pode usar a Google Cloud consola para pedir um aumento da quota. Para saber mais sobre as quotas, consulte a vista geral das quotas do Google Cloud.

O que se segue?