Los modelos de MiniMax en Vertex AI ofrecen modelos completamente administrados y sin servidores como APIs. Para usar un modelo de MiniMax en Vertex AI, envía una solicitud directamente al extremo de API de Vertex AI. Debido a que los modelos de MiniMax usan una API administrada, no es necesario aprovisionar ni administrar la infraestructura.
Puedes transmitir tus respuestas para reducir la percepción de latencia del usuario final. Una respuesta transmitida usa eventos enviados por el servidor (SSE) para transmitir la respuesta de forma incremental.
Modelos de MiniMax disponibles
Los siguientes modelos están disponibles en MiniMax para usarlos en Vertex AI. Para acceder a un modelo de MiniMax, ve a su tarjeta de modelo de Model Garden.
MiniMax M2
MiniMax M2 es un modelo de MiniMax diseñado para tareas relacionadas con código y agentes. Está diseñado para flujos de trabajo de desarrollo de extremo a extremo y tiene sólidas capacidades para planificar y ejecutar tareas complejas de llamadas a herramientas. El modelo está optimizado para proporcionar un equilibrio entre el rendimiento, el costo y la velocidad de inferencia.
Ir a la tarjeta de modelo de MiniMax M2
Usa modelos de MiniMax
Puedes usar comandos curl para enviar solicitudes al extremo de Vertex AI con los siguientes nombres de modelos:
- Para MiniMax M2, usa
minimax-m2-maas
Para obtener información sobre cómo realizar llamadas de transmisión y que no son de transmisión a los modelos de MiniMax, consulta Llama a las APIs de modelos abiertos.
Disponibilidad y cuotas de la región del modelo de MiniMax
En el caso de los modelos MiniMax, se aplica una cuota para cada región en la que el modelo esté disponible. La cuota se especifica en consultas por minuto (QPM).
| Modelo | Región | Cuotas | Longitud del contexto | Salida máx. |
|---|---|---|---|---|
| MiniMax M2 | ||||
global endpoint |
|
196,608 | 4,096 |
Si quieres aumentar tus cuotas para la IA generativa en Vertex AI, puedes usar la Google Cloud consola para solicitar un aumento de la cuota. Para obtener más información sobre las cuotas, consulta la descripción general de cuotas de Cloud.
¿Qué sigue?
- Obtén más información para llamar a las APIs de modelos abiertos.