Modelos de MiniMax

Los modelos de MiniMax están disponibles para usarse como APIs administradas y modelos autoinstalados en Vertex AI. Puedes transmitir tus respuestas para reducir la percepción de latencia del usuario final. Una respuesta transmitida usa eventos enviados por el servidor (SSE) para transmitir la respuesta de forma incremental.

Modelos de MiniMax administrados

Los modelos de MiniMax ofrecen modelos completamente administrados y sin servidores como APIs. Para usar un modelo de MiniMax en Vertex AI, envía una solicitud directamente al extremo de API de Vertex AI. Cuando usas los modelos de MiniMax como una API administrada, no es necesario aprovisionar ni administrar la infraestructura.

Los siguientes modelos están disponibles en MiniMax para usarlos en Vertex AI. Para acceder a un modelo de MiniMax, ve a su tarjeta de modelo de Model Garden.

MiniMax M2

MiniMax M2 es un modelo de MiniMax diseñado para tareas relacionadas con agentes y código. Está diseñado para flujos de trabajo de desarrollo de extremo a extremo y tiene sólidas capacidades para planificar y ejecutar tareas complejas de llamadas a herramientas. El modelo está optimizado para proporcionar un equilibrio entre el rendimiento, el costo y la velocidad de inferencia.

Ir a la tarjeta del modelo de MiniMax M2

Usa modelos de MiniMax

En el caso de los modelos administrados, puedes usar comandos curl para enviar solicitudes al extremo de Vertex AI con los siguientes nombres de modelos:

  • Para MiniMax M2, usa minimax-m2-maas

Para obtener información sobre cómo realizar llamadas de transmisión y no transmisión a los modelos de MiniMax, consulta Cómo llamar a las APIs de modelos abiertos.

Para usar un modelo de Vertex AI implementado por el usuario, haz lo siguiente:

  1. Navega a la consola de Model Garden.
  2. Busca el modelo de Vertex AI pertinente.
  3. Haz clic en Habilitar y completa el formulario proporcionado para obtener las licencias de uso comercial necesarias.

Para obtener más información sobre la implementación y el uso de modelos de socios, consulta Implementa un modelo de socio y realiza solicitudes de predicción .

Disponibilidad regional del modelo MiniMax

Los modelos de MiniMax están disponibles en las siguientes regiones:

Modelo Regiones
MiniMax M2
  • global
    • Salida máx.: 196,608
    • Longitud del contexto: 196,608

¿Qué sigue?

Obtén más información para llamar a las APIs de modelos abiertos.