Modèles MiniMax

Les modèles MiniMax sont disponibles en tant qu'API gérées et modèles auto-déployés sur Vertex AI. Vous pouvez diffuser vos réponses en flux continu pour réduire la perception de la latence côté utilisateur. Une réponse en flux continu utilise des événements envoyés par le serveur (SSE) pour diffuser la réponse de manière incrémentielle.

Modèles MiniMax gérés

Les modèles MiniMax offrent des modèles entièrement gérés et sans serveur en tant qu'API. Pour utiliser un modèle MiniMax sur Vertex AI, envoyez une requête directement au point de terminaison de l'API Vertex AI. Lorsque vous utilisez des modèles MiniMax en tant qu'API gérée, il n'est pas nécessaire de provisionner ni de gérer l'infrastructure.

Les modèles suivants sont disponibles depuis MiniMax et peuvent être utilisés dans Vertex AI. Pour accéder à un modèle MiniMax, accédez à sa fiche de modèle Model Garden.

MiniMax M2

MiniMax M2 est un modèle MiniMax conçu pour les tâches liées aux agents et au code. Il est conçu pour les workflows de développement de bout en bout et possède de solides capacités de planification et d'exécution de tâches complexes d'appel d'outils. Le modèle est optimisé pour offrir un équilibre entre performances, coût et vitesse d'inférence.

Accéder à la fiche de modèle MiniMax M2

Utiliser les modèles MiniMax

Pour les modèles gérés, vous pouvez utiliser des commandes curl pour envoyer des requêtes au point de terminaison Vertex AI à l'aide des noms de modèles suivants :

Pour MiniMax M2, utilisez minimax-m2-maas.

Pour savoir comment effectuer des appels en flux continu et non en flux continu aux modèles MiniMax, consultez Appeler des API de modèles ouverts.

Pour utiliser un modèle Vertex AI déployé automatiquement :

Accédez à la console Model Garden.
Trouvez le modèle Vertex AI approprié.
Cliquez sur Activer et remplissez le formulaire fourni pour obtenir les licences d'utilisation commerciale nécessaires.

Pour en savoir plus sur le déploiement et l'utilisation des modèles partenaires, consultez Déployer un modèle partenaire et envoyer des requêtes de prédiction .

Disponibilité des régions du modèle MiniMax

Les modèles MiniMax sont disponibles dans les régions suivantes :

Modèle	Régions
MiniMax M2	`global` Sortie maximale : 196 608 Longueur du contexte : 196 608

Étapes suivantes

Découvrez comment appeler des API de modèles ouverts.

Modèles MiniMax Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.