Les modèles MiniMax sur Vertex AI offrent des modèles sans serveur et entièrement gérés en tant qu'API. Pour utiliser un modèle MiniMax sur Vertex AI, envoyez une requête directement au point de terminaison de l'API Vertex AI. Étant donné que les modèles MiniMax utilisent une API gérée, il n'est pas nécessaire de provisionner ni de gérer l'infrastructure.
Vous pouvez diffuser vos réponses en flux continu pour réduire la perception de la latence côté utilisateur. Une réponse en flux continu utilise des événements envoyés par le serveur (SSE) pour diffuser la réponse de manière incrémentielle.
Modèles MiniMax disponibles
Les modèles suivants sont disponibles depuis MiniMax et peuvent être utilisés dans Vertex AI. Pour accéder à un modèle MiniMax, accédez à sa fiche de modèle Model Garden.
MiniMax M2
MiniMax M2 est un modèle de MiniMax conçu pour les tâches liées aux agents et au code. Il est conçu pour les workflows de développement de bout en bout et possède de solides capacités de planification et d'exécution de tâches complexes d'appel d'outils. Le modèle est optimisé pour offrir un équilibre entre performances, coût et vitesse d'inférence.
Accéder à la fiche de modèle MiniMax M2
Utiliser les modèles MiniMax
Vous pouvez utiliser des commandes curl pour envoyer des requêtes au point de terminaison Vertex AI en employant les noms de modèles suivants :
- Pour MiniMax M2, utilisez
minimax-m2-maas.
Pour savoir comment effectuer des appels en flux continu et non en flux continu aux modèles MiniMax, consultez Appeler des API de modèles ouverts.
Disponibilité et quotas des régions d'un modèle MiniMax
Pour les modèles MiniMax, un quota s'applique à chaque région dans laquelle le modèle est disponible. Le quota est spécifié en requêtes par minute (RPM).
| Modèle | Région | Quotas | Longueur du contexte | Sortie maximale |
|---|---|---|---|---|
| MiniMax M2 | ||||
global endpoint |
|
196 608 | 4 096 |
Si vous souhaitez augmenter vos quotas pour l'IA générative sur Vertex AI, vous pouvez en faire la demande via la console Google Cloud . Pour en savoir plus sur les quotas, consultez la présentation de Cloud Quotas.
Étapes suivantes
- Découvrez comment appeler des API de modèles ouverts.