MiniMax-Modelle

MiniMax-Modelle in Vertex AI bieten vollständig verwaltete und serverlose Modelle als APIs. Wenn Sie ein MiniMax-Modell für Vertex AI verwenden möchten, senden Sie eine Anfrage direkt an den API-Endpunkt von Vertex AI. Da MiniMax-Modelle eine verwaltete API verwenden, muss keine Infrastruktur bereitgestellt oder verwaltet werden.

Sie können Ihre Antworten streamen, um die vom Endnutzer wahrgenommene Latenz zu reduzieren. Eine gestreamte Antwort verwendet Server-Sent Events (SSE), um die Antwort schrittweise zu streamen.

Verfügbare MiniMax-Modelle

Die folgenden Modelle sind von MiniMax zur Verwendung in Vertex AI verfügbar. Rufen Sie die zugehörige Model Garden-Modellkarte auf, um auf ein MiniMax-Modell zuzugreifen.

MiniMax M2

MiniMax M2 ist ein Modell von MiniMax, das für agentenbezogene und codebezogene Aufgaben entwickelt wurde. Es wurde für End-to-End-Entwicklungs-Workflows entwickelt und bietet leistungsstarke Funktionen zum Planen und Ausführen komplexer Tool-Aufgaben. Das Modell ist für ein ausgewogenes Verhältnis von Leistung, Kosten und Inferenzgeschwindigkeit optimiert.

Zur Modellkarte „MiniMax M2“

MiniMax-Modelle verwenden

Sie können curl-Befehle verwenden, um Anfragen mit den folgenden Modellnamen an den Vertex AI-Endpunkt zu senden:

  • Verwenden Sie für MiniMax M2 minimax-m2-maas.

Informationen dazu, wie Sie Streaming- und Nicht-Streaming-Aufrufe an MiniMax-Modelle senden, finden Sie unter Open Model APIs aufrufen.

Verfügbarkeit und Kontingente der MiniMax-Modellregion

Bei MiniMax-Modellen gilt ein Kontingent für jede Region, in der das Modell verfügbar ist. Das Kontingent wird in Abfragen pro Minute (Queries per minute, QPM) angegeben.

Modell Region Kontingente Kontextlänge Maximale Ausgabe
MiniMax M2
global endpoint
196.608 4.096

Wenn Sie eines der Kontingente für generative KI auf Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern. Weitere Informationen zu Kontingenten finden Sie unter Cloud-Kontingente – Übersicht.

Nächste Schritte