Modelli MiniMax

I modelli MiniMax su Vertex AI offrono modelli serverless completamente gestiti come API. Per utilizzare un modello MiniMax su Vertex AI, invia una richiesta direttamente all'endpoint API Vertex AI. Poiché i modelli MiniMax utilizzano un'API gestita, non è necessario eseguire il provisioning o gestire l'infrastruttura.

Puoi trasmettere in streaming le risposte per ridurre la percezione della latenza da parte dell'utente finale. Una risposta in streaming utilizza gli eventi inviati dal server (SSE) per trasmettere in streaming in modo incrementale la risposta.

Modelli MiniMax disponibili

I seguenti modelli sono disponibili da MiniMax per l'utilizzo in Vertex AI. Per accedere a un modello MiniMax, vai alla relativa scheda del modello in Model Garden.

MiniMax M2

MiniMax M2 è un modello di MiniMax progettato per attività relative al codice e agli agenti. È progettato per i flussi di lavoro di sviluppo end-to-end e dispone di funzionalità avanzate per la pianificazione e l'esecuzione di attività complesse di chiamata di strumenti. Il modello è ottimizzato per fornire un equilibrio tra prestazioni, costi e velocità di inferenza.

Vai alla scheda del modello MiniMax M2

Utilizza i modelli MiniMax

Puoi utilizzare i comandi curl per inviare richieste all'endpoint Vertex AI utilizzando i seguenti nomi di modelli:

  • Per MiniMax M2, utilizza minimax-m2-maas

Per scoprire come effettuare chiamate di streaming e non di streaming ai modelli MiniMax, consulta Chiamare le API del modello aperto.

Disponibilità e quote per la regione del modello MiniMax

Per i modelli MiniMax, viene applicata una quota per ogni regione in cui il modello è disponibile. La quota è specificata in query al minuto (QPM).

Modello Regione Quote Lunghezza del contesto Potenza massima
MiniMax M2
global endpoint
196.608 4096

Se vuoi aumentare una delle quote per l'AI generativa su Vertex AI, puoi utilizzare la Google Cloud console per richiedere un aumento di quota. Per saperne di più sulle quote, consulta la panoramica delle quote di Cloud.

Passaggi successivi