Modelli MiniMax

I modelli MiniMax sono disponibili per l'utilizzo come API gestite e modelli di cui è stato eseguito il deployment autonomo su Vertex AI. Puoi trasmettere in streaming le risposte per ridurre la percezione della latenza dell'utente finale. Una risposta in streaming utilizza gli eventi inviati dal server (SSE) per trasmettere in streaming la risposta in modo incrementale.

Modelli MiniMax gestiti

I modelli MiniMax offrono modelli completamente gestiti e serverless come API. Per utilizzare un modello MiniMax su Vertex AI, invia una richiesta direttamente all&#3endpoint APIPI Vertex AI. Quando utilizzi i modelli MiniMax come API gestita, non è necessario eseguire il provisioning o gestire l'infrastruttura.

I seguenti modelli sono disponibili da MiniMax per l'utilizzo in Vertex AI. Per accedere a un modello MiniMax, vai alla relativa scheda del modello in Model Garden.

MiniMax M2

MiniMax M2 è un modello di MiniMax progettato per attività di agenti e relative al codice. È progettato per workflow di sviluppo end-to-end e offre funzionalità avanzate per la pianificazione e l'esecuzione di attività complesse di chiamata di strumenti. Il modello è ottimizzato per fornire un equilibrio tra prestazioni, costi e velocità di inferenza.

Vai alla scheda del modello MiniMax M2

Utilizza i modelli MiniMax

Per i modelli gestiti, puoi utilizzare i comandi curl per inviare richieste all'endpoint Vertex AI utilizzando i seguenti nomi di modelli:

  • Per MiniMax M2, utilizza minimax-m2-maas

Per scoprire come effettuare chiamate in streaming e non in streaming ai modelli MiniMax, consulta la sezione Chiamare le API dei modelli aperti.

Per utilizzare un modello Vertex AI con deployment automatico:

  1. Vai alla console Model Garden.
  2. Trova il modello Vertex AI pertinente.
  3. Fai clic su Attiva e compila il modulo fornito per ottenere le licenze per uso commerciale necessarie.

Per saperne di più sul deployment e sull'utilizzo dei modelli partner, consulta Esegui il deployment di un modello partner ed effettua richieste di previsione .

Disponibilità della regione del modello MiniMax

I modelli MiniMax sono disponibili nelle seguenti regioni:

Modello Regioni
MiniMax M2
  • global
    • Output massimo: 196.608
    • Lunghezza del contesto: 196.608

Passaggi successivi

Scopri come chiamare le API dei modelli aperti.