I modelli OpenAI sono disponibili per l'utilizzo come API gestite e modelli con deployment autonomo su Gemini Enterprise Agent Platform. Puoi eseguire lo streaming delle risposte per ridurre la percezione della latenza da parte dell'utente finale. Una risposta in streaming utilizza gli eventi inviati dal server (SSE) per eseguire lo streaming incrementale della risposta.
gpt-oss 120B
OpenAI gpt-oss 120B è un modello linguistico open-weight da 120 miliardi di parametri rilasciato con licenza Apache 2.0. È ideale per i casi d'uso di ragionamento e chiamata di funzioni. Il modello è ottimizzato per il deployment su hardware consumer.
Il modello da 120 miliardi di parametri raggiunge una parità quasi perfetta con OpenAI o4-mini nei benchmark di ragionamento di base, pur eseguendo su una singola GPU da 80 GB.
Vai alla scheda del modello gpt-oss 120Bgpt-oss 20B
OpenAI gpt-oss 20B è un modello linguistico open-weight da 20 miliardi di parametri rilasciato con licenza Apache 2.0. È ideale per i casi d'uso di ragionamento e chiamata di funzioni. Il modello è ottimizzato per il deployment su hardware consumer.
Il modello da 20 miliardi di parametri offre risultati simili a OpenAI o3-mini nei benchmark comuni e può essere eseguito su dispositivi edge con 16 GB di memoria, il che lo rende ideale per i casi d'uso on-device, l'inferenza locale o l'iterazione rapida senza infrastrutture costose.
Vai alla scheda del modello gpt-oss 20BUtilizzare i modelli OpenAI
Per i modelli gestiti, puoi utilizzare i comandi curl per inviare richieste all' endpoint di Gemini Enterprise Agent Platform utilizzando i seguenti nomi di modelli:
- Per gpt-oss 120B, utilizza
gpt-oss-120b-maas - Per gpt-oss 20B, utilizza
gpt-oss-20b-maas
Per scoprire come effettuare chiamate in streaming e non in streaming ai modelli OpenAI, consulta Chiamare le API dei modelli aperti.
Per utilizzare un modello di Gemini Enterprise Agent Platform con deployment autonomo:
- Vai alla console Model Garden.
- Trova il modello di Gemini Enterprise Agent Platform pertinente.
- Fai clic su Attiva e compila il modulo fornito per ottenere le licenze di utilizzo commerciale necessarie.
Per saperne di più sul deployment e sull'utilizzo dei modelli partner, consulta Eseguire il deployment di un modello partner ed effettuare richieste di previsione .
Disponibilità per regione dei modelli OpenAI
I modelli OpenAI sono disponibili nelle seguenti regioni:
| Modello | Regioni |
|---|---|
| gpt-oss 120B |
|
| gpt-oss 20B |
|
Passaggi successivi
Scopri come chiamare le API dei modelli aperti.