Modelli OpenAI

I modelli OpenAI sono disponibili per l'utilizzo come API gestite e modelli con deployment autonomo su Gemini Enterprise Agent Platform. Puoi eseguire lo streaming delle risposte per ridurre la percezione della latenza da parte dell'utente finale. Una risposta in streaming utilizza gli eventi inviati dal server (SSE) per eseguire lo streaming incrementale della risposta.

gpt-oss 120B

OpenAI gpt-oss 120B è un modello linguistico open-weight da 120 miliardi di parametri rilasciato con licenza Apache 2.0. È ideale per i casi d'uso di ragionamento e chiamata di funzioni. Il modello è ottimizzato per il deployment su hardware consumer.

Il modello da 120 miliardi di parametri raggiunge una parità quasi perfetta con OpenAI o4-mini nei benchmark di ragionamento di base, pur eseguendo su una singola GPU da 80 GB.

Vai alla scheda del modello gpt-oss 120B

gpt-oss 20B

OpenAI gpt-oss 20B è un modello linguistico open-weight da 20 miliardi di parametri rilasciato con licenza Apache 2.0. È ideale per i casi d'uso di ragionamento e chiamata di funzioni. Il modello è ottimizzato per il deployment su hardware consumer.

Il modello da 20 miliardi di parametri offre risultati simili a OpenAI o3-mini nei benchmark comuni e può essere eseguito su dispositivi edge con 16 GB di memoria, il che lo rende ideale per i casi d'uso on-device, l'inferenza locale o l'iterazione rapida senza infrastrutture costose.

Vai alla scheda del modello gpt-oss 20B

Utilizzare i modelli OpenAI

Per i modelli gestiti, puoi utilizzare i comandi curl per inviare richieste all' endpoint di Gemini Enterprise Agent Platform utilizzando i seguenti nomi di modelli:

  • Per gpt-oss 120B, utilizza gpt-oss-120b-maas
  • Per gpt-oss 20B, utilizza gpt-oss-20b-maas

Per scoprire come effettuare chiamate in streaming e non in streaming ai modelli OpenAI, consulta Chiamare le API dei modelli aperti.

Per utilizzare un modello di Gemini Enterprise Agent Platform con deployment autonomo:

  1. Vai alla console Model Garden.
  2. Trova il modello di Gemini Enterprise Agent Platform pertinente.
  3. Fai clic su Attiva e compila il modulo fornito per ottenere le licenze di utilizzo commerciale necessarie.

Per saperne di più sul deployment e sull'utilizzo dei modelli partner, consulta Eseguire il deployment di un modello partner ed effettuare richieste di previsione .

Disponibilità per regione dei modelli OpenAI

I modelli OpenAI sono disponibili nelle seguenti regioni:

Modello Regioni
gpt-oss 120B
  • global
    • Output massimo: 131.072
    • Lunghezza del contesto: 131.072
  • us-central1
    • Output massimo: 131.072
    • Lunghezza del contesto: 131.072
gpt-oss 20B
  • us-central1
    • Output massimo: 32.768
    • Lunghezza del contesto: 131.072

Passaggi successivi

Scopri come chiamare le API dei modelli aperti.