O OpenAI gpt-oss 120B é um modelo de linguagem de 120 bilhões de parâmetros de código aberto lançado sob a licença Apache 2.0. Ele é adequado para casos de uso de raciocínio e chamada de função. O modelo é otimizado para implantação em hardware de consumo.
O modelo de 120 bilhões alcança quase a paridade com o OpenAI o4-mini em comparativos de mercado de raciocínio principais, enquanto é executado em uma única GPU de 80 GB.
Especificações da API gerenciada (MaaS)
Ver o card de modelo no Model Garden
| ID do modelo | gpt-oss-120b-maas |
|
|---|---|---|
| Etapa do lançamento | GA | |
| Entradas e saídas compatíveis |
|
|
| Recursos |
|
|
| Tipos de uso | ||
| Versões |
|
|
| Regiões compatíveis | ||
|
Disponibilidade do modelo |
|
|
|
Processamento de ML |
|
|
| Limites |
endpoint global:
us-central1:
|
|
| Preços | Consulte a seção Preços. | |
Implantar como um modelo autônomo
Para fazer a implantação automática do modelo, acesse o card do modelo gpt-oss 120B no console do Model Garden e clique em Implantar modelo. Para mais informações sobre como implantar e usar modelos de parceiros, consulte Implantar um modelo de parceiro e fazer solicitações de previsão.