O Gemini 3 Pro é nosso modelo de raciocínio mais avançado do Gemini, capaz de resolver problemas complexos. O Gemini 3 Pro pode compreender vastos conjuntos de dados e problemas complexos de diferentes fontes de informação, incluindo texto, áudio, imagens, vídeo, PDFs e até mesmo repositórios de código inteiros com sua janela de contexto de 1 milhão de tokens.
Mudanças na qualidade
Ao migrar do Gemini 2.5 Pro para o Gemini 3 Pro, você pode esperar melhorias significativas no raciocínio de alto nível, no seguimento de instruções complexas, no uso de ferramentas, em casos de uso de agentes e em recursos de contexto longo (incluindo análise de imagens e documentos). Os modelos do Gemini 3 Pro não foram projetados para priorizar a compreensão de áudio ou casos de uso de segmentação de imagens. Para ter um desempenho de alta performance nesses casos de uso, tente usar modelos criados especificamente para essas necessidades. Em gráficos, tabelas ou diagramas complexos ou com muitas informações, o modelo às vezes extrai informações incorretamente ou interpreta mal os recursos fornecidos. Apresentar informações importantes da maneira mais direta possível pode ajudar a garantir o resultado preferido ao trabalhar com o Gemini 3 Pro.
Alterações de comportamento
O Gemini 3 Pro foi criado para alta eficiência e ação. O modelo foi treinado para fornecer respostas concisas e diretas e tentar resolver a intenção do usuário o mais rápido possível. Como o modelo foi projetado para priorizar a utilidade, ele pode fazer suposições quando faltam informações ou priorizar uma resposta satisfatória em vez de instruções estritas. Esse comportamento pode ser reduzido ou modificado com comandos. Para mais informações e práticas recomendadas, consulte Começar a usar o Gemini 3.
Novos recursos
O Gemini 3 Pro apresenta vários recursos novos para melhorar a performance, o controle e a fidelidade multimodal:
- Nível de pensamento: use o parâmetro
thinking_levelpara controlar a quantidade de raciocínio interno que o modelo realiza (baixo ou alto) e equilibrar a qualidade da resposta, a complexidade do raciocínio, a latência e o custo. O parâmetrothinking_levelsubstituithinking_budgetpara modelos do Gemini 3. - Resolução da mídia: use o parâmetro
media_resolution(baixa, média ou alta) para controlar o processamento de visão em entradas multimodais, afetando o uso de tokens e a latência. Consulte Começar a usar o Gemini 3 para conferir as configurações de resolução padrão. - Assinaturas de pensamento: a validação mais rigorosa das assinaturas de pensamento melhora a confiabilidade na chamada de função em várias interações.
- Respostas de função multimodal: agora as respostas de função podem incluir objetos multimodais, como imagens e PDFs, além de texto.
- Chamada de função de streaming: transmita argumentos de chamada de função parciais para melhorar a experiência do usuário durante o uso da ferramenta.
Para mais informações sobre como usar esses recursos, consulte Começar a usar o Gemini 3.
Testar na Vertex AI Ver no Model Garden (prévia) Implantar app de exemplo
| ID do modelo | gemini-3-pro-preview |
|
|---|---|---|
| Entradas e saídas compatíveis |
|
|
| Limites de tokens |
|
|
| Recursos |
|
|
| Tipos de uso |
|
|
| Especificações técnicas | ||
| Imagens |
|
|
| Documentos |
|
|
| Vídeo |
|
|
| Áudio |
|
|
| Padrões de parâmetros |
|
|
| Regiões compatíveis | ||
|
Disponibilidade do modelo (Inclui o PayGo Standard e a capacidade de processamento provisionada) |
|
|
| Consulte Implantações e endpoints para mais informações. | ||
| Data limite de conhecimento | Janeiro de 2025 | |
| Versões |
|
|
| Controles de segurança | ||
| Previsão on-line |
|
|
| Previsão em lote |
|
|
| Ajuste |
|
|
| Cache de contexto |
|
|
| Consulte Controles de segurança para mais informações. | ||
| Idiomas compatíveis | Consulte Idiomas aceitos. | |
| Preços | Consulte a seção Preços. | |