Gemini 3 Pro

O Gemini 3 Pro é nosso modelo do Gemini de raciocínio avançado mais avançado, capaz de resolver problemas complexos. O Gemini 3 Pro pode compreender vastos conjuntos de dados e problemas desafiadores de diferentes fontes de informação, incluindo texto, áudio, imagens, vídeo, PDFs e até mesmo repositórios de código inteiros com a janela de contexto de 1 milhão de tokens.

Mudanças de qualidade

Ao migrar do Gemini 2.5 Pro para o Gemini 3 Pro, você pode esperar melhorias significativas no raciocínio de alto nível, no acompanhamento de instruções complexas, no uso de ferramentas, em casos de uso de agentes e em recursos de contexto longo (incluindo compreensão de imagens e documentos). Os modelos do Gemini 3 Pro não são projetados para priorizar o suporte à compreensão de áudio ou casos de uso de segmentação de imagens. Para uma saída de alta performance nesses casos de uso, tente usar modelos criados especificamente com essas necessidades em mente. Para gráficos, tabelas ou gráficos de informações densas ou complicadas, o modelo pode extrair informações incorretamente ou interpretar mal os recursos fornecidos. Apresentar informações importantes da maneira mais direta possível pode ajudar a garantir a saída preferida ao trabalhar com o Gemini 3 Pro.

Alterações de comportamento

O Gemini 3 Pro foi projetado para alta eficiência e ação. O modelo foi treinado para fornecer respostas concisas e diretas e tentar resolver a intenção do usuário o mais rápido possível. Como o modelo foi projetado para priorizar a ajuda, ele pode ocasionalmente adivinhar quando as informações estão ausentes ou priorizar uma resposta satisfatória em vez de instruções rigorosas. Esse comportamento pode ser atenuado ou modificado com comandos. Para mais informações e práticas recomendadas, consulte Começar a usar o Gemini 3.

Novos recursos

O Gemini 3 Pro apresenta vários recursos novos para melhorar o desempenho, o controle e a fidelidade multimodal:

  • Nível de raciocínio: use o parâmetro thinking_level para controlar a quantidade de raciocínio interno que o modelo realiza (baixo ou alto) para equilibrar a qualidade da resposta, a complexidade do raciocínio, a latência e o custo. O parâmetro thinking_level substitui thinking_budget para modelos do Gemini 3.
  • Resolução de mídia: use o parâmetro media_resolution (baixo, médio ou alto) para controlar o processamento de visão para entradas multimodais , afetando o uso de tokens e a latência. Consulte Começar a usar o Gemini 3 para configurações de resolução padrão.
  • Assinaturas de pensamento: a validação mais rigorosa das assinaturas de pensamento melhora a confiabilidade na chamada de função de várias rodadas.
  • Respostas de funções multimodais: as respostas de funções agora podem incluir objetos multimodais, como imagens e PDFs, além de texto.
  • Chamada de função de streaming: transmita argumentos de chamada de função parcial para melhorar a experiência do usuário durante o uso da ferramenta.

Para mais informações sobre como usar esses recursos, consulte Começar a usar o Gemini 3.

Teste na visualização da plataforma de agentes no Model Garden (pré-lançamento) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto na nuvem do Google Cloud com faturamento e a API Agent Platform ativada.
ID do modelo gemini-3-pro-preview
Entradas e saídas com suporte
  • Entradas:
    texto, código, imagens, áudio, vídeo, PDF
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 65.536
Recursos
Opções de consumo
Consulte Opções de consumo para mais informações.
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 3.000
  • Tamanho máximo do arquivo para dados inline ou uploads diretos pelo console: 7 MB
  • Tamanho máximo do arquivo por arquivo do Google Cloud Storage: 30 MB
  • Tokens de resolução padrão: 1.120
  • Tipos MIME com suporte:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de arquivos por comando: 3.000
  • Número máximo de páginas por arquivo: 3.000
  • Tamanho máximo do arquivo por arquivo para importações da API ou do Cloud Storage: 50 MB(application/pdf) ou 7 MB(text/plain)
  • Tamanho máximo do arquivo por arquivo para uploads diretos pelo console: 7 MB
  • Tokens de resolução padrão: 560
  • OCR para PDFs digitalizados: não usado por padrão
  • Tipos MIME com suporte:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tokens de resolução padrão por frame: 70
  • Tipos MIME com suporte:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por solicitação: Aproximadamente 8,4 horas ou até 1 milhão de tokens
  • Número máximo de arquivos de áudio por comando: 1
  • Entendimento de fala para: resumo, transcrição e tradução de áudio
  • Tipos MIME com suporte:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Padrões de parâmetros
  • Temperatura: 0,0 a 2,0 (padrão 1,0)
  • topP: 0,0 a 1,0 (padrão 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (padrão 1)
Regiões compatíveis

Disponibilidade do modelo

  • Global
    • global
Consulte Implantações e endpoints para mais informações.
Data limite de conhecimento Janeiro de 2025
Versões
  • gemini-3-pro-preview
    • Estágio de lançamento: pré-lançamento
    • Data de lançamento: 18 de novembro de 2025
    • Data de descontinuação: 26 de março de 2026
Idiomas compatíveis Consulte Idiomas com suporte.
Preços Consulte a seção "Preços".