Gemini 3 Pro

O Gemini 3 Pro é o nosso modelo Gemini de raciocínio mais avançado, capaz de resolver problemas complexos. O Gemini 3 Pro pode compreender conjuntos de dados extensos e problemas desafiantes de diferentes fontes de informação, incluindo texto, áudio, imagens, vídeo, PDFs e até repositórios de código completos com a sua capacidade de resposta de 1 milhão de tokens.

O Gemini 3 Pro introduz várias novas funcionalidades para melhorar o desempenho, o controlo e a fidelidade multimodal:

  • Nível de reflexão: use o parâmetro thinking_level para controlar a quantidade de raciocínio interno que o modelo realiza (baixo ou alto) para equilibrar a qualidade da resposta, a complexidade do raciocínio, a latência e o custo. O parâmetro thinking_level substitui thinking_budget para os modelos Gemini 3.
  • Resolução de multimédia: use o parâmetro media_resolution (low, medium ou high) para controlar o processamento de visão para entradas multimodais, o que afeta a utilização de tokens e a latência. Consulte o artigo Comece a usar o Gemini 3 para ver as definições de resolução predefinidas.
  • Assinaturas de raciocínio: a validação mais rigorosa das assinaturas de raciocínio melhora a fiabilidade nas chamadas de funções de várias interações.
  • Respostas de funções multimodais: as respostas de funções podem agora incluir objetos multimodais, como imagens e PDFs, além de texto.
  • Chamada de função de streaming: transmita argumentos de chamada de função parciais para melhorar a experiência do utilizador durante a utilização de ferramentas.

Para mais informações sobre a utilização destas funcionalidades, consulte o artigo Comece a usar o Gemini 3 Pro.

Experimentar na Vertex AI Ver no Model Garden (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-3-pro-preview
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo, PDF
  • Saídas:
    Texto
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Tokens de saída máximos: 65 536
Capacidades
Tipos de utilização
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 900
  • Tamanho máximo do ficheiro por ficheiro para dados incorporados ou carregamentos diretos através da consola: 7 MB
  • Tamanho máximo do ficheiro por ficheiro do Google Cloud Storage: 30 MB
  • Tokens de resolução predefinidos: 1120
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de ficheiros por comando: 900
  • Número máximo de páginas por ficheiro: 900
  • Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB
  • Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB
  • Tokens de resolução predefinidos: 560
  • OCR para PDFs digitalizados: Não usado por predefinição
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tokens de resolução predefinidos por fotograma: 70
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1–8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-3-pro-preview
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 18 de novembro de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.