Gemini 3 Flash

O Gemini 3 Flash combina as capacidades de raciocínio do Gemini 3 Pro com os níveis de latência, eficiência e custo da linha Flash. Ele não apenas permite tarefas diárias com raciocínio aprimorado, mas também foi projetado para lidar com os fluxos de trabalho de agentes mais complexos.

O Gemini 3 Flash usa vários recursos novos para melhorar o desempenho, o controle e a fidelidade multimodal:

  • Nível de pensamento: use o parâmetro thinking_level para controlar a quantidade de raciocínio interno que o modelo realiza (mínimo, baixo, médio ou alto) para equilibrar a qualidade da resposta, a complexidade do raciocínio, a latência e o custo. O parâmetro thinking_level substitui thinking_budget para modelos do Gemini 3.

    Para detalhes sobre os diferentes níveis de pensamento, consulte Pensamento.

  • Assinaturas de pensamento: a validação mais rigorosa das assinaturas de pensamento melhora a confiabilidade na chamada de função em várias interações.

  • Resolução da mídia: use o parâmetro media_resolution (baixa, média, alta ou ultra alta) para controlar o processamento de visão em entradas multimodais, afetando o uso de tokens e a latência. Consulte Começar a usar o Gemini 3 para ver as configurações de resolução padrão.

    • O nível de resolução de mídia ultra alta está disponível apenas para a modalidade IMAGE.
    • As contagens de tokens em PDF vão estar listadas na modalidade IMAGE em vez de DOCUMENT em usage_metadata.
  • Respostas de função multimodal: agora as respostas de função podem incluir objetos multimodais, como imagens e PDFs, além de texto.

  • Chamada de função de streaming: transmita argumentos de chamada de função parciais para melhorar a experiência do usuário durante o uso da ferramenta.

Para mais informações sobre como usar esses recursos, consulte Começar a usar o Gemini 3.

Testar na Vertex AI Ver no Model Garden (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.
ID do modelo gemini-3-flash-preview
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo, PDF
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 65.536
Recursos
Tipos de uso
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 900
  • Tamanho máximo por arquivo para dados inline ou uploads diretos pelo console: 7 MB
  • Tamanho máximo de cada arquivo do Google Cloud Storage: 30 MB
  • Tokens de resolução padrão: 1120
  • Tipos MIME compatíveis:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de arquivos por comando: 900
  • Número máximo de páginas por arquivo: 900
  • Tamanho máximo de arquivo para importações da API ou do Cloud Storage: 50 MB
  • Tamanho máximo por arquivo para uploads diretos pelo console: 7 MB
  • Tokens de resolução padrão: 560
  • OCR para PDFs digitalizados: Não usado por padrão
  • Tipos MIME compatíveis:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tokens de resolução padrão por frame: 70
  • Tipos MIME aceitos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por solicitação: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de arquivos de áudio por comando: 1
  • Compreensão de fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME aceitos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Padrões de parâmetros
  • Temperatura: 0,0 a 2,0 (padrão 1,0)
  • topP: 0,0-1,0 (padrão 0,95)
  • topK: 64 (corrigido)
  • candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis

Disponibilidade do modelo

(Inclui o PayGo Standard e a capacidade de processamento provisionada)

  • Global
    • global
Consulte Implantações e endpoints para mais informações.
Data limite de conhecimento Janeiro de 2025
Versões
  • gemini-3-flash-preview
    • Estágio de lançamento: pré-lançamento público
    • Data de lançamento: 17 de dezembro de 2025
Controles de segurança
Previsão on-line
  • Residência de dados
  • CMEK
  • VPC-SC
  • AXT
Previsão em lote
  • Residência de dados
  • CMEK
  • VPC-SC
  • AXT
Ajuste
  • Residência de dados
  • CMEK
  • VPC-SC
  • AXT
Cache de contexto
  • Residência de dados
  • CMEK
  • VPC-SC
  • AXT
Consulte Controles de segurança para mais informações.
Idiomas compatíveis Consulte Idiomas aceitos.
Preços Consulte a seção Preços.