Gemini 3 Flash

Pré-lançamento

Este produto ou recurso está sujeito aos "Termos das Soluções Pré-GA" na seção Termos Gerais de Serviço dos Termos Específicos de Serviçoe aos Termos Adicionais para Produtos de Pré-lançamento de IA Generativa. É possível tratar dados pessoais para esse produto ou recurso conforme descrito no Aditivo sobre Tratamento de Dados do Cloud, sujeito às obrigações e restrições descritas no contrato que rege o acesso ao Google Cloud. Os produtos e recursos pré-GA estão disponíveis no estado em que se encontram e podem ter assistência limitada. Para mais informações, consulte as descrições das fases de lançamento.

O Gemini 3 Flash combina as capacidades de raciocínio do Gemini 3 Pro com os níveis de latência, eficiência e custo da linha Flash. Ele não apenas permite tarefas diárias com raciocínio aprimorado, mas também foi projetado para lidar com os fluxos de trabalho de agentes mais complexos.

O Gemini 3 Flash usa vários recursos novos para melhorar o desempenho, o controle e a fidelidade multimodal:

Nível de pensamento: use o parâmetro thinking_level para controlar a quantidade de raciocínio interno que o modelo realiza (mínimo, baixo, médio ou alto) para equilibrar a qualidade da resposta, a complexidade do raciocínio, a latência e o custo. O parâmetro thinking_level substitui thinking_budget para modelos do Gemini 3.

Observação: se você usou um orçamento de raciocínio de 0 com o Gemini 2.5 Flash, defina o nível de raciocínio como MINIMAL para ter latência e custo semelhantes. No entanto, ainda é necessário processar assinaturas de pensamento ao usar o nível de raciocínio mínimo.

Para detalhes sobre os diferentes níveis de pensamento, consulte Pensamento.
Assinaturas de pensamento: a validação mais rigorosa das assinaturas de pensamento melhora a confiabilidade na chamada de função de várias interações.
Resolução da mídia: use o parâmetro media_resolution (baixa, média, alta ou ultra alta) para controlar o processamento de visão em entradas multimodais, afetando o uso de tokens e a latência. Consulte Começar a usar o Gemini 3 para ver as configurações de resolução padrão.
- O nível de resolução de mídia ultra alta está disponível apenas para a modalidade IMAGE.
- As contagens de tokens em PDF vão estar listadas na modalidade IMAGE em vez de DOCUMENT em usage_metadata.
Respostas de função multimodal: agora as respostas de função podem incluir objetos multimodais, como imagens e PDFs, além de texto.
Chamada de função de streaming: transmita argumentos de chamada de função parciais para melhorar a experiência do usuário durante o uso da ferramenta.

Para mais informações sobre como usar esses recursos, consulte Começar a usar o Gemini 3.

Testar na Vertex AI Ver no Model Garden (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.

Especificações técnicas
ID do modelo	`gemini-3-flash-preview`
Entradas e saídas compatíveis	Entradas: Texto, Código, Imagens, Áudio, Vídeo, PDF Saídas: Texto
Limites de tokens	Máximo de tokens de entrada: 1.048.576 Máximo de tokens de saída: 65.536
Recursos	Sim Embasamento com a Pesquisa Google Execução de código Instruções do sistema Saída estruturada Chamadas de função Contar tokens Pensar Armazenamento em cache de contexto implícito Armazenamento em cache de contexto explícito Mecanismo RAG da Vertex AI Conclusões de chat Sem suporte API Gemini Live
Opções de consumo	Sim Capacidade de processamento provisionada Padrão PayGo Flex PayGo Priority PayGo Previsão em lote Sem suporte
Opções de consumo	Consulte Opções de consumo para mais informações.
	Imagens	Máximo de imagens por comando: 900 Tamanho máximo por arquivo para dados inline ou uploads diretos pelo console: 7 MB Tamanho máximo de cada arquivo do Google Cloud Storage: 30 MB Tokens de resolução padrão: 1120 Tipos MIME compatíveis: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documentos	Número máximo de arquivos por comando: 900 Número máximo de páginas por arquivo: 900 Tamanho máximo de arquivo para importações da API ou do Cloud Storage: 50 MB Tamanho máximo por arquivo para uploads diretos pelo console: 7 MB Tokens de resolução padrão: 560 OCR para PDFs digitalizados: Não usado por padrão Tipos MIME compatíveis: `application/pdf`, `text/plain`
	Vídeo	Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora Número máximo de vídeos por comando: 10 Tokens de resolução padrão por frame: 70 Tipos MIME aceitos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima do áudio por solicitação: Aproximadamente 8,4 horas ou até 1 milhão de tokens Número máximo de arquivos de áudio por comando: 1 Entendimento de fala para: resumo, transcrição e tradução de áudio Tipos MIME aceitos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Padrões de parâmetro	Temperatura: 0,0 a 2,0 (padrão 1,0) topP: 0,0-1,0 (padrão 0,95) topK: 64 (corrigido) candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis
	Disponibilidade do modelo	Global global
	Consulte Implantações e endpoints para mais informações.
Data limite de conhecimento	Janeiro de 2025
Versões	`gemini-3-flash-preview` Estágio de lançamento: pré-lançamento Data de lançamento: 17 de dezembro de 2025
Idiomas compatíveis	Consulte Idiomas aceitos.
Preços	Consulte a seção Preços.

Gemini 3 Flash Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Gemini 3 Flash