O Gemini 3 Flash combina as capacidades de raciocínio do Gemini 3 Pro com os níveis de latência, eficiência e custo da linha Flash. Ele não apenas permite tarefas diárias com raciocínio aprimorado, mas também foi projetado para lidar com os fluxos de trabalho de agentes mais complexos.
O Gemini 3 Flash usa vários recursos novos para melhorar o desempenho, o controle e a fidelidade multimodal:
Nível de pensamento: use o parâmetro
thinking_levelpara controlar a quantidade de raciocínio interno que o modelo realiza (mínimo, baixo, médio ou alto) para equilibrar a qualidade da resposta, a complexidade do raciocínio, a latência e o custo. O parâmetrothinking_levelsubstituithinking_budgetpara modelos do Gemini 3.Para detalhes sobre os diferentes níveis de pensamento, consulte Pensamento.
Assinaturas de pensamento: a validação mais rigorosa das assinaturas de pensamento melhora a confiabilidade na chamada de função em várias interações.
Resolução da mídia: use o parâmetro
media_resolution(baixa, média, alta ou ultra alta) para controlar o processamento de visão em entradas multimodais, afetando o uso de tokens e a latência. Consulte Começar a usar o Gemini 3 para ver as configurações de resolução padrão.- O nível de resolução de mídia ultra alta está disponível apenas para a modalidade
IMAGE. - As contagens de tokens em PDF vão estar listadas na modalidade
IMAGEem vez deDOCUMENTemusage_metadata.
- O nível de resolução de mídia ultra alta está disponível apenas para a modalidade
Respostas de função multimodal: agora as respostas de função podem incluir objetos multimodais, como imagens e PDFs, além de texto.
Chamada de função de streaming: transmita argumentos de chamada de função parciais para melhorar a experiência do usuário durante o uso da ferramenta.
Para mais informações sobre como usar esses recursos, consulte Começar a usar o Gemini 3.
Testar na Vertex AI Ver no Model Garden (prévia) Implantar app de exemplo
| ID do modelo | gemini-3-flash-preview |
|
|---|---|---|
| Entradas e saídas compatíveis |
|
|
| Limites de tokens |
|
|
| Recursos |
|
|
| Tipos de uso |
|
|
| Especificações técnicas | ||
| Imagens |
|
|
| Documentos |
|
|
| Vídeo |
|
|
| Áudio |
|
|
| Padrões de parâmetros |
|
|
| Regiões compatíveis | ||
|
Disponibilidade do modelo (Inclui o PayGo Standard e a capacidade de processamento provisionada) |
|
|
| Consulte Implantações e endpoints para mais informações. | ||
| Data limite de conhecimento | Janeiro de 2025 | |
| Versões |
|
|
| Controles de segurança | ||
| Previsão on-line |
|
|
| Previsão em lote |
|
|
| Ajuste |
|
|
| Cache de contexto |
|
|
| Consulte Controles de segurança para mais informações. | ||
| Idiomas compatíveis | Consulte Idiomas aceitos. | |
| Preços | Consulte a seção Preços. | |