Modelos do Google

Modelos do Gemini em destaque

Modelos do Gemini com disponibilidade geral

performance_auto Gemini 3.1 Flash-Lite Nosso modelo mais econômico, otimizado para casos de uso de baixa latência em tráfego de LLM de alto volume e sensível a custos.
diamond Gemini 2.5 Pro Nosso modelo de alta capacidade para raciocínio complexo e programação. Tem recursos de pensamento adaptativo para resolver desafios complexos de agentes e multimodais com um contexto de 1 milhão de tokens.
spark Gemini 2.5 Flash Rápido e altamente capaz. Oferece um equilíbrio entre inteligência e latência com orçamentos de pensamento controláveis para aplicativos versáteis.
🍌 Criação de imagens do Gemini 2.5 Flash Transforme ideias em recursos prontos para produção. Oferece edição conversacional, fusão de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados.
performance_auto Gemini 2.5 Flash-Lite Criado para grande escala. Equilibra custo e performance para tarefas de alta capacidade, otimizadas para eficiência sem sacrificar a compreensão multimodal.
audio_spark Gemini 2.5 Flash com a API Gemini Live Projetado para streaming bidirecional em tempo real. Tem recursos de áudio integrado de baixa latência e diálogo afetivo para interações naturais e conversacionais.
spark Gemini 2.0 Flash Desempenho multimodal para desenvolvedores que precisam de um modelo econômico para tarefas de uso geral.
performance_auto Gemini 2.0 Flash-Lite Simplificado e ultraeficiente para tarefas simples e de alta frequência em que velocidade e preço são a prioridade.

Testar modelos do Gemini em pré-lançamento

prévia Imagem do Gemini 3.1 Flash Transforme ideias em recursos prontos para produção. Oferece edição conversacional, fusão de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados.
pré-lançamento Gemini 3.1 Pro Nosso modelo mais recente, que prioriza o raciocínio e é otimizado para programação e fluxos de trabalho agênticos complexos. Ele tem pensamento adaptativo, uma janela de contexto de 1 milhão de tokens e embasamento integrado para resolução de problemas multimodais sofisticada.
pré-lançamento Gemini 3 Flash Nosso melhor modelo para compreensão multimodal complexa, projetado para resolver os problemas agênticos mais desafiadores com programação avançada e recursos de raciocínio de ponta.
pré-lançamento Imagens no Gemini 3 Pro Geração de imagens de alta fidelidade com composição aprimorada por raciocínio. Oferece suporte à renderização de texto legível, edição multiturno complexa e consistência de caracteres usando até 14 entradas de referência.

Modelos Gemma

Gemma 4 Um modelo aberto adequado para tarefas como geração de texto, programação e raciocínio, com suporte para entrada multimodal (texto e imagem para todas as variantes, além de áudio para as variantes E2B e E4B).
Gemma 3n Um modelo aberto projetado para execução eficiente em dispositivos com poucos recursos, compatível com entrada multimodal (texto, imagem, vídeo e áudio) e saída de texto em mais de 140 idiomas.
Gemma 3 Um modelo aberto com entrada de texto e imagem, suporte a mais de 140 idiomas e uma janela de contexto de 128 mil tokens.
Gemma 2 Um modelo aberto que oferece suporte à geração, resumo e extração de texto.
Gemma Um modelo aberto pequeno e leve que oferece suporte à geração, resumo e extração de textos.
ShieldGemma 2 Modelos ajustados por instruções para avaliar a segurança de texto e imagem de acordo com políticas definidas.
PaliGemma Um modelo aberto de linguagem/visão que combina SigLIP e Gemma.
CodeGemma Um modelo aberto poderoso e leve para tarefas de programação, incluindo preenchimento, geração e compreensão de código.
TxGemma Um modelo que gera previsões, classificações ou texto com base em dados relacionados a terapias para criar modelos de IA com menos dados e computação.
MedGemma Uma coleção de variantes do Gemma 3 treinadas para desempenho na compreensão de texto e imagem médica.
MedSigLIP Uma variante do SigLIP treinada para codificar imagens e textos médicos em um espaço de embedding comum.
T5Gemma Uma família de modelos de pesquisa leves de codificador-decodificador.

Modelos de embeddings

width_normal Embeddings para texto Converte dados de texto em representações vetoriais para pesquisa semântica, classificação e clustering.
width_normal Embeddings multimodais Gera vetores com base em imagens para tarefas como classificação e pesquisa de imagens.

Modelos do Veo

filme Geração do Veo 2 Gera vídeos com base em comandos de texto e imagens.
filme Geração do Veo 3 Gera vídeos de alta qualidade com base em comandos de texto e imagens.
filme Veo 3 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.
filme Geração do Veo 3.1 Gera vídeos de alta qualidade com base em comandos de texto e imagens.
filme Veo 3.1 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.

Testar modelos do Veo

movie Prévia do Veo 3.1 Lite Gere vídeos de alta qualidade e baixo custo com comandos de texto e imagens.
filme Gerar prévia do Veo 3 Gera vídeos de alta qualidade com base em comandos de texto e imagens.
movie Prévia do Veo 3 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.
filme Veo 3.1 Gerar prévia Gera vídeos de alta qualidade com base em comandos de texto e imagens.
filme Prévia rápida do Veo 3.1 Gera vídeos de alta qualidade e baixa latência com base em comandos de texto e imagens.
filme Prévia do Veo 2 Gera vídeos com base em comandos de texto e imagens, com suporte para pintura interna e externa.

Modelos experimentais do Veo

filme Veo 2 Experimental Um modelo experimental com recursos em teste.

Modelos do Lyria

music_note_spark Lyria 3 Pro (prévia) Gera músicas completas com base em comandos de texto e imagem.
music_note_spark Clipe do Lyria 3 (Prévia) Gera clipes de áudio de 30 segundos com base em comandos de texto e imagem.
audio_spark Lyria 2 Gera músicas com base em comandos de texto.

Suporte ao idioma

Gemini

Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:

af, sq, am, ar, hy, as, az, eu, be, bn, bs, bg, ca, ceb, zh, co, hr, cs, da, dv, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, ne, no, ny, or, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, ne, no, ny, or, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, tr, uk, ur, ug, uz, vi, cy, xh, yi, yo e zu.

Gemma

O Gemma e o Gemma 2 só oferecem suporte ao inglês (en). O Gemma 3 e o Gemma 3n oferecem suporte a mais de 140 idiomas.

Embeddings

Os modelos de embedding de texto multilíngues são compatíveis com os seguintes idiomas:

af, sq, am, ar, hy, az, eu, be, bn, bg, ca, ceb, zh, co, cs, da, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mn, my, ne, ny, no, ps, fa, pl, pt, pa, be, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, el, uk, ur, uz, vi, cy, xh, yi, yo e is.rotrzu

Explorar todos os modelos no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a propriedade do Google e selecionar modelos e recursos de OSS. Para conferir os modelos de IA generativa e as APIs disponíveis na plataforma de agentes do Gemini Enterprise, acesse "Grupo de modelos" no console Google Cloud .

Acessar o Model Garden

Para saber mais sobre o Model Garden, incluindo modelos e recursos disponíveis, consulte Explorar modelos de IA no Model Garden.

Versões do modelo

Para conferir todas as versões de modelo, incluindo modelos legados e desativados, consulte Versões e ciclo de vida do modelo.

A seguir