Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos do Google

Modelos do Gemini em destaque

3.6 Flash

Eficiência aprimorada e raciocínio prático para ajudar você a criar e iterar com mais facilidade

Maior eficiência de token
Geração de código mais confiável
Raciocínio multimodal mais eficiente

3.5 Flash-Lite

Nossa maneira rápida e econômica de potencializar seus aplicativos do dia a dia

Otimizado para baixa latência e tráfego de alto volume
Orquestração de ferramentas detalhada
Entendimento preciso de documentos

3.1 Flash Image

Transforme ideias em recursos prontos para produção

Gerar imagens de alta qualidade
Capacidade de edição conversacional baseada em turnos
Capaz de fusão de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados

Modelos do Gemini com disponibilidade geral

spark Gemini 3.6 Flash Otimizado para fluxos de trabalho complexos e de várias etapas, geração de código aprimorada e raciocínio multimodal melhorado, tudo isso usando menos tokens.

performance_auto Gemini 3.5 Flash-Lite Crie fluxos de trabalho agênticos leves com velocidade máxima e custo mínimo.

🍌 Imagem do Gemini 3.1 Flash-Lite (Nano Banana 2 Lite) Transforme ideias em recursos prontos para produção. Projetado para cargas de trabalho de alto volume e sensíveis à latência.

🍌 Criação de imagens do Gemini 3.1 Flash Transforme ideias em recursos prontos para produção. Oferece edição conversacional, fusão de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados.

🍌 Imagem do Gemini 3 Pro Geração de imagens de alta fidelidade com composição aprimorada por raciocínio. Oferece suporte a renderizações de textos legíveis, edição multiturno complexa e consistência de caracteres usando até 14 entradas de referência.

spark Gemini 3.5 Flash O Gemini 3.5 Flash oferece inteligência quase Pro com o custo e a velocidade da categoria Flash: proficiência em programação no nível Pro, execução agêntica paralela, tudo pelo mesmo preço de um modelo Flash.

performance_auto Gemini 3.1 Flash-Lite Nosso modelo mais econômico, otimizado para casos de uso de baixa latência para tráfego de LLM de alto volume e sensível a custos.

diamond Gemini 2.5 Pro Nosso modelo de alta capacidade para raciocínio complexo e programação. Tem recursos de pensamento adaptativo para resolver desafios complexos de agentes e multimodais com um contexto de 1 milhão de tokens.

spark Gemini 2.5 Flash Rápido e altamente eficiente. Oferece um equilíbrio entre inteligência e latência com orçamentos de pensamento controláveis para aplicativos versáteis.

🍌 Criação de imagens do Gemini 2.5 Flash Transforme ideias em recursos prontos para produção. Oferece edição conversacional, fusão de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados.

performance_auto Gemini 2.5 Flash-Lite Criado para grande escala. Equilibra custo e performance para tarefas de alta capacidade, otimizadas para eficiência sem sacrificar a compreensão multimodal.

audio_spark Gemini 2.5 Flash com a API Gemini Live Projetado para streaming bidirecional em tempo real. Tem recursos de áudio integrado de baixa latência e diálogo afetivo para interações naturais e conversacionais.

Testar modelos do Gemini em pré-lançamento

pré-lançamento Gemini Omni Flash Gere vídeos com base em texto ou recursos de referência ou edite vídeos atuais.

pré-lançamento Gemini 3 Flash Nosso melhor modelo para compreensão multimodal complexa, projetado para resolver os problemas agênticos mais desafiadores com recursos avançados de programação e raciocínio de última geração.

pré-lançamento Imagens no Gemini 3 Pro Geração de imagens de alta fidelidade com composição aprimorada por raciocínio. Oferece suporte a renderizações de textos legíveis, edição multiturno complexa e consistência de caracteres usando até 14 entradas de referência.

Modelos Gemma

Gemma 4 Um modelo aberto adequado para tarefas como geração de texto, programação e raciocínio, com suporte a entrada multimodal (texto e imagem para todas as variantes e áudio para as variantes E2B e E4B).

Gemma 3n Um modelo aberto projetado para execução eficiente em dispositivos com poucos recursos, compatível com entrada multimodal (texto, imagem, vídeo e áudio) e saída de texto em mais de 140 idiomas.

Gemma 3 Um modelo aberto com entrada de texto e imagem, suporte a mais de 140 idiomas e uma janela de contexto de 128 mil tokens.

Gemma 2 Um modelo aberto que oferece suporte à geração, resumo e extração de texto.

Gemma Um modelo aberto pequeno e leve que oferece suporte à geração, resumo e extração de textos.

ShieldGemma 2 Modelos ajustados por instruções para avaliar a segurança de texto e imagem de acordo com políticas definidas.

PaliGemma Um modelo aberto de linguagem de visão que combina SigLIP e Gemma.

CodeGemma Um modelo aberto poderoso e leve para tarefas de programação, incluindo preenchimento, geração e compreensão de código.

TxGemma Um modelo que gera previsões, classificações ou texto com base em dados relacionados a terapias para criar modelos de IA com menos dados e computação.

MedGemma Uma coleção de variantes do Gemma 3 treinadas para desempenho na compreensão de texto e imagem médica.

MedSigLIP Uma variante do SigLIP treinada para codificar imagens e textos médicos em um espaço de embedding comum.

T5Gemma Uma família de modelos de pesquisa leves de codificador-decodificador.

Modelos de embeddings

width_normal Embeddings para texto Converte dados de texto em representações vetoriais para pesquisa semântica, classificação e clustering.

width_normal Embeddings multimodais Gera vetores com base em imagens para tarefas como classificação e pesquisa de imagens.

Modelos do Veo

filme Geração do Veo 2 Gera vídeos com base em comandos de texto e imagens.

filme Geração do Veo 3 Gera vídeos de alta qualidade com base em comandos de texto e imagens.

filme Veo 3 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.

filme Geração do Veo 3.1 Gera vídeos de alta qualidade com base em comandos de texto e imagens.

movie Veo 3.1 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.

Testar os modelos do Veo

filme Prévia do Veo 3.1 Lite Gera vídeos de alta qualidade e baixo custo com base em comandos de texto e imagens.

Modelos do Lyria

music_note_spark Lyria 3 Pro (prévia) Gera músicas completas com base em comandos de texto e imagem.

music_note_spark Clipe do Lyria 3 (Prévia) Gera clipes de áudio de 30 segundos com base em comandos de texto e imagem.

audio_spark Lyria 2 Gera músicas com base em comandos de texto.

Suporte ao idioma

Gemini

Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:

af, sq, am, ar, hy, as, az, eu, be, bn, bs, bg, ca, ceb, zh, co, hr, cs, da, dv, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, ne, az, eu, be, bn, bs, bg, ca, ceb, zh, co, hr, cs, da, dv, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, ne, no, ny, or, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, tr, uk, ur, ug, uz, vi, cy, xh, yi, yo e zu.

Gemma

O Gemma e o Gemma 2 só oferecem suporte ao inglês (en). O Gemma 3 e o Gemma 3n oferecem suporte a mais de 140 idiomas.

Embeddings

Os modelos de embedding de texto multilíngues são compatíveis com os seguintes idiomas:

africâner (af), albanês (sq), amárico (am), árabe (ar), armênio (hy), azerbaijano (az), basco (eu), bielorrusso (be), bengali (bn), búlgaro (bg), catalão (ca), cebuano (ceb), chinês (simplificado e tradicional) (zh), corso (co), tcheco (cs), dinamarquês (da), holandês (nl), inglês (en), esperanto (eo), estoniano (et), filipino (tagalo) (fil), finlandês (fi), francês (fr), frísio (fy), galego (gl), georgiano (ka), alemão (de), grego (el), gujarati (gu), crioulo haitiano (ht), hausa (ha), havaiano (haw), hebraico (iw), hindi (hi), hmong (hmn), húngaro (hu), islandês (is), igbo (ig), indonésio (id), irlandês (ga), italiano (it), japonês (ja), javanês (jv), canará (kn), cazaque (kk), khmer (km), coreano (ko), curdo (ku), quirguiz (ky), laosiano (lo), latim (la), letão (lv), lituano (), luxemburguês (), macedônio (), malgaxe (), malaio (), malayalam (), maltês (), maori (), marathi (), mongol (), birmanês (), nepalês (), nyanja (chichewa) (af), norueguês (sq), pashto (am), persa (ar), polonês (hy), português (az), punjabi (eu), romeno (be), russo (bn), samoano (bg), gaélico escocês (ca), sérvio (ceb), sesoto (zh), shona (co), sindi (cs), cingalês (da), eslovaco (nl), esloveno (en), somali (eo), espanhol (et), sundanês (fil), suaíli (fi), sueco (fr), tajique (fy), tâmil (gl), telugu (ka), tailandês (de), turco (el), ucraniano (gu), urdu (ht), uzbeque (ha), vietnamita (haw), galês (iw), xhosa (hi), iídiche (hmn), iorubá (hu) e zulu (is).ltlbmkmgmsmlmtmimrmnmynenynopsfaplptparorusmgdsrstsnsdsiskslsoessuswsvtgtatethtrukuruzvicyxhyiyozu

Explorar todos os modelos no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a propriedade do Google e selecionar modelos e recursos de OSS. Para conferir os modelos de IA generativa e as APIs disponíveis na Gemini Enterprise Agent Platform, acesse o Model Garden no console Google Cloud .

Acessar o Model Garden

Para saber mais sobre o Model Garden, incluindo modelos e recursos disponíveis, consulte Explorar modelos de IA no Model Garden.

Versões do modelo

Para conferir todas as versões de modelo, incluindo modelos legados e desativados, consulte Versões e ciclo de vida do modelo.

Modelos do Google Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.