Modelos do Google

Modelos do Gemini em destaque

3 Pro

Projetado para compreensão multimodal abrangente e resolução de problemas complexos

Tem uma janela de contexto com 1 milhão de tokens
Excelente em fluxos de trabalho com agentes e tarefas de programação autônomas
Projetado para tarefas multimodais complexas e raciocínio avançado

3 Flash

Nosso modelo de programação e agêntico mais avançado, com os melhores recursos de compreensão multimodal

O mais recente da nossa linha de modelos de trabalho do Gemini
recursos multimodais e de programação aprimorados
Apresenta nossa nova opção de nível de pensamento quase zero

Criação de Imagens do 2.5 Flash

Turbine seu fluxo de trabalho criativo com a geração de imagens e a edição conversacional

Gerar imagens de alta qualidade
Capacidade de edição conversacional baseada em turnos
Mesmo equilíbrio de velocidade e preço do Gemini 2.5 Flash

Modelos do Gemini com disponibilidade geral

diamond Gemini 2.5 Pro Nosso modelo de alta capacidade para raciocínio e programação complexos. Tem recursos de pensamento adaptativo para resolver desafios complexos de agentes e multimodais com um contexto de 1 milhão de tokens.

spark Gemini 2.5 Flash Rápido e altamente capaz. Oferece um equilíbrio entre inteligência e latência com orçamentos de pensamento controláveis para aplicativos versáteis.

🍌 Criação de Imagens do Gemini 2.5 Flash Transforme ideias em recursos prontos para produção. Oferece edição conversacional, fusão de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados.

performance_auto Gemini 2.5 Flash-Lite Criado para grande escala. Equilibra custo e performance para tarefas de alta capacidade, otimizadas para eficiência sem sacrificar a compreensão multimodal.

audio_spark Gemini 2.5 Flash com a API Gemini Live Projetado para streaming bidirecional em tempo real. Tem áudio integrado de baixa latência e recursos de diálogo afetivo para interações naturais e conversacionais.

spark Gemini 2.0 Flash Desempenho multimodal para desenvolvedores que precisam de um modelo econômico para tarefas de uso geral.

performance_auto Gemini 2.0 Flash-Lite Simplificado e ultraeficiente para tarefas simples e de alta frequência em que velocidade e preço são a prioridade.

Testar modelos do Gemini em pré-lançamento

prévia Gemini 3 Pro Nosso modelo mais recente com foco em raciocínio, otimizado para fluxos de trabalho agênticos complexos e programação. Ele tem pensamento adaptativo, uma janela de contexto de 1 milhão de tokens e embasamento integrado para resolução de problemas multimodais sofisticada.

prévia Gemini 3 Flash Nosso melhor modelo para compreensão multimodal complexa, projetado para resolver os problemas agênticos mais desafiadores com recursos avançados de programação e raciocínio de ponta.

prévia Imagem do Gemini 3 Pro Geração de imagens de alta fidelidade com composição aprimorada por raciocínio. Oferece suporte à renderização de texto legível, edição multiturno complexa e consistência de caracteres usando até 14 entradas de referência.

Modelos Gemma

Gemma 3n Um modelo aberto projetado para execução eficiente em dispositivos com poucos recursos, compatível com entrada multimodal (texto, imagem, vídeo e áudio) e saída de texto em mais de 140 idiomas.

Gemma 3 Um modelo aberto com entrada de texto e imagem, suporte a mais de 140 idiomas e uma janela de contexto de 128 mil tokens.

Gemma 2 Um modelo aberto que oferece suporte à geração, resumo e extração de texto.

Gemma Um modelo aberto pequeno e leve que oferece suporte à geração, resumo e extração de textos.

ShieldGemma 2 Modelos ajustados por instruções para avaliar a segurança de texto e imagem de acordo com políticas definidas.

PaliGemma Um modelo aberto de linguagem de visão que combina SigLIP e Gemma.

CodeGemma Um modelo aberto poderoso e leve para tarefas de programação, incluindo preenchimento, geração e compreensão de código.

TxGemma Um modelo que gera previsões, classificações ou texto com base em dados relacionados a terapias para criar modelos de IA com menos dados e computação.

MedGemma Uma coleção de variantes do Gemma 3 treinadas para desempenho na compreensão de texto e imagem médica.

MedSigLIP Uma variante do SigLIP treinada para codificar imagens e textos médicos em um espaço de incorporação comum.

T5Gemma Uma família de modelos de pesquisa leves de codificador-decodificador.

Modelos de embeddings

width_normal Embeddings para texto Converte dados de texto em representações vetoriais para pesquisa semântica, classificação e clustering.

width_normal Embeddings multimodais Gera vetores com base em imagens para tarefas como classificação e pesquisa de imagens.

Modelos do Imagen

photo_spark Imagen 4 para geração Use comandos de texto para gerar imagens novas com mais qualidade do que nossos modelos anteriores de geração de imagens

photo_spark Imagen 4 para geração rápida Use comandos de texto para gerar imagens novas com mais qualidade e menos latência do que nossos modelos anteriores de geração de imagens

photo_spark Imagen 4 para geração Ultra Use comandos de texto para gerar imagens novas com mais qualidade e melhor aderência ao comando do que nossos modelos anteriores de geração de imagens

photo_spark Imagen 3 para geração 002 Use comandos de texto para gerar imagens novas

photo_spark Imagen 3 para geração 001 Use comandos de texto para gerar imagens novas

photo_spark Imagen 3 para geração rápida Use comandos de texto para gerar imagens novas com menos latência do que nossos outros modelos de geração de imagens

image_edit_auto Imagen 3 para edição e personalização Edita imagens atuais ou gera novas com base em comandos de texto e contexto fornecido.

photo_spark Provador Virtual Gera imagens de pessoas usando produtos de vestuário.

Testar modelos do Imagen

image_edit_auto Recontextualização de produtos do Imagen na Vertex AI Edita imagens de produtos para colocá-los em diferentes cenas ou planos de fundo com base em comandos de texto.

Modelos do Veo

filme Geração do Veo 2 Gera vídeos com base em comandos de texto e imagens.

filme Gerar com o Veo 3 Gera vídeos de alta qualidade com base em comandos de texto e imagens.

filme Veo 3 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.

filme Geração do Veo 3.1 Gera vídeos de alta qualidade com base em comandos de texto e imagens.

movie Veo 3.1 Fast Gera vídeos de alta qualidade e baixa latência com base em comandos de texto e imagens.

Testar modelos do Veo

filme Gerar prévia do Veo 3 Gera vídeos de alta qualidade com base em comandos de texto e imagens.

filme Prévia do Veo 3 Fast Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.

filme Veo 3.1 Gerar prévia Gera vídeos de alta qualidade com base em comandos de texto e imagens.

movie Prévia rápida do Veo 3.1 Gera vídeos de comandos de texto e imagens com alta qualidade e baixa latência.

filme Prévia do Veo 2 Gera vídeos com base em comandos de texto e imagens, com suporte para pintura interna e externa.

Modelos experimentais do Veo

filme Veo 2 Experimental Um modelo experimental com recursos em teste.

Modelos MedLM

medical_information MedLM-medium Um modelo em conformidade com a HIPAA para responder a perguntas médicas e resumir documentos de saúde.

clinical_notes MedLM-large-large Um modelo em conformidade com a HIPAA para responder a perguntas médicas e resumir documentos de saúde.

Suporte ao idioma

Gemini

Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:

af, sq, am, ar, hy, as, az, eu, be, bn, bs, bg, ca, ceb, zh, co, hr, cs, da, dv, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, kri, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mni-Mtei, mn, my, hi, no, ny, or, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, tr, uk, ur, ug, uz, vi, cy, xh, yi, yo e zu.ne

Gemma

O Gemma e o Gemma 2 só oferecem suporte ao inglês (en). O Gemma 3 e o Gemma 3n oferecem suporte multilíngue em mais de 140 idiomas.

Embeddings

Os modelos de embedding de texto multilíngues são compatíveis com os seguintes idiomas:

af, sq, am, ar, hy, az, eu, be, bn, bg, ca, ceb, zh, co, cs, da, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, ku, ky, , , , , , , , , , , , , , , , af, sq, am, ar, hy, az, eu, be, bn, bg, ca, ceb, zh, co, cs, da, nl, en, eo, et, fil, fi, fr, fy, gl, ka, de, el, gu, ht, ha, haw, iw, hi, hmn, hu, is, ig, id, ga, it, ja, jv, kn, kk, km, ko, ku, ky, lo, la, lv, lt, lb, mk, mg, ms, ml, mt, mi, mr, mn, my, ne, ny, no, ps, fa, pl, pt, pa, ro, ru, sm, gd, sr, st, sn, sd, si, sk, sl, so, es, su, sw, sv, tg, ta, te, th, tr, uk, ur, uz, vi, cy, xh, yi, yo e zu.

Imagen 3

O Imagen 3 está disponível nos seguintes idiomas:

Inglês (en), chinês (simplificado e tradicional) (zh), hindi (hi), japonês (ja), coreano (ko), português (pt) e espanhol (es).

MedLM

O modelo MedLM oferece suporte ao idioma inglês (en).

Explorar todos os modelos no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a propriedade do Google e selecionar modelos e recursos de OSS. Para conferir os modelos de IA generativa e as APIs disponíveis na Vertex AI, acesse o Model Garden no console Google Cloud .

Acessar o Model Garden

Para saber mais sobre o Model Garden, incluindo modelos e recursos disponíveis, consulte Explorar modelos de IA no Model Garden.

Versões do modelo

Para conferir todas as versões de modelo, incluindo modelos legados e desativados, consulte Versões e ciclo de vida do modelo.

A seguir

Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
Confira modelos pré-treinados no Model Garden.
Saiba como controlar o acesso a modelos específicos no Model Garden usando uma política de organização do Model Garden.
Saiba mais sobre Preços.