Modelos Google

Modelos do Gemini em destaque

3 Pro

Concebido para uma compreensão multimodal abrangente e resolução de problemas complexos

Inclui uma capacidade de resposta de 1 milhão de tokens
Excelente em fluxos de trabalho de agentes e tarefas de programação autónomas
Concebido para tarefas multimodais complexas e raciocínio avançado

3 Flash

O nosso modelo de programação e agência mais poderoso, com as melhores capacidades de compreensão multimodal

O mais recente da nossa linha de modelos Gemini de alto desempenho
Capacidades multimodais e de programação melhoradas
Inclui a nossa nova opção de nível de raciocínio quase nulo

2.5 Flash Image

Dinamize o seu fluxo de trabalho criativo com a geração de imagens e a edição conversacional

Gere imagens de alta qualidade
Capaz de edição através de conversa baseada em turnos
O mesmo equilíbrio entre velocidade e preço que o Gemini 2.5 Flash

Modelos do Gemini disponíveis de forma geral

diamond Gemini 2.5 Pro O nosso modelo de alta capacidade para raciocínio complexo e programação. Apresenta capacidades de raciocínio adaptativo para resolver desafios complexos de agentes e multimodais com uma capacidade de resposta de 1 milhão de tokens.

spark Gemini 2.5 Flash Extremamente rápido e altamente capaz. Oferece um equilíbrio entre inteligência e latência com orçamentos de processamento controláveis para aplicações versáteis.

🍌 Gemini 2.5 Flash Image Transforme ideias em recursos prontos para produção. Inclui edição conversacional, união de várias imagens e consistência de personagens para fluxos de trabalho criativos avançados.

performance_auto Gemini 2.5 Flash-Lite Criado para uma escala massiva. Equilibra o custo e o desempenho para tarefas de elevado débito, otimizado para a eficiência sem sacrificar a compreensão multimodal.

audio_spark Gemini 2.5 Flash com a API Gemini Live Concebido para streaming bidirecional em tempo real. Inclui áudio integrado de baixa latência e capacidades de diálogo afetivo para interações naturais e conversacionais.

spark Gemini 2.0 Flash Desempenho multimodal para programadores que precisam de um modelo económico para tarefas de uso geral.

performance_auto Gemini 2.0 Flash-Lite Simplificado e ultraeficiente para tarefas simples e de alta frequência em que a velocidade e o preço são a prioridade.

Pré-visualize os modelos do Gemini

pré-visualização Gemini 3 Pro O nosso modelo mais recente com base no raciocínio, otimizado para fluxos de trabalho de agentes complexos e programação. Apresenta raciocínio adaptável, uma capacidade de resposta de 1 milhão de tokens e fundamentação integrada para uma resolução de problemas multimodal sofisticada.

pré-visualização Gemini 3 Flash O nosso melhor modelo para a compreensão multimodal complexa, concebido para resolver os problemas de agência mais desafiantes com fortes capacidades de programação e raciocínio de última geração.

pré-visualização Gemini 3 Pro Image Geração de imagens de alta fidelidade com composição melhorada pelo raciocínio. Suporta a renderização de texto legível, a edição complexa de várias interações e a consistência de carateres com até 14 entradas de referência.

Modelos Gemma

Gemma 3n Um modelo aberto concebido para uma execução eficiente em dispositivos com poucos recursos, que suporta a entrada multimodal (texto, imagem, vídeo e áudio) e a saída de texto em mais de 140 idiomas.

Gemma 3 Um modelo aberto com entrada de texto e imagem, suporte para mais de 140 idiomas e uma janela de contexto de 128 mil tokens.

Gemma 2 Um modelo aberto que suporta a geração, o resumo e a extração de texto.

Gemma Um modelo aberto pequeno e leve que suporta a geração, o resumo e a extração de texto.

ShieldGemma 2 Modelos ajustados por instruções para avaliar a segurança de texto e imagens em relação a políticas definidas.

PaliGemma Um modelo de linguagem de visão aberto que combina o SigLIP e o Gemma.

CodeGemma Um modelo aberto poderoso e leve para tarefas de programação, incluindo a conclusão, a geração e a compreensão de código.

TxGemma Um modelo que gera previsões, classificações ou texto com base em dados relacionados com terapêuticas, para criar modelos de IA com menos dados e computação.

MedGemma Uma coleção de variantes do Gemma 3 preparadas para o desempenho na compreensão de texto e imagens médicas.

MedSigLIP Uma variante do SigLIP preparada para codificar imagens médicas e texto num espaço de incorporação comum.

T5Gemma Uma família de modelos de investigação de codificador-descodificador leves.

Modelos de incorporações

width_normal Incorporações para texto Converte dados de texto em representações vetoriais para pesquisa semântica, classificação e agrupamento.

width_normal Incorporações multimodais Gera vetores com base em imagens para tarefas como a classificação e a pesquisa de imagens.

Modelos Imagen

photo_spark Imagen 4 for Generation Use comandos de texto para gerar imagens originais com uma qualidade superior à dos nossos modelos de geração de imagens anteriores

photo_spark Imagen 4 for Fast Generation Use comandos de texto para gerar imagens originais com uma qualidade superior e uma latência inferior à dos nossos modelos de geração de imagens anteriores

photo_spark Imagen 4 for Ultra Generation Use comandos de texto para gerar imagens originais com uma qualidade superior e uma melhor aderência aos comandos do que os nossos modelos de geração de imagens anteriores

photo_spark Imagen 3 for Generation 002 Use comandos de texto para gerar imagens originais

photo_spark Imagen 3 for Generation 001 Use comandos de texto para gerar imagens originais

photo_spark Imagen 3 for Fast Generation Use comandos de texto para gerar imagens originais com uma latência inferior à dos nossos outros modelos de geração de imagens

image_edit_auto Imagen 3 for Editing and Customization Edita imagens existentes ou gera novas imagens com base em comandos de texto e no contexto fornecido.

Pré-visualize modelos Imagen

photo_spark Experiência virtual Gera imagens de pessoas a usar produtos de vestuário.

image_edit_auto Recontextualização de produtos do Imagen na Vertex AI Edita imagens de produtos para as colocar em diferentes cenas ou fundos com base em comandos de texto.

Modelos Veo

filme Veo 2 Generate Gera vídeos a partir de comandos de texto e imagens.

Filme Veo 3 Generate Gera vídeos a partir de comandos de texto e imagens com alta qualidade.

filme Veo 3 Fast Gera vídeos a partir de comandos de texto e imagens com alta qualidade e baixa latência.

filme Veo 3.1 Generate Gera vídeos a partir de comandos de texto e imagens com alta qualidade.

filme Veo 3.1 Fast Gera vídeos a partir de comandos de texto e imagens com alta qualidade e baixa latência.

Pré-visualize os modelos Veo

filme Veo 3 Generate preview Gera vídeos a partir de comandos de texto e imagens com alta qualidade.

filme Pré-visualização do Veo 3 Fast Gera vídeos a partir de comandos de texto e imagens com alta qualidade e baixa latência.

filme Veo 3.1 Gerar pré-visualização Gera vídeos a partir de comandos de texto e imagens com alta qualidade.

filme Pré-visualização do Veo 3.1 Fast Gera vídeos a partir de comandos de texto e imagens com alta qualidade e baixa latência.

filme Pré-visualização do Veo 2 Gera vídeos a partir de comandos de texto e imagens, suportando a funcionalidade de preenchimento e de preenchimento exterior.

Modelos Veo experimentais

movie Veo 2 Experimental Um modelo experimental com funcionalidades em teste.

Modelos MedLM

medical_information MedLM-medium Um modelo em conformidade com a HIPAA para responder a perguntas médicas e resumir documentos de cuidados de saúde.

clinical_notes MedLM-large-large Um modelo em conformidade com a HIPAA para responder a perguntas médicas e resumir documentos de cuidados de saúde.

Suporte de idiomas

Gemini

Todos os modelos Gemini podem compreender e responder nos seguintes idiomas:

Africâner (af), albanês (sq), amárico (am), árabe (ar), arménio (hy), assamês (as), azerbaijano (az), basco (eu), bielorrusso (be), bengali (bn), bósnio (bs), búlgaro (bg), catalão (ca), cebuano (ceb), chinês (simplificado e tradicional) (zh), corso (co), croata (hr), checo (cs), dinamarquês (da), divehi (dv), holandês (nl), inglês (en), esperanto (eo), estónio (et), filipino (tagalo) (fil), finlandês (fi), francês (fr), frísio (fy), galego (gl), georgiano (ka), alemão (de), grego (el), gujarati (gu), crioulo haitiano (ht), haúça (ha), havaiano (haw), hebraico (iw), hindi (hi), hmong (hmn), húngaro (hu), islandês (is), igbo (ig), indonésio (id), irlandês (ga), italiano (it), japonês (ja), javanês (jv), canarim (kn), cazaque (kk), khmer (km), coreano (ko), krio (kri), curdo (ku), quirguiz (ky), laosiano (lo), latim (la), letão (lv), lituano (lt), luxemburguês (lb), macedónio (mk), malgaxe (mg), malaio (ms), malaiala (ml), maltês (mt), maori (mi), marata (mr), meiteilon (manipuri) (mni-Mtei), mongol (mn), birmanês (my), nepalês (ne), norueguês (no), nianja (chichewa) (ny), oriya (or), pastó (ps), persa (fa), polaco (pl), português (pt), panjabi (pa), romeno (ro), russo (ru), samoano (sm), gaélico escocês (gd), sérvio (sr), sesoto (st), shona (sn), sindi (en), cingalês (si), eslovaco (sk), esloveno (sl), somali (so), espanhol (es), sundanês (su), suaíli (sw), sueco (sv), tajique (tg), tâmil (ta), telugu (te), tailandês (th), turco (tr), ucraniano (uk), urdu (ur), uigures (ug), usbeque (uz), vietnamita (vi), galês (cy), xosa (xh), iídiche (yi), iorubá (yo) e zulu (zu).sd

Gemma

O Gemma e o Gemma 2 só suportam o idioma inglês (en). O Gemma 3 e o Gemma 3n oferecem suporte multilingue em mais de 140 idiomas.

Incorporações

Os modelos de incorporação de texto multilingues são compatíveis com os seguintes idiomas:

Africâner (af), albanês (sq), amárico (am), árabe (ar), arménio (hy), azerbaijano (az), basco (eu), bielorrusso (be), bengali (bn), búlgaro (bg), catalão (ca), cebuano (ceb), chinês (simplificado e tradicional) (zh), corso (co), checo (cs), dinamarquês (da), holandês (nl), inglês (en), esperanto (eo), estónio (et), filipino (tagalo) (fil), finlandês (fi), francês (fr), frísio (fy), galego (gl), georgiano (ka), alemão (de), grego (el), gujarati (gu), crioulo haitiano (ht), haúça (ha), havaiano (haw), hebraico (iw), hindi (hi), hmong (hmn), húngaro (hu), islandês (is), igbo (ig), indonésio (id), irlandês (ga), italiano (it), japonês (ja), javanês (jv), canarim (kn), cazaque (kk), khmer (km), coreano (ko), curdo (ku), quirguiz (ky), laosiano (lo), latim (la), letão (lv), lituano (lt), luxemburguês (lb), macedónio (mk), malgaxe (mg), malaio (ms), malaiala (), maltês (), maori (), marata (), mongol (), myanmar (birmanês) (), nepalês (), nianja (chicheua) (af), norueguês (sq), pastó (am), persa (ar), polaco (hy), português (az), panjabi (eu), romeno (be), russo (bn), samoano (bg), gaélico escocês (ca), sérvio (ceb), sesoto (zh), xona (co), sindi (cs), cingalês (da), eslovaco (nl), esloveno (en), somali (eo), espanhol (et), sundanês (fil), suaíli (fi), sueco (fr), tajique (fy), tâmil (gl), telugu (ka), tailandês (de), turco (el), ucraniano (gu), urdu (ht), usbeque (ha), vietnamita (haw), galês (iw), xosa (hi), iídiche (hmn), iorubá (hu) e zulu (is).mlmtmimrmnmynenynopsfaplptparorusmgdsrstsnsdsiskslsoessuswsvtgtatethtrukuruzvicyxhyiyozu

Imagen 3

O Imagen 3 suporta os seguintes idiomas:

Inglês (en), chinês (simplificado e tradicional) (zh), hindi (hi), japonês (ja), coreano (ko), português (pt) e espanhol (es).

MedLM

O modelo MedLM suporta o idioma inglês (en).

Explore todos os modelos no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implementar modelos e recursos proprietários da Google e de OSS selecionados. Para explorar os modelos e as APIs de IA generativa disponíveis no Vertex AI, aceda ao Model Garden na Google Cloud consola.

Aceda ao Model Garden

Para saber mais sobre o Model Garden, incluindo os modelos e as capacidades disponíveis, consulte o artigo Explore modelos de IA no Model Garden.

Versões do modelo

Para ver todas as versões do modelo, incluindo modelos antigos e descontinuados, consulte o artigo Versões e ciclo de vida dos modelos.

O que se segue?

Experimente um tutorial de início rápido com o Vertex AI Studio ou a API Vertex AI.
Explore modelos pré-treinados no Model Garden.
Saiba como controlar o acesso a modelos específicos no Model Garden através de uma política de organização do Model Garden.
Saiba mais acerca dos preços.