Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos de Google

Modelos de Gemini destacados

3.5 Flash

Diseñado para ofrecer sólidas capacidades de agente (casi a nivel profesional) con gran velocidad y valor.

Competencia en programación a nivel profesional y ejecución paralela de agentes
Cuenta con una ventana de contexto de 1 millón de tokens
Inteligencia casi profesional con el costo y la velocidad de Flash

3.1 Pro

Diseñado para la comprensión multimodal integral y la resolución de problemas complejos

Cuenta con una ventana de contexto de 1 millón de tokens
Se mejoró el rendimiento en los flujos de trabajo con agentes y las tareas de programación autónomas
Diseñado para tareas multimodales complejas y razonamiento avanzado

3 Flash

Nuestro modelo de agente y programación más potente, con las mejores capacidades de comprensión multimodal

El modelo más reciente de nuestra línea de modelos de Gemini
Capacidades mejoradas de multimodalidad y codificación
Incluye nuestra nueva opción de nivel de pensamiento casi nulo

3.1 Flash-Lite

Nuestro modelo más rentable, optimizado para casos de uso de baja latencia para tráfico de LLM de gran volumen y sensible a los costos

Optimizado para tráfico de baja latencia y gran volumen
Mejora de la calidad de las respuestas y el cumplimiento de las instrucciones
Se mejoró la calidad de la entrada de audio para las tareas de RAH

2.5 Flash Image

Impulsa tu flujo de trabajo creativo con la generación de imágenes y la edición conversacional

Genera imágenes de alta calidad
Capacidad de edición conversacional por turnos
El mismo equilibrio entre velocidad y precio que Gemini 2.5 Flash

Modelos de Gemini disponibles de forma general

spark Gemini 3.5 Flash Gemini 3.5 Flash ofrece inteligencia casi profesional a un costo y velocidad de nivel Flash: competencia en programación de nivel profesional, ejecución de agentes paralela, todo al mismo precio que un modelo Flash.

performance_auto Gemini 3.1 Flash-Lite Nuestro modelo más rentable, optimizado para casos de uso de baja latencia para tráfico de LLM de gran volumen y sensible a los costos.

diamond Gemini 2.5 Pro Nuestro modelo de alta capacidad para el razonamiento complejo y la programación. Cuenta con capacidades de pensamiento adaptativo para resolver desafíos complejos de agentes y multimodales con un contexto de 1 millón de tokens.

estrella Gemini 2.5 Flash Es ultrarrápido y muy capaz. Ofrece un equilibrio entre inteligencia y latencia con presupuestos de pensamiento controlables para aplicaciones versátiles.

🍌 Gemini 2.5 Flash Image Convierte ideas en recursos listos para producción. Ofrece edición conversacional, fusión de varias imágenes y coherencia de personajes para flujos de trabajo creativos avanzados.

performance_auto Gemini 2.5 Flash-Lite Creado para una escala masiva. Equilibra el costo y el rendimiento para las tareas de alto rendimiento, y se optimiza para la eficiencia sin sacrificar la comprensión multimodal.

audio_spark Gemini 2.5 Flash con la API de Gemini Live Diseñado para la transmisión bidireccional en tiempo real. Cuenta con audio integrado de baja latencia y capacidades de diálogo afectivo para interacciones naturales y conversacionales.

spark Gemini 2.0 Flash Rendimiento multimodal para desarrolladores que necesitan un modelo rentable para tareas de uso general.

performance_auto Gemini 2.0 Flash-Lite Optimizado y ultraeficiente para tareas simples y de alta frecuencia en las que la velocidad y el precio son la prioridad.

Modelos de Gemini en versión preliminar

vista previa Gemini 3.1 Flash Image Convierte ideas en recursos listos para producción. Ofrece edición conversacional, fusión de varias imágenes y coherencia de personajes para flujos de trabajo creativos avanzados.

vista previa Gemini 3.1 Pro Nuestro modelo más reciente, optimizado para el razonamiento, flujos de trabajo de agentes complejos y programación. Cuenta con pensamiento adaptativo, una ventana de contexto de 1 millón de tokens y fundamentación integrada para la resolución sofisticada de problemas multimodales.

vista previa Gemini 3 Flash Nuestro mejor modelo para la comprensión multimodal compleja, diseñado para abordar los problemas más desafiantes de los agentes con sólidas capacidades de programación y razonamiento de vanguardia.

vista previa Imagen de Gemini 3 Pro Generación de imágenes de alta fidelidad con composición mejorada por razonamiento. Admite la renderización de texto legible, la edición compleja de varios turnos y la coherencia de los personajes con hasta 14 entradas de referencia.

Modelos de Gemma

Gemma 4 Un modelo abierto adecuado para tareas como la generación de texto, la programación y el razonamiento, y que admite entrada multimodal (texto e imagen para todas las variantes, y audio adicionalmente para las variantes E2B y E4B).

Gemma 3n Un modelo abierto diseñado para una ejecución eficiente en dispositivos con pocos recursos, que admite entrada multimodal (texto, imagen, video y audio) y salida de texto en más de 140 idiomas.

Gemma 3 Un modelo abierto que incluye entrada de texto y de imágenes, compatibilidad con más de 140 idiomas y una ventana de contexto de 128 000.

Gemma 2 Un modelo abierto que admite la generación, el resumen y la extracción de texto.

Gemma Un modelo abierto pequeño y ligero que admite la generación, el resumen y la extracción de texto.

ShieldGemma 2 Modelos ajustados con instrucciones para evaluar la seguridad de texto e imágenes en función de políticas definidas.

PaliGemma Un modelo abierto de visión y lenguaje que combina SigLIP y Gemma.

CodeGemma Un modelo abierto potente y ligero para tareas de programación, como la finalización, la generación y la comprensión de código.

TxGemma Un modelo que genera predicciones, clasificaciones o texto basado en datos relacionados con la terapia para crear modelos de IA con menos datos y procesamiento.

MedGemma Colección de variantes de Gemma 3 entrenadas para el rendimiento en la comprensión de imágenes y textos médicos.

MedSigLIP Una variante de SigLIP entrenada para codificar imágenes y texto médicos en un espacio de embedding común.

T5Gemma Una familia de modelos de investigación ligeros de codificador-decodificador.

Modelos de embeddings

width_normal Incorporaciones de texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación y el agrupamiento en clústeres.

width_normal Incorporaciones multimodales Genera vectores basados en imágenes para tareas como la clasificación y la búsqueda de imágenes.

Modelos de Veo

película Generar con Veo 2 Genera videos a partir de instrucciones de texto e imágenes.

película Generar con Veo 3 Genera videos a partir de instrucciones de texto e imágenes con alta calidad.

movie Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

movie Veo 3.1 Generate Genera videos de alta calidad a partir de instrucciones de texto e imágenes.

movie Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

Obtén una vista previa de los modelos de Veo

película Vista previa de Veo 3.1 Lite Genera videos a partir de instrucciones de texto e imágenes con alta calidad y bajo costo.

movie Veo 3 Generate preview Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.

película Vista previa de Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

película Veo 3.1 Generar vista previa Genera videos de alta calidad a partir de instrucciones de texto e imágenes.

movie Vista previa de Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

película Versión preliminar de Veo 2 Genera videos a partir de instrucciones de texto e imágenes, y admite la edición con pintura y la edición con pintura fuera de la imagen.

Modelos experimentales de Veo

movie Veo 2 Experimental Un modelo experimental con funciones en prueba.

Modelos de Lyria

music_note_spark Lyria 3 Pro (Vista previa) Genera pistas musicales completas a partir de instrucciones de texto y de imágenes.

music_note_spark Lyria 3 Clip (Vista previa) Genera clips de audio de 30 s a partir de instrucciones de texto y de imágenes.

audio_spark Lyria 2 Genera música a partir de instrucciones de texto.

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

afrikáans (af), albanés (sq), amhárico (am), árabe (ar), armenio (hy), assamés (as), azerí (az), euskera (eu), bielorruso (be), bengalí (bn), bosnio (bs), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), croata (hr), checo (cs), danés (da), dhivehi (dv), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), krio (kri), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), marathi (mr), meiteilon (manipuri) (mni-Mtei), mongol (mn), birmano (my), nepalí (ne), noruego (no), nyanja (chichewa) (ny), oriya (or), pastún (ps), persa (fa), (pl), portugués (pt), panyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (gd), serbio (sr), sesotho (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uigur (ug), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo), y zulú (zu).

Gemma

Gemma y Gemma 2 solo admiten el idioma inglés (en). Gemma 3 y Gemma 3n ofrecen asistencia multilingüe en más de 140 idiomas.

Incorporaciones

Los modelos de embedding de texto multilingües admiten los siguientes idiomas:

afrikaans (af), albanés (sq), amhárico (am), árabe (ar), armenio (hy), azerí (az), euskera (eu), bielorruso (be), bengalí (bn), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), checo (cs), danés (da), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), marathi (mr), mongol (mn), birmano (my), nepalí (ne), nyanja (chichewa) (ny), noruego (no), pastún (ps), persa (fa), (pl), portugués (pt), panyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (gd), serbio (sr), sesotho (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo) y zulú (zu).

Explora todos los modelos en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA generativa que están disponibles en Gemini Enterprise Agent Platform, ve a Model Garden en la Google Cloud consola.

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de modelos, incluidos los modelos heredados y retirados, consulta Versiones de modelos y ciclo de vida.

¿Qué sigue?

Explora modelos previamente entrenados en Model Garden.
Obtén información para controlar el acceso a modelos específicos en Model Garden con una política de organización de Model Garden.
Más información sobre los precios.

Modelos de Google Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.