Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos de Google

Modelos de Gemini destacados

3.6 Flash

Mayor eficiencia y razonamiento práctico, lo que te ayuda a crear y realizar iteraciones con mayor facilidad

Mayor eficiencia de tokens
Generación de código más confiable
Razonamiento multimodal más sólido

3.5 Flash-Lite

Nuestra forma rápida y económica de potenciar tus aplicaciones cotidianas

Optimizado para tráfico de baja latencia y gran volumen
Organización eficiente de herramientas
Comprensión precisa de documentos

3.1 Flash Image

Convierte ideas en recursos listos para producción

Genera imágenes de alta calidad
Capacidad de edición conversacional por turnos
Capaz de fusionar varias imágenes y mantener la coherencia de los personajes para flujos de trabajo creativos avanzados

Modelos de Gemini disponibles de forma general

spark Gemini 3.6 Flash Optimizado para flujos de trabajo complejos de varios pasos, generación de código mejorada y razonamiento multimodal mejorado, todo con menos tokens.

performance_auto Gemini 3.5 Flash-Lite Crea flujos de trabajo de agentes ligeros a velocidades máximas y con un costo mínimo.

🍌 Imagen de Gemini 3.1 Flash-Lite (Nano Banana 2 Lite) Convierte ideas en recursos listos para producción. Diseñado para cargas de trabajo de gran volumen y sensibles a la latencia.

🍌 Gemini 3.1 Flash Image Convierte ideas en recursos listos para producción. Incluye edición conversacional, fusión de varias imágenes y coherencia de los personajes para flujos de trabajo creativos avanzados.

🍌 Imagen de Gemini 3 Pro Generación de imágenes de alta fidelidad con composición mejorada por razonamiento. Admite la renderización de texto legible, la edición conversacional continua compleja y la coherencia de los personajes con hasta 14 entradas de referencia.

spark Gemini 3.5 Flash Gemini 3.5 Flash ofrece una inteligencia casi de nivel Pro con el costo y la velocidad del nivel Flash: competencia en programación de nivel Pro, ejecución de agentes en paralelo, todo al mismo precio que un modelo Flash.

performance_auto Gemini 3.1 Flash-Lite Nuestro modelo más rentable, optimizado para casos de uso de baja latencia con un alto volumen de tráfico de LLM y que tiene en cuenta los costos.

diamond Gemini 2.5 Pro Nuestro modelo de alta capacidad para el razonamiento complejo y la programación. Cuenta con capacidades de pensamiento adaptativo para resolver desafíos complejos de agentes y multimodales con un contexto de 1 millón de tokens.

estrella Gemini 2.5 Flash Es ultrarrápido y muy capaz. Ofrece un equilibrio entre inteligencia y latencia con presupuestos de pensamiento controlables para aplicaciones versátiles.

🍌 Gemini 2.5 Flash Image Convierte ideas en recursos listos para producción. Incluye edición conversacional, fusión de varias imágenes y coherencia de los personajes para flujos de trabajo creativos avanzados.

performance_auto Gemini 2.5 Flash-Lite Creado para una escala masiva. Equilibra el costo y el rendimiento para las tareas de alto rendimiento, y se optimiza para la eficiencia sin sacrificar la comprensión multimodal.

audio_spark Gemini 2.5 Flash con la API de Gemini Live Diseñado para la transmisión bidireccional en tiempo real. Cuenta con audio integrado de baja latencia y capacidades de diálogo afectivo para interacciones naturales y conversacionales.

Vista previa de los modelos de Gemini

vista previa Gemini Omni Flash Genera videos a partir de texto o recursos de referencia, o edita videos existentes.

vista previa Gemini 3 Flash Nuestro mejor modelo para la comprensión multimodal compleja, diseñado para abordar los problemas más desafiantes de los agentes con sólidas capacidades de programación y razonamiento de estado del arte.

vista previa Gemini 3 Pro Image Generación de imágenes de alta fidelidad con composición mejorada por razonamiento. Admite la renderización de texto legible, la edición conversacional continua compleja y la coherencia de los personajes con hasta 14 entradas de referencia.

Modelos de Gemma

Gemma 4 Un modelo abierto adecuado para tareas como la generación de texto, la programación y el razonamiento, y que admite entradas multimodales (texto e imagen para todas las variantes, y audio adicionalmente para las variantes E2B y E4B).

Gemma 3n Un modelo abierto diseñado para una ejecución eficiente en dispositivos con pocos recursos, que admite entrada multimodal (texto, imagen, video y audio) y salida de texto en más de 140 idiomas.

Gemma 3 Un modelo abierto que incluye entrada de texto y de imágenes, compatibilidad con más de 140 idiomas y una ventana de contexto de 128 000.

Gemma 2 Un modelo abierto que admite la generación, el resumen y la extracción de texto.

Gemma Un modelo abierto pequeño y ligero que admite la generación, el resumen y la extracción de texto.

ShieldGemma 2 Modelos ajustados con instrucciones para evaluar la seguridad de texto e imágenes en función de políticas definidas.

PaliGemma Un modelo abierto de visión y lenguaje que combina SigLIP y Gemma.

CodeGemma Un modelo abierto potente y ligero para tareas de programación, como la finalización, la generación y la comprensión de código.

TxGemma Un modelo que genera predicciones, clasificaciones o texto basado en datos relacionados con la terapia para crear modelos de IA con menos datos y procesamiento.

MedGemma Una colección de variantes de Gemma 3 entrenadas para el rendimiento en la comprensión de imágenes y textos médicos.

MedSigLIP Una variante de SigLIP entrenada para codificar imágenes y texto médicos en un espacio de embedding común.

T5Gemma Una familia de modelos de investigación ligeros de codificador-decodificador.

Modelos de embeddings

width_normal Incorporaciones de texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación y el agrupamiento en clústeres.

width_normal Incorporaciones multimodales Genera vectores basados en imágenes para tareas como la clasificación y la búsqueda de imágenes.

Modelos de Veo

película Generar con Veo 2 Genera videos a partir de instrucciones de texto e imágenes.

movie Veo 3 Generate Genera videos a partir de instrucciones de texto e imágenes con alta calidad.

película Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

movie Veo 3.1 Generate Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.

película Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

Obtén una vista previa de los modelos de Veo

película Vista previa de Veo 3.1 Lite Genera videos a partir de instrucciones de texto e imágenes con alta calidad y bajo costo.

Modelos de Lyria

music_note_spark Lyria 3 Pro (Vista previa) Genera pistas musicales completas a partir de instrucciones de texto y de imágenes.

music_note_spark Lyria 3 Clip (Vista previa) Genera clips de audio de 30 s a partir de instrucciones de texto y de imágenes.

audio_spark Lyria 2 Genera música a partir de instrucciones de texto.

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

Afrikaans (af), Albanés (sq), Amhárico (am), Árabe (ar), Armenio (hy), Asamés (as), Azerbaiyano (az), Euskera (eu), Bielorruso (be), Bengalí (bn), Bosnio (bs), Búlgaro (bg), Catalán (ca), Cebuano (ceb), Chino (simplificado y tradicional) (zh), Corso (co), Croata (hr), Checo (cs), Danés (da), Dhivehi (dv), Neerlandés (nl), Inglés (en), Esperanto (eo), Estonio (et), Filipino (tagalo) (fil), Finlandés (fi), Francés (fr), Frisón (fy), Gallego (gl), Georgiano (ka), Alemán (de), Griego (el), Guyaratí (gu), Criollo haitiano (ht), Hausa (ha), Hawaiano (haw), Hebreo (iw), Hindi (hi), Hmong (hmn), Húngaro (hu), Islandés (is), Igbo (ig), Indonesio (id), Irlandés (ga), Italiano (it), Japonés (ja), Javanés (jv), Kannada (kn), Kazajo (kk), Jemer (km), Coreano (ko), Krio (kri), Kurdo (ku), Kirguís (ky), Laosiano (lo), Latín (la), Letón (lv), Lituano (lt), Luxemburgués (lb), Macedonio (mk), Malgache (mg), Malayo (ms), Malayalam (ml), Maltés (mt), Maorí (mi), Maratí (mr), Meiteilon (manipuri) (mni-Mtei), Mongol (mn), Birmano (my), Nepalí (ne), Noruego (no), Nyanja (chichewa) (ny), Odia (oriya) (or), Pastún (ps), Persa (fa), (pl), Portugués (pt), Panyabí (pa), Rumano (ro), Ruso (ru), Samoano (sm), Gaélico escocés (gd), Serbio (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalés (si), Eslovaco (sk), Esloveno (sl), Somalí (so), Español (es), Sundanés (su), Suajili (sw), Sueco (sv), Tayiko (tg), Tamil (ta), Telugu (te), Tailandés (th), Turco (tr), Ucraniano (uk), Urdu (ur), Uigur (ug), Uzbeko (uz), Vietnamita (vi), Galés (cy), Xhosa (xh), Yidis (yi), Yoruba (yo), y Zulú (zu).

Gemma

Gemma y Gemma 2 solo admiten el idioma inglés (en). Gemma 3 y Gemma 3n proporcionan asistencia multilingüe en más de 140 idiomas.

Incorporaciones

Los modelos de embedding de texto multilingües admiten los siguientes idiomas:

Afrikaans (af), albanés (sq), amárico (am), árabe (ar), armenio (hy), azerí (az), euskera (eu), bielorruso (be), bengalí (bn), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), checo (cs), danés (da), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), kurdo (ku), kirguís (ky), lao (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), maratí (mr), mongol (mn), birmano (my), nepalí (ne), nyanja (chichewa) (ny), noruego (no), pastún (ps), persa (fa), (pl), portugués (pt), panyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (gd), serbio (sr), sesotho (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo) y zulú (zu).

Explora todos los modelos en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA generativa que están disponibles en Gemini Enterprise Agent Platform, ve a Model Garden en la Google Cloud consola.

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de modelos, incluidos los modelos heredados y retirados, consulta Versiones de modelos y ciclo de vida.

Modelos de Google Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.