Modelos de Google

Modelos de Gemini destacados

Modelos de Gemini disponibles de forma general

diamond Gemini 2.5 Pro Nuestro modelo de alta capacidad para el razonamiento y la programación complejos. Cuenta con capacidades de pensamiento adaptativo para resolver desafíos complejos de agentes y multimodales con un contexto de 1 millón de tokens.
spark Gemini 2.5 Flash Es ultrarrápido y muy capaz. Ofrece un equilibrio entre inteligencia y latencia con presupuestos de pensamiento controlables para aplicaciones versátiles.
🍌 Gemini 2.5 Flash Image Convierte ideas en recursos listos para la producción. Ofrece edición conversacional, fusión de varias imágenes y coherencia de los personajes para flujos de trabajo creativos avanzados.
performance_auto Gemini 2.5 Flash-Lite Creado para una escala masiva. Equilibra el costo y el rendimiento para las tareas de alta capacidad de procesamiento, y se optimiza para la eficiencia sin sacrificar la comprensión multimodal.
spark Gemini 2.0 Flash Rendimiento multimodal para desarrolladores que necesitan un modelo rentable para tareas de uso general.
performance_auto Gemini 2.0 Flash-Lite Optimizado y ultraeficiente para tareas simples y de alta frecuencia en las que la velocidad y el precio son la prioridad.

Vista previa de los modelos de Gemini

versión preliminar Gemini 3 Pro Nuestro modelo más reciente centrado en el razonamiento y optimizado para flujos de trabajo complejos basados en agentes y programación. Cuenta con pensamiento adaptativo, una ventana de contexto de 1 millón de tokens y fundamentación integrada para la resolución de problemas multimodales sofisticada.
preview Imagen 3 Pro Image Generación de imágenes de alta fidelidad con composición mejorada por razonamiento. Admite la renderización de texto legible, la edición compleja de varios turnos y la coherencia de los personajes con hasta 14 entradas de referencia.
preview API de Gemini 2.5 Flash Live Diseñada para la transmisión bidireccional en tiempo real. Cuenta con audio integrado de baja latencia y capacidades de diálogo afectivo para interacciones naturales y conversacionales.

Modelos de Gemma

Gemma 3n Un modelo abierto diseñado para ejecutarse de manera eficiente en dispositivos con pocos recursos, que admite entrada multimodal (texto, imagen, video y audio) y salida de texto en más de 140 idiomas.
Gemma 3 Un modelo abierto que incluye entrada de texto y de imágenes, compatibilidad con más de 140 idiomas y una ventana de contexto de 128 000.
Gemma 2 Un modelo abierto que admite la generación, el resumen y la extracción de texto.
Gemma Un modelo abierto pequeño y liviano que admite la generación, el resumen y la extracción de texto.
ShieldGemma 2 Modelos ajustados con instrucciones para evaluar la seguridad de texto y de imágenes en función de políticas definidas.
PaliGemma Un modelo abierto de lenguaje visual que combina SigLIP y Gemma.
CodeGemma Un modelo abierto potente y ligero para tareas de programación, como la finalización, la generación y la comprensión de código.
TxGemma Es un modelo que genera predicciones, clasificaciones o texto basado en datos relacionados con la terapia para crear modelos de IA con menos datos y capacidad de procesamiento.
MedGemma Una colección de variantes de Gemma 3 entrenadas para el rendimiento en la comprensión de imágenes y textos médicos.
MedSigLIP Una variante de SigLIP entrenada para codificar imágenes y texto médicos en un espacio de incorporación común.
T5Gemma Una familia de modelos de investigación ligeros de codificador-decodificador.

Modelos de embeddings

width_normal Incorporaciones de texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación y el agrupamiento en clústeres.
width_normal Incorporaciones multimodales Genera vectores basados en imágenes para tareas como la clasificación y la búsqueda de imágenes.

Modelos de Imagen

photo_spark Imagen 4 para la generación Usa instrucciones de texto para generar imágenes novedosas con mayor calidad que nuestros modelos anteriores de generación de imágenes
photo_spark Imagen 4 para la generación rápida Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y menor latencia que nuestros modelos anteriores de generación de imágenes
photo_spark Imagen 4 para la generación ultra Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y mejor cumplimiento de las instrucciones que nuestros modelos anteriores de generación de imágenes
photo_spark Imagen 3 para la generación 002 Usa instrucciones de texto para generar imágenes novedosas
photo_spark Imagen 3 para la generación 001 Usa instrucciones de texto para generar imágenes novedosas
photo_spark Imagen 3 para la generación rápida Usa instrucciones de texto para generar imágenes novedosas con menor latencia que nuestros otros modelos de generación de imágenes
image_edit_auto Imagen 3 para la edición y la personalización Edita imágenes existentes o genera imágenes nuevas según las instrucciones de texto y el contexto proporcionado.

Vista previa de los modelos de Imagen

photo_spark Prueba virtual Genera imágenes de personas que visten productos de indumentaria.
image_edit_auto Imagen product recontext on Vertex AI Edita imágenes de productos para colocarlos en diferentes escenas o fondos según instrucciones de texto.

Modelos de Veo

película Generar con Veo 2 Genera videos a partir de instrucciones de texto e imágenes.
movie Veo 3 Generate Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.
movie Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.
movie Veo 3.1 Generate Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.
movie Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

Obtén una vista previa de los modelos de Veo

película Vista previa de la generación de Veo 3 Genera videos a partir de instrucciones de texto e imágenes con alta calidad.
película Vista previa de Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.
película Veo 3.1 Generar vista previa Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.
película Vista previa de Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.
película Versión preliminar de Veo 2 Genera videos a partir de instrucciones de texto e imágenes, y admite la edición con pintura y la edición con expansión.

Modelos experimentales de Veo

movie Veo 2 Experimental Un modelo experimental con funciones en prueba.

Modelos de MedLM

medical_information MedLM-medium Un modelo que cumple con la HIPAA para responder preguntas médicas y resumir documentos de atención médica.
clinical_notes MedLM-large-large Modelo que cumple con la HIPAA para responder preguntas médicas y resumir documentos de atención médica.

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

Afrikaans (af), Albanés (sq), Amhárico (am), Árabe (ar), Armenio (hy), Asamés (as), Azerbaiyano (az), Euskera (eu), Bielorruso (be), Bengalí (bn), Bosnio (bs), Búlgaro (bg), Catalán (ca), Cebuano (ceb), Chino (simplificado y tradicional) (zh), Corso (co), Croata (hr), Checo (cs), Danés (da), Dhivehi (dv), Neerlandés (nl), Inglés (en), Esperanto (eo), Estonio (et), Filipino (tagalo) (fil), Finlandés (fi), Francés (fr), Frisón (fy), Gallego (gl), Georgiano (ka), Alemán (de), Griego (el), Gujarati (gu), Criollo haitiano (ht), Hausa (ha), Hawaiano (haw), Hebreo (iw), Hindi (hi), Hmong (hmn), Húngaro (hu), Islandés (is), Igbo (ig), Indonesio (id), Irlandés (ga), Italiano (it), Japonés (ja), Javanés (jv), Kannada (kn), Kazajo (kk), Khmer (km), Coreano (ko), Krio (kri), Kurdo (ku), Kirguís (ky), Lao (lo), Latín (la), Letón (lv), Lituano (lt), Luxemburgués (lb), Macedonio (mk), Malgache (mg), Malayo (ms), Malayalam (ml), Maltés (mt), Maorí (mi), Maratí (mr), Meiteilon (manipuri) (mni-Mtei), Mongol (mn), Birmano (my), Nepalí (ne), Noruego (no), Nyanja (chichewa) (ny), Odia (oriya) (or), Pastún (ps), Persa (fa), (pl), Portugués (pt), Panyabí (pa), Rumano (ro), Ruso (ru), Samoano (sm), Gaélico escocés (gd), Serbio (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalés (si), Eslovaco (sk), Esloveno (sl), Somalí (so), Español (es), Sundanés (su), Suajili (sw), Sueco (sv), Tayiko (tg), Tamil (ta), Telugu (te), Tailandés (th), Turco (tr), Ucraniano (uk), Urdu (ur), Uigur (ug), Uzbeko (uz), Vietnamita (vi), Galés (cy), Xhosa (xh), Yidis (yi), Yoruba (yo), y Zulú (zu).

Gemma

Gemma y Gemma 2 solo admiten el idioma inglés (en). Gemma 3 y Gemma 3n ofrecen asistencia multilingüe en más de 140 idiomas.

Incorporaciones

Los modelos de incorporación de texto multilingües admiten los siguientes idiomas:

afrikaans (af), albanés (sq), amhárico (am), árabe (ar), armenio (hy), azerí (az), euskera (eu), bielorruso (be), bengalí (bn), búlgaro (bg), catalán (ca), cebuano (ceb), chino (simplificado y tradicional) (zh), corso (co), checo (cs), danés (da), neerlandés (nl), inglés (en), esperanto (eo), estonio (et), filipino (tagalo) (fil), finés (fi), francés (fr), frisón (fy), gallego (gl), georgiano (ka), alemán (de), griego (el), guyaratí (gu), criollo haitiano (ht), hausa (ha), hawaiano (haw), hebreo (iw), hindi (hi), hmong (hmn), húngaro (hu), islandés (is), igbo (ig), indonesio (id), irlandés (ga), italiano (it), japonés (ja), javanés (jv), canarés (kn), kazajo (kk), jemer (km), coreano (ko), kurdo (ku), kirguís (ky), laosiano (lo), latín (la), letón (lv), lituano (lt), luxemburgués (lb), macedonio (mk), malgache (mg), malayo (ms), malayalam (ml), maltés (mt), maorí (mi), marathi (mr), mongol (mn), birmano (my), nepalí (ne), nyanja (chichewa) (ny), noruego (no), pastún (ps), persa (fa), (pl), portugués (pt), panyabí (pa), rumano (ro), ruso (ru), samoano (sm), gaélico escocés (gd), serbio (sr), sesotho (st), shona (sn), sindhi (sd), cingalés (si), eslovaco (sk), esloveno (sl), somalí (so), español (es), sundanés (su), suajili (sw), sueco (sv), tayiko (tg), tamil (ta), telugu (te), tailandés (th), turco (tr), ucraniano (uk), urdu (ur), uzbeko (uz), vietnamita (vi), galés (cy), xhosa (xh), yidis (yi), yoruba (yo) y zulú (zu).

Imagen 3

Imagen 3 admite los siguientes idiomas:

Inglés (en), chino (simplificado y tradicional) (zh), hindi (hi), japonés (ja), coreano (ko), portugués (pt) y español (es).

MedLM

El modelo MedLM admite el idioma inglés (en).

Explora todos los modelos en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA generativa que están disponibles en Vertex AI, ve a Model Garden en la consola de Google Cloud .

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de modelos, incluidos los modelos heredados y los retirados, consulta Versiones de modelos y ciclo de vida.

¿Qué sigue?