Modelos de Google

Modelos de Gemini destacados

3 Pro

Diseñado para una comprensión multimodal integral y la resolución de problemas complejos

Cuenta con una ventana de contexto de 1 millón de tokens
Se destaca en flujos de trabajo con agentes y tareas de programación autónomas
Diseñado para tareas multimodales complejas y razonamiento avanzado

3 Flash

Nuestro modelo de agente y programación más potente, con las mejores capacidades de comprensión multimodal

El modelo más reciente de nuestra línea de modelos de Gemini
Capacidades mejoradas de multimodalidad y programación
Incluye nuestra nueva opción de nivel de pensamiento casi nulo

2.5 Flash Image

Inicia tu flujo de trabajo creativo con la generación de imágenes y la edición conversacional

Genera imágenes de alta calidad
Capacidad de edición conversacional por turnos
El mismo equilibrio entre velocidad y precio que Gemini 2.5 Flash

Modelos de Gemini disponibles de forma general

diamond Gemini 2.5 Pro Nuestro modelo de alta capacidad para el razonamiento y la programación complejos. Cuenta con capacidades de pensamiento adaptativo para resolver desafíos complejos de agentes y multimodales con un contexto de 1 millón de tokens.

spark Gemini 2.5 Flash Es ultrarrápido y muy capaz. Ofrece un equilibrio entre inteligencia y latencia con presupuestos de procesamiento controlables para aplicaciones versátiles.

🍌 Gemini 2.5 Flash Image Convierte ideas en recursos listos para producción. Ofrece edición conversacional, fusión de varias imágenes y coherencia de los personajes para flujos de trabajo creativos avanzados.

performance_auto Gemini 2.5 Flash-Lite Creado para una escala masiva. Equilibra el costo y el rendimiento para las tareas de alta capacidad de procesamiento, y se optimiza para la eficiencia sin sacrificar la comprensión multimodal.

audio_spark Gemini 2.5 Flash con la API de Gemini Live Diseñado para la transmisión bidireccional en tiempo real. Cuenta con audio integrado de baja latencia y capacidades de diálogo afectivo para interacciones naturales y conversacionales.

spark Gemini 2.0 Flash Rendimiento multimodal para desarrolladores que necesitan un modelo rentable para tareas de uso general.

performance_auto Gemini 2.0 Flash-Lite Optimizado y muy eficiente para tareas simples y de alta frecuencia en las que la velocidad y el precio son la prioridad.

Modelos de Gemini en versión preliminar

versión preliminar Gemini 3 Pro Nuestro modelo más reciente centrado en el razonamiento y optimizado para flujos de trabajo complejos de agentes y programación. Cuenta con pensamiento adaptativo, una ventana de contexto de 1 millón de tokens y fundamentación integrada para la resolución de problemas multimodales sofisticados.

vista previa Gemini 3 Flash Nuestro mejor modelo para la comprensión multimodal compleja, diseñado para abordar los problemas más desafiantes de los agentes con sólidas capacidades de programación y razonamiento de vanguardia.

vista previa Imagen de Gemini 3 Pro Generación de imágenes de alta fidelidad con composición mejorada por razonamiento. Admite la renderización de texto legible, la edición compleja de varios turnos y la coherencia de los personajes con hasta 14 entradas de referencia.

Modelos de Gemma

Gemma 3n Un modelo abierto diseñado para ejecutarse de manera eficiente en dispositivos con pocos recursos, que admite entrada multimodal (texto, imagen, video y audio) y salida de texto en más de 140 idiomas.

Gemma 3 Un modelo abierto que incluye entrada de texto y de imágenes, compatibilidad con más de 140 idiomas y una ventana de contexto de 128 000.

Gemma 2 Un modelo abierto que admite la generación, el resumen y la extracción de texto.

Gemma Un modelo abierto pequeño y liviano que admite la generación, el resumen y la extracción de texto.

ShieldGemma 2 Modelos ajustados con instrucciones para evaluar la seguridad de texto y de imágenes en función de políticas definidas.

PaliGemma Un modelo abierto de lenguaje visual que combina SigLIP y Gemma.

CodeGemma Un modelo abierto potente y ligero para tareas de programación, como la finalización, la generación y la comprensión de código.

TxGemma Es un modelo que genera predicciones, clasificaciones o texto basado en datos relacionados con la terapia para crear modelos de IA con menos datos y capacidad de procesamiento.

MedGemma Colección de variantes de Gemma 3 entrenadas para el rendimiento en la comprensión de imágenes y textos médicos.

MedSigLIP Una variante de SigLIP entrenada para codificar imágenes y texto médicos en un espacio de incorporación común.

T5Gemma Una familia de modelos de investigación ligeros de codificador-decodificador.

Modelos de embeddings

width_normal Incorporaciones de texto Convierte datos de texto en representaciones vectoriales para la búsqueda semántica, la clasificación y el agrupamiento en clústeres.

width_normal Incorporaciones multimodales Genera vectores basados en imágenes para tareas como la clasificación y la búsqueda de imágenes.

Modelos de Imagen

photo_spark Imagen 4 para la generación Usa instrucciones de texto para generar imágenes novedosas con mayor calidad que nuestros modelos anteriores de generación de imágenes

photo_spark Imagen 4 para la generación rápida Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y menor latencia que nuestros modelos anteriores de generación de imágenes

photo_spark Imagen 4 para la generación ultra Usa instrucciones de texto para generar imágenes novedosas con mayor calidad y mejor cumplimiento de las instrucciones que nuestros modelos anteriores de generación de imágenes

photo_spark Imagen 3 para la generación 002 Usa instrucciones de texto para generar imágenes novedosas

photo_spark Imagen 3 para la generación 001 Usa instrucciones de texto para generar imágenes novedosas

photo_spark Imagen 3 para la generación rápida Usa instrucciones de texto para generar imágenes novedosas con menor latencia que nuestros otros modelos de generación de imágenes

image_edit_auto Imagen 3 para la edición y la personalización Edita imágenes existentes o genera imágenes nuevas según las instrucciones de texto y el contexto proporcionado.

photo_spark Prueba virtual Genera imágenes de personas que usan productos de indumentaria.

Vista previa de los modelos de Imagen

image_edit_auto Recontextualización de productos de Imagen en Vertex AI Edita imágenes de productos para colocarlos en diferentes escenas o fondos según instrucciones de texto.

Modelos de Veo

película Generar con Veo 2 Genera videos a partir de instrucciones de texto e imágenes.

movie Veo 3 Generate Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.

movie Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

movie Veo 3.1 Generate Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.

movie Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

Obtén una vista previa de los modelos de Veo

película Vista previa de la generación de Veo 3 Genera videos a partir de instrucciones de texto e imágenes con alta calidad.

película Vista previa de Veo 3 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

movie Veo 3.1 Generate preview Genera videos a partir de instrucciones de texto y de imágenes con alta calidad.

movie Vista previa de Veo 3.1 Fast Genera videos a partir de instrucciones de texto e imágenes con alta calidad y baja latencia.

película Versión preliminar de Veo 2 Genera videos a partir de instrucciones de texto e imágenes, y admite la edición con pintura y la edición con expansión.

Modelos experimentales de Veo

movie Veo 2 Experimental Un modelo experimental con funciones en prueba.

Modelos de MedLM

medical_information MedLM-medium Un modelo que cumple con la HIPAA para responder preguntas médicas y resumir documentos de atención médica.

clinical_notes MedLM-large-large Modelo que cumple con la HIPAA para responder preguntas médicas y resumir documentos de atención médica.

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

Afrikaans (af), Albanés (sq), Amhárico (am), Árabe (ar), Armenio (hy), Asamés (as), Azerbaiyano (az), Euskera (eu), Bielorruso (be), Bengalí (bn), Bosnio (bs), Búlgaro (bg), Catalán (ca), Cebuano (ceb), Chino (simplificado y tradicional) (zh), Corso (co), Croata (hr), Checo (cs), Danés (da), Dhivehi (dv), Neerlandés (nl), Inglés (en), Esperanto (eo), Estonio (et), Filipino (tagalo) (fil), Finlandés (fi), Francés (fr), Frisón (fy), Gallego (gl), Georgiano (ka), Alemán (de), Griego (el), Gujarati (gu), Criollo haitiano (ht), Hausa (ha), Hawaiano (haw), Hebreo (iw), Hindi (hi), Hmong (hmn), Húngaro (hu), Islandés (is), Igbo (ig), Indonesio (id), Irlandés (ga), Italiano (it), Japonés (ja), Javanés (jv), Kannada (kn), Kazajo (kk), Khmer (km), Coreano (ko), Krio (kri), Kurdo (ku), Kirguís (ky), Lao (lo), Latín (la), Letón (lv), Lituano (lt), Luxemburgués (lb), Macedonio (mk), Malgache (mg), Malayo (ms), Malayalam (ml), Maltés (mt), Maorí (mi), Maratí (mr), Meiteilon (manipuri) (mni-Mtei), Mongol (mn), Birmano (my), Nepalí (ne), Noruego (no), Nyanja (chichewa) (ny), Odia (oriya) (or), Pastún (ps), Persa (fa), (pl), Portugués (pt), Panyabí (pa), Rumano (ro), Ruso (ru), Samoano (sm), Gaélico escocés (gd), Serbio (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalés (si), Eslovaco (sk), Esloveno (sl), Somalí (so), Español (es), Sundanés (su), Suajili (sw), Sueco (sv), Tayiko (tg), Tamil (ta), Telugu (te), Tailandés (th), Turco (tr), Ucraniano (uk), Urdu (ur), Uigur (ug), Uzbeko (uz), Vietnamita (vi), Galés (cy), Xhosa (xh), Yidis (yi), Yoruba (yo), y Zulú (zu).

Gemma

Gemma y Gemma 2 solo admiten el idioma inglés (en). Gemma 3 y Gemma 3n ofrecen asistencia multilingüe en más de 140 idiomas.

Incorporaciones

Los modelos de incorporación de texto multilingües admiten los siguientes idiomas:

Afrikaans (af), Albanés (sq), Amhárico (am), Árabe (ar), Armenio (hy), Azerbaiyano (az), Euskera (eu), Bielorruso (be), Bengalí (bn), Búlgaro (bg), Catalán (ca), Cebuano (ceb), Chino (simplificado y tradicional) (zh), Corso (co), Checo (cs), Danés (da), Neerlandés (nl), Inglés (en), Esperanto (eo), Estonio (et), Filipino (tagalo) (fil), Finlandés (fi), Francés (fr), Frisón (fy), Gallego (gl), Georgiano (ka), Alemán (de), Griego (el), Gujarati (gu), Criollo haitiano (ht), Hausa (ha), Hawaiano (haw), Hebreo (iw), Hindi (hi), Hmong (hmn), Húngaro (hu), Islandés (is), Igbo (ig), Indonesio (id), Irlandés (ga), Italiano (it), Japonés (ja), Javanés (jv), Kannada (kn), Kazajo (kk), Jemer (km), Coreano (ko), Kurdo (ku), Kirguís (ky), Laosiano (lo), Latín (la), Letón (lv), Lituano (lt), Luxemburgués (lb), Macedonio (mk), Malgache (mg), Malayo (ms), Malayalam (ml), Maltés (mt), Maorí (mi), Maratí (mr), Mongol (mn), Birmano (my), Nepalí (ne), Nyanja (chichewa) (ny), Noruego (no), Pastún (ps), Persa (fa), (pl), Portugués (pt), Panyabí (pa), Rumano (ro), Ruso (ru), Samoano (sm), Gaélico escocés (gd), Serbio (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalés (si), Eslovaco (sk), Esloveno (sl), Somalí (so), Español (es), Sundanés (su), Suajili (sw), Sueco (sv), Tayiko (tg), Tamil (ta), Telugu (te), Tailandés (th), Turco (tr), Ucraniano (uk), Urdu (ur), Uzbeko (uz), Vietnamita (vi), Galés (cy), Xhosa (xh), Yidis (yi), Yoruba (yo), y Zulú (zu).

Imagen 3

Imagen 3 admite los siguientes idiomas:

Inglés (en), chino (simplificado y tradicional) (zh), hindi (hi), japonés (ja), coreano (ko), portugués (pt) y español (es).

MedLM

El modelo MedLM admite el idioma inglés (en).

Explora todos los modelos en Model Garden

Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar modelos de la propiedad de Google y elegir modelos y recursos de OSS. Para explorar los modelos y las APIs de IA generativa que están disponibles en Vertex AI, ve a Model Garden en la consola de Google Cloud .

Ir a Model Garden

Para obtener más información sobre Model Garden, incluidos los modelos y las funciones disponibles, consulta Explora los modelos de IA en Model Garden.

Versiones del modelo

Para ver todas las versiones de modelos, incluidos los modelos heredados y los retirados, consulta Versiones de modelos y ciclo de vida.

¿Qué sigue?

Prueba un instructivo de guía de inicio rápido con Vertex AI Studio o la API de Vertex AI.
Explora modelos previamente entrenados en Model Garden.
Obtén información para controlar el acceso a modelos específicos en Model Garden con una política de organización de Model Garden.
Más información sobre los precios.