Google-Modelle

Ausgewählte Gemini-Modelle

Allgemein verfügbare Gemini-Modelle

diamond Gemini 2.5 Pro Unser leistungsstarkes Modell für komplexes logisches Denken und Programmieren. Mit adaptiven Denkfunktionen, um komplexe agentische und multimodale Herausforderungen mit einem Kontext von 1 Million Tokens zu lösen.
spark Gemini 2.5 Flash Blitzschnell und hochleistungsfähig. Bietet ein ausgewogenes Verhältnis von Intelligenz und Latenz mit steuerbaren Denkbudgets für vielseitige Anwendungen.
🍌 Gemini 2.5 Flash Image Ideen in produktionsfertige Assets umwandeln. Mit Bearbeitung per Prompt, Zusammenführen mehrerer Bilder und Zeichenkonsistenz für erweiterte kreative Workflows.
performance_auto Gemini 2.5 Flash-Lite Für den Einsatz in großem Maßstab entwickelt. Ausgewogenes Verhältnis von Kosten und Leistung für Aufgaben mit hohem Durchsatz, optimiert für Effizienz ohne Einbußen beim multimodalen Verständnis.
audio_spark Gemini 2.5 Flash mit Gemini Live API Entwickelt für bidirektionales Streaming in Echtzeit. Mit integrierten Audiofunktionen mit niedriger Latenz und affektiven Dialogfunktionen für natürliche, konversationelle Interaktionen.
spark Gemini 2.0 Flash Multimodale Leistung für Entwickler, die ein kostengünstiges Modell für allgemeine Aufgaben benötigen.
performance_auto Gemini 2.0 Flash-Lite Optimiert und äußerst effizient für einfache, häufige Aufgaben, bei denen Geschwindigkeit und Preis Priorität haben.

Gemini-Modelle (Vorabversion)

Vorschau Gemini 3.1 Flash-Lite Unser kostengünstigstes Modell, optimiert für Anwendungsfälle mit niedriger Latenz für hohen LLM-Traffic, bei dem die Kosten eine entscheidende Rolle spielen.
preview Gemini 3.1 Flash Image Ideen in produktionsfertige Assets umwandeln. Mit Bearbeitung per Prompt, Zusammenführen mehrerer Bilder und Zeichenkonsistenz für erweiterte kreative Workflows.
preview Gemini 3.1 Pro Unser neuestes Modell, bei dem das logische Denken im Vordergrund steht und das für komplexe agentische Workflows und Programmierung optimiert ist. Mit adaptivem Denken, einem Kontextfenster mit 1 Million Tokens und integrierter Grounding-Funktion für anspruchsvolle multimodale Problemlösung.
preview Gemini 3 Flash Unser bestes Modell für komplexes multimodales Verständnis, entwickelt für die anspruchsvollsten agentischen Probleme mit leistungsstarken Programmier- und modernsten logischen Denkfunktionen.
Vorschau Gemini 3 Pro Image Bildgenerierung in hoher Qualität mit durch logisches Denken verbesserter Komposition. Unterstützt gut lesbare Textwiedergabe, komplexe mehrstufige Bearbeitung und Zeichenkonsistenz mit bis zu 14 Referenzeingaben.

Gemma-Modelle

Gemma 3n Ein offenes Modell, das für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurde und multimodale Eingaben (Text, Bild, Video und Audio) sowie Textausgabe in über 140 Sprachen unterstützt.
Gemma 3 Ein offenes Modell mit Text- und Bildeingabe, Unterstützung für über 140 Sprachen und einem Kontextfenster mit 128.000 Tokens.
Gemma 2 Ein offenes Modell, das Textgenerierung, -zusammenfassung und -extraktion unterstützt.
Gemma Ein kleines, schlankes offenes Modell, das Textgenerierung, -zusammenfassung und -extraktion unterstützt.
ShieldGemma 2 Modelle, die auf Anweisungen abgestimmt sind, um die Sicherheit von Text und Bildern anhand definierter Richtlinien zu bewerten.
PaliGemma Ein offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert.
CodeGemma Ein leistungsstarkes, schlankes offenes Modell für Programmieraufgaben, einschließlich Codevervollständigung, -generierung und ‑verständnis.
TxGemma Ein Modell, das Vorhersagen, Klassifizierungen oder Text auf Grundlage von Daten im Zusammenhang mit Therapien generiert, um KI-Modelle mit weniger Daten und Rechenleistung zu erstellen.
MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Leistung bei der Verarbeitung von medizinischen Texten und Bildern trainiert wurden.
MedSigLIP Eine SigLIP-Variante, die trainiert wurde, um medizinische Bilder und Texte in einen gemeinsamen Einbettungsraum zu codieren.
T5Gemma Eine Familie von schlanken Encoder-Decoder-Modellen für die Forschung.

Einbettungsmodelle

width_normal Einbettungen für Text Wandelt Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung und Clustering um.
width_normal Multimodale Einbettungen Generiert Vektoren auf Grundlage von Bildern für Aufgaben wie Bildklassifizierung und ‑suche.

Imagen-Modelle

photo_spark Imagen 4 für die Generierung Mit Text-Prompts neue Bilder erstellen in höherer Qualität als mit unseren bisherigen Bildgenerierungsmodellen
photo_spark Imagen 4 für die schnelle Generierung Mit Text-Prompts neue Bilder erstellen in höherer Qualität und mit geringerer Latenz als mit unseren bisherigen Bildgenerierungs modellen
photo_spark Imagen 4 für die Ultra-Generierung Mit Text-Prompts neue Bilder erstellen in höherer Qualität und mit besserer Prompt-Einhaltung als mit unseren bisherigen Bild generierungsmodellen
photo_spark Imagen 3 für die Generierung 002 Mit Text-Prompts neue Bilder erstellen
photo_spark Imagen 3 für die Generierung 001 Mit Text-Prompts neue Bilder erstellen
photo_spark Imagen 3 für die schnelle Generierung Mit Text-Prompts neue Bilder erstellen mit geringerer Latenz als mit unseren anderen Bildgenerierungsmodellen
image_edit_auto Imagen 3 für die Bearbeitung und Anpassung Vorhandene Bilder bearbeiten oder neue Bilder auf Grundlage von Text-Prompts und bereitgestelltem Kontext erstellen.
photo_spark Virtuelles Anprobieren Bilder von Personen generieren, die Kleidung tragen.

Imagen-Modelle (Vorabversion)

image_edit_auto Imagen-Produktkontext in Vertex AI Produktbilder bearbeiten, um sie auf Grundlage von Text-Prompts in verschiedene Szenen oder Hintergründe zu platzieren.

Veo-Modelle

movie Veo 2 Generieren Videos aus Text-Prompts und Bildern generieren.
movie Veo 3 Generieren Videos aus Text-Prompts und Bildern in hoher Qualität generieren.
movie Veo 3 Schnell Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz generieren.
movie movie Veo 3.1 Generieren Videos aus Text-Prompts und Bildern in hoher Qualität generieren.
movie Veo 3.1 Fast Schnell Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz generieren.

Veo-Modelle (Vorabversion)

movie Veo 3 Generieren (Vorabversion) Videos aus Text-Prompts und Bildern in hoher Qualität generieren.
movie Veo 3 Schnell (Vorabversion) Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz generieren.
movie Veo 3.1 Generieren (Vorabversion) Videos aus Text-Prompts und Bildern in hoher Qualität generieren.
movie Veo 3.1 Schnell (Vorabversion) Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz generieren.
movie Veo 2 (Vorabversion) Videos aus Text-Prompts und Bildern generieren, wobei Inpainting und Outpainting unterstützt werden.

Experimentelle Veo-Modelle

movie Veo 2 (experimentell) Ein experimentelles Modell mit Funktionen, die getestet werden.

Lyria-Modelle

music_note_spark Lyria 3 Pro (Vorabversion) Musikstücke in voller Länge aus Text und Bild-Prompts generieren.
music_note_spark Lyria 3 Clip (Vorabversion) 30-Sekunden-Audioclips aus Text- und Bild-Prompts generieren.
audio_spark Lyria 2 Musik aus Text-Prompts generieren.

MedLM-Modelle

medical_information MedLM-medium Ein HIPAA-konformes Modell für die Beantwortung medizinischer Fragen und die Zusammenfassung von Gesundheitsdokumenten.
clinical_notes MedLM-large-large Ein HIPAA-konformes Modell für die Beantwortung medizinischer Fragen und die Zusammenfassung von Gesundheitsdokumenten.

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Malagasy (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmarisch (Burmesisch) (my), Nepali (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Uigurisch (ug), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo) und Zulu (zu).

Gemma

Gemma und Gemma 2 unterstützen nur die Sprache Englisch (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Modelle für mehrsprachige Texteinbettungen unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Malagasy (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Myanmarisch (Burmesisch) (my), Nepali (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo) und Zulu (zu).

Imagen 3

Imagen 3 unterstützt die folgenden Sprachen:

Englisch (en), Chinesisch (vereinfacht und traditionell) (zh), Hindi (hi), Japanisch (ja), Koreanisch (ko), Portugiesisch (pt) und Spanisch (es).

MedLM

Das MedLM-Modell unterstützt die Sprache Englisch (en).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in Vertex AI verfügbaren generativen KI-Modellen und APIs finden Sie in Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Alle Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Nächste Schritte