Google-Modelle

Ausgewählte Gemini-Modelle

Allgemein verfügbare Gemini-Modelle

🍌 Gemini 3.1 Flash Image Verwandeln Sie Ideen in produktionsreife Assets. Bietet Bildbearbeitung per Prompt, Zusammenführung mehrerer Bilder und Konsistenz von Charakteren für erweiterte kreative Workflows.
🍌 Gemini 3 Pro Image Bildgenerierung in hoher Qualität mit durch Schlussfolgerungen verbesserter Komposition. Unterstützt gut lesbare Textwiedergabe, komplexe mehrstufige Bearbeitung und Konsistenz von Charakteren mit bis zu 14 Referenzeingaben.
spark Gemini 3.5 Flash Gemini 3.5 Flash bietet Intelligenz nahezu auf Pro-Niveau zu Kosten und mit der Geschwindigkeit der Flash-Stufe: Programmierkenntnisse auf Pro-Niveau, parallele agentische Ausführung – alles zum gleichen Preis wie ein Flash-Modell.
performance_auto Gemini 3.1 Flash-Lite Unser kosteneffizientestes Modell, optimiert für Anwendungsfälle mit niedriger Latenz und umfangreichem, kostensensitivem LLM-Traffic.
diamond Gemini 2.5 Pro Unser leistungsstarkes Modell für komplexe Schlussfolgerungen und Programmierung. Bietet adaptive Denkfähigkeiten, um komplexe agentische und multimodale Herausforderungen mit einem Kontext von 1 Million Tokens zu lösen.
spark Gemini 2.5 Flash Blitzschnell und sehr leistungsfähig. Bietet ein ausgewogenes Verhältnis zwischen Intelligenz und Latenz mit steuerbaren Denkbudgets für vielseitige Anwendungen.
🍌 Gemini 2.5 Flash Image Verwandeln Sie Ideen in produktionsreife Assets. Bietet Bildbearbeitung per Prompt, Zusammenführung mehrerer Bilder und Konsistenz von Charakteren für erweiterte kreative Workflows.
performance_auto Gemini 2.5 Flash-Lite Entwickelt für den Einsatz in großem Maßstab. Bietet ein ausgewogenes Verhältnis zwischen Kosten und Leistung für Aufgaben mit hohem Durchsatz, optimiert für Effizienz ohne Einbußen beim multimodalen Verständnis.
audio_spark Gemini 2.5 Flash mit Gemini Live API Entwickelt für bidirektionales Streaming in Echtzeit. Bietet integrierte Audiofunktionen mit niedriger Latenz und affektive Dialogfunktionen für natürliche, dialogbasierte Interaktionen.

Gemini-Modelle in der Vorabversion

preview Gemini 3.1 Flash Image Verwandeln Sie Ideen in produktionsreife Assets. Bietet Bildbearbeitung per Prompt, Zusammenführung mehrerer Bilder und Konsistenz von Charakteren für erweiterte kreative Workflows.
preview Gemini 3.1 Pro Unser neuestes Modell, das auf Schlussfolgerungen ausgerichtet ist und für komplexe agentische Workflows und Programmierung optimiert wurde. Bietet adaptives Denken, ein Kontextfenster mit 1 Million Tokens und integrierte Grounding-Funktionen für anspruchsvolle multimodale Problemlösungen.
preview Gemini 3 Flash Unser bestes Modell für komplexes multimodales Verständnis, entwickelt für die Bewältigung der anspruchsvollsten agentischen Probleme mit starken Programmier- und modernsten Schlussfolgerungsfähigkeiten.
preview Gemini 3 Pro Image Bildgenerierung in hoher Qualität mit durch Schlussfolgerungen verbesserter Komposition. Unterstützt gut lesbare Textwiedergabe, komplexe mehrstufige Bearbeitung und Konsistenz von Charakteren mit bis zu 14 Referenzeingaben.

Gemma-Modelle

Gemma 4 Ein offenes Modell, das sich gut für Aufgaben wie Textgenerierung, Programmierung und Schlussfolgerungen eignet und multimodale Eingaben unterstützt (Text und Bild für alle Varianten sowie zusätzlich Audio für die Varianten E2B und E4B).
Gemma 3n Ein offenes Modell, das für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurde und multimodale Eingaben (Text, Bild, Video und Audio) sowie Textausgabe in über 140 Sprachen unterstützt.
Gemma 3 Ein offenes Modell mit Text- und Bildeingabe, Unterstützung für über 140 Sprachen und einem Kontextfenster mit 128.000 Tokens.
Gemma 2 Ein offenes Modell, das Textgenerierung, -zusammenfassung und -extraktion unterstützt.
Gemma Ein kleines, schlankes offenes Modell, das Textgenerierung, -zusammenfassung und -extraktion unterstützt.
ShieldGemma 2 Auf Anweisungen abgestimmte Modelle zur Bewertung der Text- und Bildsicherheit anhand definierter Richtlinien.
PaliGemma Ein offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert.
CodeGemma Ein leistungsstarkes, schlankes offenes Modell für Programmieraufgaben, einschließlich Codevervollständigung, -generierung und ‑verständnis.
TxGemma Ein Modell, das Vorhersagen, Klassifizierungen oder Text auf der Grundlage von Daten im Zusammenhang mit Therapien generiert, um KI-Modelle mit weniger Daten und Rechenleistung zu erstellen.
MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Leistung bei der Verarbeitung von medizinischen Texten und Bildern trainiert wurden.
MedSigLIP Eine SigLIP-Variante, die trainiert wurde, um medizinische Bilder und Texte in einen gemeinsamen Einbettungsraum zu codieren.
T5Gemma Eine Familie von schlanken Encoder-Decoder-Modellen für die Forschung.

Einbettungsmodelle

width_normal Einbettungen für Text Wandelt Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung und Clustering um.
width_normal Multimodale Einbettungen Generiert Vektoren auf der Grundlage von Bildern für Aufgaben wie Bildklassifizierung und ‑suche.

Veo-Modelle

movie Veo 2 Generate Generiert Videos aus Text-Prompts und Bildern.
movie Veo 3 Generate Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.
movie Veo 3 Fast Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.
movie Veo 3.1 Generate Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.
movie Veo 3.1 Fast Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.

Veo-Modelle in der Vorabversion

movie movie Veo 3.1 Lite (Vorabversion) Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und zu niedrigen Kosten.
movie movie Veo 3 Generate preview Generates videos from text prompts and images with high quality.
movie Veo 3 Fast (Vorabversion) Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.
movie Veo 3.1 Generate (Vorabversion) Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.
movie Veo 3.1 Fast (Vorabversion) Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.
movie Veo 2 (Vorabversion) Generiert Videos aus Text-Prompts und Bildern und unterstützt Inpainting und Outpainting.

Experimentelle Veo-Modelle

movie Veo 2 (experimentell) Ein experimentelles Modell mit Funktionen, die getestet werden.

Lyria-Modelle

music_note_spark Lyria 3 Pro (Vorabversion) Generiert vollständige Musiktitel aus Text und Bild-Prompts.
music_note_spark Lyria 3 Clip (Vorabversion) Generiert 30-Sekunden-Audioclips aus Text- und Bild-Prompts.
audio_spark Lyria 2 Generiert Musik aus Text-Prompts.

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Malagasy (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmarisch (Burmesisch) (my), Nepali (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Uigurisch (ug), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo) und Zulu (zu).

Gemma

Gemma und Gemma 2 unterstützen nur die englische Sprache (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Multilinguale Modelle für Texteinbettungen unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Malagasy (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Myanmarisch (Burmesisch) (my), Nepali (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo) und Zulu (zu).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in der Gemini Enterprise Agent Platform verfügbaren generativen KI-Modellen und APIs finden Sie im Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Alle Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.