Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Google-Modelle

Enthaltene Gemini-Modelle

3.5 Flash

Es wurde entwickelt, um leistungsstarke agentische Funktionen (nahezu auf Pro-Niveau) mit hoher Geschwindigkeit und zu einem attraktiven Preis zu bieten.

Coding-Fähigkeiten auf Profi-Niveau und parallele agentische Ausführung
Kontextfenster mit 1 Million Tokens
Intelligenz nahezu auf Pro-Niveau mit den Kosten und der Geschwindigkeit der Flash-Stufe

3.1 Flash-Lite

Unser kosteneffizientestes Modell, optimiert für Anwendungsfälle mit niedriger Latenz und umfangreichem, kostensensitivem LLM-Traffic (Large Language Model)

Optimiert für geringe Latenz und hohes Trafficvolumen
Verbesserte Antwortqualität und Befolgung von Anweisungen
Verbesserte Audioeingabequalität für ASR-Aufgaben

3.1 Flash-Bild

Ideen in produktionsreife Assets umwandeln

Hochwertige Bilder generieren
Kann dialogbasierte Bildbearbeitung per Prompt durchführen
Kann mehrere Bilder zusammenführen und Figuren konsistent darstellen, um anspruchsvolle kreative Workflows zu ermöglichen

Allgemein verfügbare Gemini-Modelle

🍌 Gemini 3.1 Flash Image Ideen in produktionsreife Assets umwandeln. Bietet die Bildbearbeitung per Prompt, das Zusammenführen mehrerer Bilder und die Konsistenz von Figuren für anspruchsvolle kreative Workflows.

🍌 Gemini 3 Pro Image Bildgenerierung mit hoher Detailtreue und verbesserter Komposition durch Schlussfolgerungen. Unterstützt die Darstellung von lesbarem Text, komplexe mehrstufige Bearbeitungen und die Konsistenz von Charakteren mit bis zu 14 Referenzeingaben.

spark Gemini 3.5 Flash Gemini 3.5 Flash bietet nahezu die Leistung des Pro-Modells sowie parallele agentische Ausführung mit der Geschwindigkeit und den Kosten der Flash-Standardstufe: Programmierung auf Pro-Niveau, parallele agentische Ausführung – alles zum gleichen Preis wie ein Flash-Modell.

performance_auto Gemini 3.1 Flash-Lite Unser kosteneffizientestes Modell, das für Anwendungsfälle mit niedriger Latenz und umfangreichem, kostensensitivem LLM-Traffic (Large Language Model) optimiert ist.

diamond Gemini 2.5 Pro Unser leistungsstarkes Modell für komplexe Schlussfolgerungen und Programmierung. Bietet adaptive Denkfunktionen, um komplexe agentische und multimodale Herausforderungen mit einem Kontext von 1 Million Tokens zu lösen.

spark Gemini 2.5 Flash Blitzschnell und leistungsstark. Bietet ein ausgewogenes Verhältnis zwischen Intelligenz und Latenz mit steuerbaren Denkbudgets für vielseitige Anwendungen.

🍌 Gemini 2.5 Flash Image Ideen in produktionsreife Assets umwandeln. Bietet die Bildbearbeitung per Prompt, das Zusammenführen mehrerer Bilder und die Konsistenz von Figuren für anspruchsvolle kreative Workflows.

performance_auto Gemini 2.5 Flash-Lite Für den Einsatz in großem Maßstab entwickelt. Gleicht Kosten und Leistung für Aufgaben mit hohem Durchsatz aus und ist auf Effizienz optimiert, ohne das multimodale Verständnis zu beeinträchtigen.

audio_spark Gemini 2.5 Flash mit Gemini Live API Für bidirektionales Echtzeit-Streaming entwickelt. Es bietet integrierte Audiofunktionen mit niedriger Latenz und affektive Dialogfunktionen für natürliche, dialogorientierte Interaktionen.

Gemini-Modelle in der Vorschau ansehen

Vorabversion Gemini 3.1 Flash Image Ideen in produktionsreife Assets umwandeln. Bietet die Bildbearbeitung per Prompt, das Zusammenführen mehrerer Bilder und die Konsistenz von Figuren für anspruchsvolle kreative Workflows.

Vorschau Gemini 3.1 Pro Unser neuestes Modell, das auf Schlussfolgerungen basiert und für komplexe Agent-Workflows und Programmierung optimiert ist. Er bietet adaptives Denken, ein Kontextfenster mit 1 Million Tokens und integrierte Fundierung für anspruchsvolle multimodale Problemlösungen.

Vorschau Gemini 3 Flash Unser bestes Modell für komplexes multimodales Verstehen, das für die anspruchsvollsten agentischen Probleme mit leistungsstarken Programmier- und modernsten Schlussfolgerungsfähigkeiten entwickelt wurde.

Vorabversion Gemini 3 Pro Image Bildgenerierung mit hoher Detailtreue und verbesserter Komposition durch Schlussfolgerungen. Unterstützt die Darstellung von lesbarem Text, komplexe mehrstufige Bearbeitungen und die Konsistenz von Charakteren mit bis zu 14 Referenzeingaben.

Gemma-Modelle

Gemma 4 Ein offenes Modell, das sich gut für Aufgaben wie Textgenerierung, Programmierung und Schlussfolgern eignet und multimodale Eingaben unterstützt (Text und Bild für alle Varianten sowie zusätzlich Audio für die Varianten E2B und E4B).

Gemma 3n Ein offenes Modell, das für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurde und multimodale Eingaben (Text, Bild, Video und Audio) sowie Textausgaben in über 140 Sprachen unterstützt.

Gemma 3 Ein offenes Modell mit Text- und Bildeingabe, Unterstützung für über 140 Sprachen und einem Kontextfenster von 128.000 Tokens.

Gemma 2 Ein offenes Modell, das die Textgenerierung, Zusammenfassung und Extraktion unterstützt.

Gemma Ein kleines, schlankes offenes Modell, das Textgenerierung, -zusammenfassung und -extraktion unterstützt.

ShieldGemma 2 Auf Anweisungen abgestimmte Modelle zur Bewertung der Text- und Bildsicherheit anhand definierter Richtlinien.

PaliGemma Ein offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert.

CodeGemma Ein leistungsstarkes, einfaches offenes Modell für Programmieraufgaben, einschließlich Codevervollständigung, ‑generierung und ‑analyse.

TxGemma Ein Modell, das Vorhersagen, Klassifizierungen oder Text auf Grundlage von therapiebezogenen Daten generiert, um KI-Modelle mit weniger Daten und Rechenleistung zu erstellen.

MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Leistung bei der Verarbeitung von medizinischen Texten und Bildern trainiert wurden.

MedSigLIP Eine SigLIP-Variante, die darauf trainiert wurde, medizinische Bilder und Text in einen gemeinsamen Einbettungsraum zu codieren.

T5Gemma Eine Familie von leichten Encoder-Decoder-Forschungsmodellen.

Einbettungsmodelle

width_normal Embeddings for Text Konvertiert Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung und Clustering.

width_normal Multimodale Einbettungen Generiert Vektoren basierend auf Bildern für Aufgaben wie Bildklassifizierung und Suche.

Veo-Modelle

Film Veo 2 Generate Generiert Videos aus Text-Prompts und Bildern.

movie Veo 3 Generate Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.

movie Veo 3 Fast Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.

movie Veo 3.1 Generate Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.

movie Veo 3.1 Fast Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz.

Veo-Modelle in der Vorabversion

Film Veo 3.1 Lite (Vorabversion) Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und zu geringen Kosten.

movie Veo 3 Generate preview Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.

movie Veo 3 Fast-Vorschau Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.

movie Veo 3.1 Generate preview Generates videos from text prompts and images with high quality.

movie Veo 3.1 Fast Preview Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz.

movie Veo 2 Preview Generiert Videos aus Text-Prompts und Bildern und unterstützt Inpainting und Outpainting.

Experimentelle Veo-Modelle

movie Veo 2 Experimental Ein experimentelles Modell mit Funktionen, die sich in der Testphase befinden.

Lyria-Modelle

music_note_spark Lyria 3 Pro (Vorschau) Generiert Musiktracks in voller Länge aus Text- und Bild-Prompts.

music_note_spark Lyria 3 Clip (Vorschau) Generiert 30-Sekunden-Audio-Clips aus Text- und Bild-Prompts.

audio_spark Lyria 2 Generiert Musik aus Text-Prompts.

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitian Creole (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Lateinisch (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmar (Burmese) (my), Nepali (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Pashto (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Swahili (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Uigurisch (ug), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (zu).

Gemma

Gemma und Gemma 2 unterstützen nur die englische Sprache (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Mehrsprachige Texteinbettungsmodelle unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (zu).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in der Gemini Enterprise Agent Platform verfügbaren generativen KI-Modellen und APIs finden Sie im Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Eine Liste aller Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Google-Modelle Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.