Google-Modelle

Enthaltene Gemini-Modelle

Allgemein verfügbare Gemini-Modelle

Diamant Gemini 2.5 Pro Unser leistungsstarkes Modell für komplexes Schlussfolgern und Programmieren. Er bietet adaptive Denkfunktionen, um komplexe agentische und multimodale Herausforderungen mit einem Kontext von 1 Million Tokens zu lösen.
spark Gemini 2.5 Flash Blitzschnell und leistungsstark. Bietet ein ausgewogenes Verhältnis zwischen Intelligenz und Latenz mit steuerbaren Denkbudgets für vielseitige Anwendungen.
🍌 Gemini 2.5 Flash Image Ideen in produktionsreife Assets umwandeln. Es bietet Bearbeitung per Prompt, das Zusammenführen mehrerer Bilder und die konsistente Darstellung von Figuren für anspruchsvolle kreative Workflows.
performance_auto Gemini 2.5 Flash-Lite Für den Einsatz in großem Maßstab entwickelt. Gleicht Kosten und Leistung für Aufgaben mit hohem Durchsatz aus und ist auf Effizienz optimiert, ohne das multimodale Verständnis zu beeinträchtigen.
audio_spark Gemini 2.5 Flash mit Gemini Live API Für bidirektionales Streaming in Echtzeit konzipiert. Bietet integriertes Audio mit geringer Latenz und affektive Dialogfunktionen für natürliche, konversationelle Interaktionen.
spark Gemini 2.0 Flash Multimodale Leistung für Entwickler, die ein kostengünstiges Modell für allgemeine Aufgaben benötigen.
performance_auto Gemini 2.0 Flash-Lite Optimiert und äußerst effizient für einfache, häufige Aufgaben, bei denen Geschwindigkeit und Preis im Vordergrund stehen.

Gemini-Vorschaumodelle

Vorabversion Gemini 3 Pro Unser neuestes Modell, das in erster Linie auf Schlussfolgerungen basiert und für komplexe agentische Workflows und Programmierung optimiert ist. Er bietet adaptives Denken, ein Kontextfenster mit 1 Million Tokens und integrierte Fundierung für anspruchsvolle multimodale Problemlösung.
Vorschau Gemini 3 Flash Unser bestes Modell für komplexes multimodales Verstehen, das für die anspruchsvollsten agentischen Probleme mit leistungsstarken Programmier- und modernsten Schlussfolgerungsfunktionen entwickelt wurde.
Vorschau Gemini 3 Pro Image Bildgenerierung mit hoher Detailtreue und durch Schlussfolgerungen verbesserter Komposition. Unterstützt die Darstellung von lesbarem Text, komplexe mehrstufige Bearbeitung und die Konsistenz von Charakteren mit bis zu 14 Referenzeingaben.

Gemma-Modelle

Gemma 3n Ein offenes Modell, das für die effiziente Ausführung auf Geräten mit geringen Ressourcen entwickelt wurde. Es unterstützt multimodale Eingaben (Text, Bild, Video und Audio) und Textausgabe in über 140 Sprachen.
Gemma 3 Ein offenes Modell mit Text- und Bildeingabe, Unterstützung für über 140 Sprachen und einem Kontextfenster von 128.000 Tokens.
Gemma 2 Ein offenes Modell, das die Generierung, Zusammenfassung und Extraktion von Text unterstützt.
Gemma Ein kleines, schlankes offenes Modell, das Textgenerierung, -zusammenfassung und -extraktion unterstützt.
ShieldGemma 2 Auf Anweisungen abgestimmte Modelle zur Bewertung der Sicherheit von Text und Bildern anhand definierter Richtlinien.
PaliGemma Ein offenes Vision-Language-Modell, das SigLIP und Gemma kombiniert.
CodeGemma Ein leistungsstarkes, einfaches offenes Modell für Programmieraufgaben, einschließlich Codevervollständigung, ‑generierung und ‑verständnis.
TxGemma Ein Modell, das Vorhersagen, Klassifizierungen oder Text auf Grundlage von therapiebezogenen Daten generiert, um KI-Modelle mit weniger Daten und Rechenleistung zu erstellen.
MedGemma Eine Sammlung von Gemma 3-Varianten, die für die Leistung bei der Verarbeitung von medizinischen Texten und Bildern trainiert wurden.
MedSigLIP Eine SigLIP-Variante, die darauf trainiert wurde, medizinische Bilder und Texte in einen gemeinsamen Einbettungsraum zu codieren.
T5Gemma Eine Familie von leichten Encoder-Decoder-Forschungsmodellen.

Einbettungsmodelle

width_normal Embeddings for Text Konvertiert Textdaten in Vektordarstellungen für semantische Suche, Klassifizierung und Clustering.
width_normal Multimodale Einbettungen Generiert Vektoren basierend auf Bildern für Aufgaben wie Bildklassifizierung und Suche.

Imagen-Modelle

photo_spark Imagen 4 für die Generierung Mit Text-Prompts neuartige Bilder generieren, die eine höhere Qualität als unsere bisherigen Modelle für die Bildgenerierung haben
photo_spark Imagen 4 für die schnelle Generierung Mit Text-Prompts neuartige Bilder generieren, die eine höhere Qualität und eine geringere Latenz als unsere bisherigen Modelle für die Bildgenerierung haben
photo_spark Imagen 4 für die Ultra-Generierung Mit Text-Prompts neuartige Bilder generieren, die eine höhere Qualität und eine bessere Einhaltung von Prompts als unsere bisherigen Modelle für die Bildgenerierung haben
photo_spark Imagen 3 für die Generierung 002 Mit Text-Prompts neuartige Bilder generieren
photo_spark Imagen 3 für die Generierung 001 Mit Text-Prompts neuartige Bilder generieren
photo_spark Imagen 3 für die schnelle Generierung Mit Text-Prompts neuartige Bilder generieren, die eine geringere Latenz als unsere anderen Modelle für die Bildgenerierung haben
image_edit_auto Imagen 3 für die Bearbeitung und Anpassung Bearbeitet vorhandene Bilder oder generiert neue Bilder basierend auf Text-Prompts und dem bereitgestellten Kontext.

Imagen-Modelle in der Vorschau ansehen

photo_spark Virtuelles Anprobieren Generiert Bilder von Personen, die Bekleidungsprodukte tragen.
image_edit_auto Imagen-Produktkontextualisierung in Vertex AI Produktbilder werden bearbeitet, um sie basierend auf Textprompts in verschiedenen Szenen oder Hintergründen zu platzieren.

Veo-Modelle

Film Veo 2 Generate Generiert Videos aus Text-Prompts und Bildern.
movie Veo 3 Generate Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.
movie Veo 3 Fast Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.
movie Veo 3.1 Generate Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.
movie Veo 3.1 Fast Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz.

Vorschau von Veo-Modellen

movie Veo 3 Generate preview Generates videos from text prompts and images with high quality.
movie Veo 3 Fast-Vorschau Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit niedriger Latenz.
Film Veo 3.1: Vorschau generieren Generiert Videos aus Text-Prompts und Bildern in hoher Qualität.
movie Veo 3.1 Fast Preview Generiert Videos aus Text-Prompts und Bildern in hoher Qualität und mit geringer Latenz.
movie Veo 2 Preview Generiert Videos aus Text-Prompts und Bildern und unterstützt Inpainting und Outpainting.

Experimentelle Veo-Modelle

movie Veo 2 Experimental Ein experimentelles Modell mit Funktionen, die getestet werden.

MedLM-Modelle

medical_information MedLM-medium Ein HIPAA-konformes Modell für die Beantwortung medizinischer Fragen und die Zusammenfassung von Gesundheitsdokumenten.
clinical_notes MedLM-large-large Ein HIPAA-konformes Modell für die Beantwortung medizinischer Fragen und die Zusammenfassung von Gesundheitsdokumenten.

Sprachunterstützung

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Assamesisch (as), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bosnisch (bs), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Dhivehi (dv), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Lateinisch (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolisch (mn), Myanmar (Burmesisch) (my), Nepalesisch (ne), Norwegisch (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Paschtu (ps), Persisch (fa), Polnisch (pl), Portugiesisch (pt), Punjabi (pa), Rumänisch (ro), Russisch (ru), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Swahili (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (te), Thailändisch (th), Türkisch (tr), Ukrainisch (uk), Urdu (ur), Uigurisch (ug), Usbekisch (uz), Vietnamesisch (vi), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (zu).

Gemma

Gemma und Gemma 2 unterstützen nur die englische Sprache (en). Gemma 3 und Gemma 3n bieten mehrsprachige Unterstützung in über 140 Sprachen.

Einbettungen

Mehrsprachige Texteinbettungsmodelle unterstützen die folgenden Sprachen:

Afrikaans (af), Albanisch (sq), Amharisch (am), Arabisch (ar), Armenisch (hy), Aserbaidschanisch (az), Baskisch (eu), Belarussisch (be), Bengalisch (bn), Bulgarisch (bg), Katalanisch (ca), Cebuano (ceb), Chinesisch (vereinfacht und traditionell) (zh), Korsisch (co), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Esperanto (eo), Estnisch (et), Filipino (Tagalog) (fil), Finnisch (fi), Französisch (fr), Friesisch (fy), Galicisch (gl), Georgisch (ka), Deutsch (de), Griechisch (el), Gujarati (gu), Haitianisches Kreolisch (ht), Hausa (ha), Hawaiianisch (haw), Hebräisch (iw), Hindi (hi), Hmong (hmn), Ungarisch (hu), Isländisch (is), Igbo (ig), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Javanisch (jv), Kannada (kn), Kasachisch (kk), Khmer (km), Koreanisch (ko), Kurdisch (ku), Kirgisisch (ky), Laotisch (lo), Latein (la), Lettisch (lv), Litauisch (lt), Luxemburgisch (lb), Mazedonisch (mk), Madagassisch (mg), Malaiisch (ms), Malayalam (ml), Maltesisch (mt), Maori (mi), Marathi (mr), Mongolisch (mn), Birmanisch (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Norwegisch (no), Paschtu (ps), Persisch (ar), Polnisch (hy), Portugiesisch (az), Punjabi (eu), Rumänisch (be), Russisch (bn), Samoanisch (sm), Schottisch-Gälisch (gd), Serbisch (sr), Sesotho (st), Shona (sn), Sindhi (sd), Singhalesisch (si), Slowakisch (sk), Slowenisch (sl), Somali (so), Spanisch (es), Sundanesisch (su), Suaheli (sw), Schwedisch (sv), Tadschikisch (tg), Tamil (ta), Telugu (ka), Thailändisch (de), Türkisch (el), Ukrainisch (gu), Urdu (ht), Usbekisch (ha), Vietnamesisch (haw), Walisisch (cy), Xhosa (xh), Jiddisch (yi), Yoruba (yo), und Zulu (zu).faplptparorutethtrukuruzvi

Imagen 3

Imagen 3 unterstützt die folgenden Sprachen:

Englisch (en), Chinesisch (vereinfacht und traditionell) (zh), Hindi (hi), Japanisch (ja), Koreanisch (ko), Portugiesisch (pt) und Spanisch (es).

MedLM

Das MedLM-Modell unterstützt die englische Sprache (en).

Alle Modelle in Model Garden untersuchen

Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle und -Assets auswählen können. Informationen zu den in Vertex AI verfügbaren generativen KI-Modellen und APIs finden Sie im Model Garden in der Google Cloud Console.

Zu Model Garden

Weitere Informationen zu Model Garden, einschließlich der verfügbaren Modelle und Funktionen, finden Sie unter KI-Modelle in Model Garden entdecken.

Modellversionen

Eine Liste aller Modellversionen, einschließlich älterer und eingestellter Modelle, finden Sie unter Modellversionen und Lebenszyklus.

Nächste Schritte