Gemini 3 Pro

Gemini 3 Pro ist unser fortschrittlichstes Gemini-Modell für logisches Denken, das komplexe Probleme lösen kann. Gemini 3 Pro kann mit seinem Kontextfenster von 1 Million Token riesige Datensätze und komplexe Probleme aus verschiedenen Informationsquellen wie Text, Audio, Bildern, Videos, PDFs und sogar ganzen Code-Repositories verstehen.

Änderungen bei der Qualität

Bei der Migration von Gemini 2.5 Pro zu Gemini 3 Pro können Sie mit erheblichen Verbesserungen in den Bereichen High-Level-Reasoning, Befolgung komplexer Anweisungen, Tool-Nutzung, agentenbasierte Anwendungsfälle und bessere Long-Context-Funktionen (einschließlich Bild- und Dokumentanalyse) rechnen. Gemini 3 Pro-Modelle sind nicht darauf ausgelegt, die Unterstützung von Anwendungsfällen für Audio- und Bildsegmentierung zu priorisieren. Wenn Sie bei diesen Anwendungsfällen eine hohe Leistung erzielen möchten, sollten Sie Modelle verwenden, die speziell für diese Anforderungen entwickelt wurden. Bei informationsreichen oder komplizierten Grafiken, Tabellen oder Diagrammen kann es vorkommen, dass das Modell Informationen falsch extrahiert oder die bereitgestellten Ressourcen falsch interpretiert. Wenn Sie wichtige Informationen so einfach wie möglich präsentieren, können Sie sicherstellen, dass Sie mit Gemini 3 Pro die gewünschte Ausgabe erhalten.

Geändertes Verhalten

Gemini 3 Pro ist auf hohe Effizienz und schnelle Aktionen ausgelegt. Das Modell wurde darauf trainiert, prägnante, direkte Antworten zu geben und Nutzeranfragen so schnell wie möglich zu beantworten. Da das Modell darauf ausgelegt ist, hilfreich zu sein, kann es gelegentlich Vermutungen anstellen, wenn Informationen fehlen, oder eine zufriedenstellende Antwort gegenüber strengen Anweisungen priorisieren. Dieses Verhalten kann durch Prompts abgemildert oder geändert werden. Weitere Informationen und Best Practices finden Sie unter Gemini 3 jetzt ausprobieren.

Neue Funktionen

Gemini 3 Pro bietet mehrere neue Funktionen, die die Leistung, Steuerung und multimodale Genauigkeit verbessern:

  • Denkstufe: Mit dem Parameter thinking_level können Sie die Menge an internen Überlegungen steuern, die das Modell anstellt (niedrig oder hoch), um die Qualität der Antwort, die Komplexität der Überlegungen, die Latenz und die Kosten in Einklang zu bringen. Der Parameter thinking_level ersetzt thinking_budget für Gemini 3-Modelle.
  • Media-Auflösung: Verwenden Sie den Parameter media_resolution (low, medium oder high), um die Verarbeitung von visuellen Informationen für multimodale Eingaben zu steuern. Dies wirkt sich auf die Tokennutzung und die Latenz aus. Informationen zu den Standardeinstellungen für die Auflösung finden Sie unter Erste Schritte mit Gemini 3.
  • Gedankensignaturen: Die strengere Validierung von Gedankensignaturen verbessert die Zuverlässigkeit beim Funktionsaufruf in mehreren Schritten.
  • Multimodale Funktionsantworten: Funktionsantworten können jetzt multimodale Objekte wie Bilder und PDFs zusätzlich zu Text enthalten.
  • Streaming von Funktionsaufrufen: Teilweise Argumente für Funktionsaufrufe streamen, um die Nutzerfreundlichkeit bei der Verwendung von Tools zu verbessern.

Weitere Informationen zur Verwendung dieser Funktionen finden Sie unter Erste Schritte mit Gemini 3.

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-3-pro-preview
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video, PDF
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.536
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 900
  • Maximale Dateigröße pro Datei für Inline-Daten oder direkte Uploads über die Console: 7 MB
  • Maximale Dateigröße pro Datei aus Google Cloud Storage: 30 MB
  • Standard-Tokens für die Auflösung: 1120
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 900
  • Maximale Anzahl von Seiten pro Datei: 900
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Standard-Tokens für die Auflösung: 560
  • OCR für gescannte PDFs: Wird nicht standardmäßig verwendet
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Standard-Tokens für die Auflösung pro Frame: 70
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Spracherkennung für: Zusammenfassung, Transkription und Übersetzung von Audioinhalten
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Parameter-Standardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(Umfasst Standard PayGo und bereitgestellten Durchsatz)

  • Global
    • global
Weitere Informationen finden Sie unter Bereitstellungen und Endpunkte.
Wissensstichtag Januar 2025
Versionen
  • gemini-3-pro-preview
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 18. November 2025
Sicherheitskontrollen
Onlinevorhersage
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Batchvorhersage
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Tuning
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Kontext-Caching
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.