Gemini 3 Pro

Gemini 3 Pro ist unser fortschrittlichstes Gemini-Modell für logisches Schlussfolgern, das komplexe Probleme lösen kann. Gemini 3 Pro kann mit seinem Kontextfenster von 1 Million Token riesige Datensätze und komplexe Probleme aus verschiedenen Informationsquellen wie Text, Audio, Bildern, Videos, PDFs und sogar ganzen Code-Repositories verstehen.

Änderungen bei der Qualität

Beim Migrieren von Gemini 2.5 Pro zu Gemini 3 Pro können Sie mit erheblichen Verbesserungen bei der allgemeinen Argumentation, der Befolgung komplexer Anweisungen, der Verwendung von Tools, der Nutzung von Agenten und den Funktionen für lange Kontexte (einschließlich Bild- und Dokumentanalyse) rechnen. Gemini 3 Pro-Modelle sind nicht darauf ausgelegt, die Unterstützung von Audioanalyse- oder Bildsegmentierungsanwendungsfällen zu priorisieren. Wenn Sie für diese Anwendungsfälle eine hohe Leistung benötigen, sollten Sie Modelle verwenden, die speziell für diese Anforderungen entwickelt wurden. Bei informationsreichen oder komplizierten Grafiken, Tabellen oder Diagrammen kann das Modell manchmal Informationen falsch extrahieren oder die bereitgestellten Ressourcen falsch interpretieren. Wenn Sie wichtige Informationen so einfach wie möglich präsentieren, können Sie die gewünschte Ausgabe bei der Arbeit mit Gemini 3 Pro sicherstellen.

Geändertes Verhalten

Gemini 3 Pro ist auf hohe Effizienz und schnelle Aktionen ausgelegt. Das Modell wurde darauf trainiert, prägnante, direkte Antworten zu geben und Nutzeranliegen so schnell wie möglich zu bearbeiten. Da das Modell darauf ausgelegt ist, hilfreich zu sein, kann es gelegentlich Vermutungen anstellen, wenn Informationen fehlen, oder eine zufriedenstellende Antwort gegenüber strengen Anweisungen priorisieren. Dieses Verhalten kann durch Prompts abgemildert oder geändert werden. Weitere Informationen und Best Practices finden Sie unter Gemini 3 jetzt ausprobieren.

Neue Funktionen

Gemini 3 Pro bietet mehrere neue Funktionen, die die Leistung, die Steuerung und die multimodale Genauigkeit verbessern:

  • Thinking level (Denkstufe): Mit dem Parameter thinking_level können Sie die Menge der internen Schlussfolgerungen steuern, die das Modell durchführt (low oder high), um die Qualität der Antworten, die Komplexität der Schlussfolgerungen, die Latenz und die Kosten in Einklang zu bringen. Der Parameter thinking_level ersetzt thinking_budget für Gemini 3-Modelle.
  • Media-Auflösung: Verwenden Sie den Parameter media_resolution (low, medium oder high), um die Verarbeitung von multimodalen Eingaben zu steuern. Dies wirkt sich auf die Tokennutzung und die Latenz aus. Weitere Informationen zu den Standardauflösungseinstellungen finden Sie unter Erste Schritte mit Gemini 3.
  • Gedankensignaturen: Die strengere Validierung von Gedankensignaturen verbessert die Zuverlässigkeit bei der Funktionsaufrufe in mehreren Schritten.
  • Multimodale Funktionsantworten: Funktionsantworten können jetzt multimodale Objekte wie Bilder und PDFs zusätzlich zu Text enthalten.
  • Streaming von Funktionsaufrufen: Teilweise Argumente für Funktionsaufrufe streamen, um die Nutzerfreundlichkeit bei der Verwendung von Tools zu verbessern.

Weitere Informationen zur Verwendung dieser Funktionen finden Sie unter Erste Schritte mit Gemini 3.

In der Agent Platform testen In Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Agent Platform API.
Modell-ID gemini-3-pro-preview
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video, PDF
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.536
Leistungsspektrum
Nutzungsoptionen
Weitere Informationen finden Sie unter Nutzungsoptionen.
Technische Spezifikationen
Google Bilder
  • Maximale Anzahl von Bildern pro Prompt: 3.000
  • Maximale Dateigröße pro Datei für Inline-Daten oder direkte Uploads über die Console: 7 MB
  • Maximale Dateigröße pro Datei aus Google Cloud Storage: 30 MB
  • Standard-Tokens für die Auflösung: 1120
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 3.000
  • Maximale Anzahl von Seiten pro Datei: 3.000
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB(application/pdf) oder 7 MB(text/plain)
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Standard-Tokens für die Auflösung: 560
  • OCR für gescannte PDFs: Wird nicht standardmäßig verwendet
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Standard-Tokens für die Auflösung pro Frame: 70
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Sprachverständnis für: Audiozusammenfassung, ‑transkription und ‑übersetzung
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

  • Global
    • global
Weitere Informationen finden Sie unter Bereitstellungen und Endpunkte.
Wissensstichtag Januar 2025
Versionen
  • gemini-3-pro-preview
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 18. November 2025
    • Datum der Außerbetriebnahme: 26. März 2026
Unterstützte Sprachen Siehe unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.