Gemini 3 Pro

Gemini 3 Pro ist unser fortschrittlichstes Gemini-Modell für logisches Denken, das komplexe Probleme lösen kann. Gemini 3 Pro kann mit seinem Kontextfenster von 1 Million Token riesige Datensätze und komplexe Probleme aus verschiedenen Informationsquellen wie Text, Audio, Bildern, Videos, PDFs und sogar ganzen Code-Repositories verstehen.

Gemini 3 Pro bietet mehrere neue Funktionen, die die Leistung, Steuerung und multimodale Genauigkeit verbessern:

  • Denkstufe: Mit dem Parameter thinking_level können Sie die Menge an internen Überlegungen steuern, die das Modell anstellt (niedrig oder hoch), um die Qualität der Antworten, die Komplexität der Überlegungen, die Latenz und die Kosten in Einklang zu bringen. Der Parameter thinking_level ersetzt thinking_budget für Gemini 3-Modelle.
  • Media-Auflösung: Verwenden Sie den Parameter media_resolution (low, medium oder high), um die Verarbeitung von visuellen Informationen für multimodale Eingaben zu steuern. Dies wirkt sich auf die Tokennutzung und die Latenz aus. Informationen zu den Standardeinstellungen für die Auflösung finden Sie unter Erste Schritte mit Gemini 3.
  • Gedankensignaturen: Die strengere Validierung von Gedankensignaturen verbessert die Zuverlässigkeit bei Multi-Turn-Funktionsaufrufen.
  • Multimodale Funktionsantworten: Funktionsantworten können jetzt multimodale Objekte wie Bilder und PDFs enthalten.
  • Streaming-Funktionsaufruf: Teilweise Argumente für Funktionsaufrufe streamen, um die Nutzerfreundlichkeit bei der Verwendung von Tools zu verbessern.

Weitere Informationen zur Verwendung dieser Funktionen finden Sie unter Erste Schritte mit Gemini 3 Pro.

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-3-pro-preview
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video, PDF
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.536
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 900
  • Maximale Dateigröße pro Datei für Inline-Daten oder direkte Uploads über die Console: 7 MB
  • Maximale Dateigröße pro Datei aus Google Cloud Storage: 30 MB
  • Standard-Tokens für die Auflösung: 1120
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 900
  • Maximale Anzahl von Seiten pro Datei: 900
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Standard-Tokens für die Auflösung: 560
  • OCR für gescannte PDFs: Wird nicht standardmäßig verwendet
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Standard-Tokens für die Auflösung pro Frame: 70
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Spracherkennung für: Zusammenfassung, Transkription und Übersetzung von Audioinhalten
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)

  • Global
    • global
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Januar 2025
Versionen
  • gemini-3-pro-preview
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 18. November 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.