Gemini 3 Flash

Gemini 3 Flash kombiniert die Fähigkeit von Gemini 3 Pro, Schlussfolgerungen zu ziehen, mit der Latenz, Effizienz und den Kosten von Flash. Es ermöglicht nicht nur alltägliche Aufgaben mit verbesserter Argumentation, sondern ist auch für die komplexesten agentischen Workflows konzipiert.

Gemini 3 Flash nutzt mehrere neue Funktionen, um Leistung, Kontrolle und multimodale Genauigkeit zu verbessern:

  • Denkstufe: Mit dem Parameter thinking_level können Sie die Menge an internen Überlegungen steuern, die das Modell anstellt (minimal, low, medium oder high), um die Qualität der Antwort, die Komplexität der Überlegungen, die Latenz und die Kosten in Einklang zu bringen. Der Parameter thinking_level ersetzt thinking_budget für Gemini 3-Modelle.

    Weitere Informationen zu den verschiedenen Denkebenen finden Sie unter Thinking.

  • Gedankensignaturen: Durch die strengere Validierung von Gedankensignaturen wird die Zuverlässigkeit bei Multi-Turn-Funktionsaufrufen verbessert.

  • Media-Auflösung: Mit dem Parameter media_resolution (low, medium, high oder ultra high) können Sie die Verarbeitung von visuellen Informationen für multimodale Eingaben steuern. Dies wirkt sich auf die Tokennutzung und die Latenz aus. Informationen zu den Standardeinstellungen für die Auflösung finden Sie unter Erste Schritte mit Gemini 3.

    • Die Media-Auflösung Ultra High ist nur für die Modalität IMAGE verfügbar.
    • Die Anzahl der PDF-Tokens wird in usage_metadata unter der Modalität IMAGE anstelle der Modalität DOCUMENT aufgeführt.
  • Multimodale Funktionsantworten: Funktionsantworten können jetzt multimodale Objekte wie Bilder und PDFs zusätzlich zu Text enthalten.

  • Streaming-Funktionsaufruf: Teilweise Argumente für Funktionsaufrufe streamen, um die Nutzerfreundlichkeit bei der Verwendung von Tools zu verbessern.

Weitere Informationen zur Verwendung dieser Funktionen finden Sie unter Erste Schritte mit Gemini 3.

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-3-flash-preview
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video, PDF
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.536
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 900
  • Maximale Dateigröße pro Datei für Inline-Daten oder direkte Uploads über die Console: 7 MB
  • Maximale Dateigröße pro Datei aus Google Cloud Storage: 30 MB
  • Standard-Tokens für die Auflösung: 1120
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 900
  • Maximale Anzahl von Seiten pro Datei: 900
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Standard-Tokens für die Auflösung: 560
  • OCR für gescannte PDFs: Wird nicht standardmäßig verwendet
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Standard-Tokens für die Auflösung pro Frame: 70
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Spracherkennung für: Zusammenfassung, Transkription und Übersetzung von Audioinhalten
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Parameter-Standardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(Umfasst Standard PayGo und bereitgestellten Durchsatz)

  • Global
    • global
Weitere Informationen finden Sie unter Bereitstellungen und Endpunkte.
Wissensstichtag Januar 2025
Versionen
  • gemini-3-flash-preview
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 17. Dezember 2025
Sicherheitskontrollen
Onlinevorhersage
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Batchvorhersage
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Tuning
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Kontext-Caching
  • Datenstandort
  • CMEK
  • VPC-SC
  • AXT
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.