Gemini 3 Flash

Vorschau

Dieses Produkt oder diese Funktion unterliegt den Bedingungen für Pre‑GA-Angebote im Abschnitt „Allgemeine Dienstbedingungen“ der dienstspezifischen Nutzungsbedingungenund den Zusatzbedingungen für Vorschauprodukte auf Basis von generativer KI. Sie können personenbezogene Daten für dieses Produkt oder diese Funktion gemäß dem Zusatz zur Verarbeitung von Cloud-Daten verarbeiten, vorbehaltlich der Verpflichtungen und Einschränkungen der Vereinbarung, die für den Zugriff auf Google Cloud gilt. Pre-GA-Produkte und ‑Funktionen stehen in der vorliegenden Form zur Verfügung und bieten möglicherweise nur eingeschränkten Support. Weitere Informationen finden Sie in den Beschreibungen der Produkteinführungsphasen.

Gemini 3 Flash kombiniert die Fähigkeit von Gemini 3 Pro, Schlussfolgerungen zu ziehen, mit der Latenz, Effizienz und den Kosten von Flash. Es ermöglicht nicht nur alltägliche Aufgaben mit verbesserter Argumentation, sondern ist auch für die komplexesten agentischen Workflows konzipiert.

Gemini 3 Flash nutzt mehrere neue Funktionen, um Leistung, Kontrolle und multimodale Genauigkeit zu verbessern:

Denkstufe: Mit dem Parameter thinking_level können Sie die Menge an internen Überlegungen steuern, die das Modell anstellt (minimal, niedrig, mittel oder hoch), um die Qualität der Antwort, die Komplexität der Überlegungen, die Latenz und die Kosten in Einklang zu bringen. Der Parameter thinking_level ersetzt thinking_budget für Gemini 3-Modelle.

Hinweis :Wenn Sie mit Gemini 2.5 Flash ein Thinking-Budget von 0 verwendet haben, sollten Sie die Thinking-Stufe auf MINIMAL festlegen, um eine ähnliche Latenz und ähnliche Kosten zu erzielen. Sie müssen jedoch weiterhin Thought-Signaturen verarbeiten, wenn Sie die Thinking-Stufe minimal verwenden.

Weitere Informationen zu den verschiedenen Denkebenen finden Sie unter Thinking.
Gedankensignaturen: Durch die strengere Validierung von Gedankensignaturen wird die Zuverlässigkeit bei der Funktionsaufruffolge verbessert.
Media-Auflösung: Verwenden Sie den Parameter media_resolution (low, medium, high oder ultra high), um die Verarbeitung von visuellen Informationen für multimodale Eingaben zu steuern. Dies wirkt sich auf die Tokennutzung und die Latenz aus. Informationen zu den Standardeinstellungen für die Auflösung finden Sie unter Erste Schritte mit Gemini 3.
- Die Media-Auflösung Ultra High ist nur für die Modalität IMAGE verfügbar.
- Die Anzahl der PDF-Tokens wird in usage_metadata unter der Modalität IMAGE anstelle der Modalität DOCUMENT aufgeführt.
Multimodale Funktionsantworten: Funktionsantworten können jetzt multimodale Objekte wie Bilder und PDFs zusätzlich zu Text enthalten.
Streaming-Funktionsaufruf: Teilweise Argumente für Funktionsaufrufe streamen, um die Nutzerfreundlichkeit bei der Verwendung von Tools zu verbessern.

Weitere Informationen zur Verwendung dieser Funktionen finden Sie unter Erste Schritte mit Gemini 3.

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.

Technische Spezifikationen
Modell-ID	`gemini-3-flash-preview`
Unterstützte Ein- und Ausgaben	Eingaben: Text, Code, Bilder, Audio, Video, PDF Ausgaben: Text
Token limits	Maximale Eingabetokens: 1.048.576 Maximale Ausgabetokens: 65.536
Leistungsspektrum	Unterstützt Fundierung mit der Google Suche Codeausführung Systemanweisungen Strukturierte Ausgabe Funktionsaufrufe Tokens zählen Denken Implizites Kontext-Caching Explizites Kontext-Caching Vertex AI RAG Engine Chat-Vervollständigungen Nicht unterstützt Gemini Live API
Nutzungsoptionen	Unterstützt Bereitgestellter Durchsatz Standard-Pay-as-you-go Flex PayGo Priority PayGo Batchvorhersage Nicht unterstützt
Nutzungsoptionen	Weitere Informationen finden Sie unter Nutzungsoptionen.
	Bilder	Maximale Anzahl von Bildern pro Prompt: 900 Maximale Dateigröße pro Datei für Inline-Daten oder direkte Uploads über die Console: 7 MB Maximale Dateigröße pro Datei aus Google Cloud Storage: 30 MB Standard-Tokens für die Auflösung: 1120 Unterstützte MIME-Typen: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Dokumente	Maximale Anzahl von Dateien pro Prompt: 900 Maximale Anzahl von Seiten pro Datei: 900 Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB Standard-Tokens für die Auflösung: 560 OCR für gescannte PDFs: Wird nicht standardmäßig verwendet Unterstützte MIME-Typen: `application/pdf`, `text/plain`
	Video	Maximale Videolänge (mit Audio): ca. 45 Minuten Maximale Videolänge (ohne Audio): ca. 1 Stunde Maximale Anzahl von Videos pro Prompt: 10 Standard-Tokens für die Auflösung pro Frame: 70 Unterstützte MIME-Typen: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens Maximale Anzahl von Audiodateien pro Prompt: 1 Sprachverständnis für: Audiozusammenfassung, ‑transkription und ‑übersetzung Unterstützte MIME-Typen: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Parameter-Standardwerte	Temperatur: 0,0–2,0 (Standardwert: 1,0) topP: 0,0–1,0 (Standard 0,95) topK: 64 (fest) candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen
	Modellverfügbarkeit	Global global
	Weitere Informationen finden Sie unter Bereitstellungen und Endpunkte.
Wissensstichtag	Januar 2025
Versionen	`gemini-3-flash-preview` Startphase: Öffentliche Vorschau Veröffentlichungsdatum: 17. Dezember 2025
Unterstützte Sprachen	Unterstützte Sprachen
Preise	Weitere Informationen finden Sie unter Preise.

Gemini 3 Flash Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Gemini 3 Flash