Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Zur neuesten Version von Gemini migrieren

In diesem Leitfaden wird beschrieben, wie Sie Ihre Anwendung auf die neueste Gemini-Version aktualisieren. In diesem Leitfaden wird davon ausgegangen, dass Ihre Anwendung bereits eine ältere Gemini-Version verwendet. Informationen dazu, wie Sie Gemini in der Gemini Enterprise Agent Platform verwenden können, finden Sie in der Kurzanleitung zur Gemini API in der Gemini Enterprise Agent Platform.

In dieser Anleitung wird nicht beschrieben, wie Sie Ihre Anwendung vom Agent Platform SDK zum aktuellen Google Gen AI SDK migrieren. Weitere Informationen finden Sie in unserem Leitfaden zur Migration des Agent Platform SDK.

Welche Änderungen sind zu erwarten?

Für die Aktualisierung der meisten generativen KI-Anwendungen auf die aktuelle Gemini-Version sind nur wenige Code- oder Prompt-Änderungen erforderlich. Bei einigen Anwendungen sind jedoch möglicherweise Anpassungen des Prompts erforderlich. Es ist schwierig, diese Änderungen vorherzusagen, ohne Ihre Prompts zuerst mit der neuen Version zu testen. Wir empfehlen, vor der vollständigen Migration gründliche Tests durchzuführen. Tipps zum Erstellen effektiver Prompts Mit unserer Checkliste für die Prompt-Integrität können Sie Probleme mit Prompts finden und beheben.

Aktualisierung der Berichterstellung zur Tokenanzahl

Es kann zu einem erwarteten Anstieg der gemeldeten Tokenanzahl kommen, da unsere aktualisierte Infrastruktur jetzt alle Anfragekomponenten genau erfasst, einschließlich komplexer Metadaten wie Antwortschemata und Funktionsaufrufe, die vom alten System zuvor untererfasst wurden.

Größere Codeänderungen sind nur bei bestimmten Breaking Changes oder bei der Verwendung neuer Gemini-Funktionen erforderlich.

Zu welchem Gemini-Modell sollte ich migrieren?

Welches Gemini-Modell Sie verwenden, hängt von den Anforderungen Ihrer Anwendung ab:

Funktion	2.5 Pro	2.5 Flash	2.5 Flash-Lite	3 Flash	3.1 Pro	3.1 Flash-Lite	3.5 Flash
Startphase	AV	GA	GA	Vorschau	Vorschau	GA	GA
Eingabemodalitäten	Text, Code, Bilder, Audio, Video	Text, Code, Bilder, Audio, Video	Text, Code, Bilder, Audio, Video	Text, Code, Bilder, Audio, Video, PDF	Text, Code, Bilder, Audio, Video, PDF	Text, Code, Bilder, Audio, Video, PDF	Text, Code, Bilder, Audio, Video, PDF
Ausgabemodalitäten	Text	Text	Text	Text	Text	Text	Text
Kontextfenster, Gesamttokenlimit	1.048.576	1.048.576	1.048.576	1.048.576	1.048.576	1.048.576	1.048.576
Länge des Ausgabekontexts	65.535 (Standard)	65.535 (Standard)	65.535 (Standard)	65.536	65.536	65.535 (Standard)	65.535 (Standard)
Fundierung mit der Google Suche
Funktionsaufrufe
Codeausführung
Implizites Kontext-Caching
Explizites Kontext-Caching
Batch-Vorhersage
Gemini Live API
Feinabstimmung
Latenz
Empfohlenes SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK
Preiseinheiten	Token	Token	Token	Token	Token	Token	Token
Einstellungsdatum	Nicht vor dem 16. Oktober 2026	Nicht vor dem 16. Oktober 2026	Nicht vor dem 16. Oktober 2026

Vor der Migration

Bevor Sie mit der Migration beginnen, sollten Sie Folgendes beachten:

Informationssicherheit (InfoSec), Governance und behördliche Genehmigungen
Verfügbarkeit nach Standort
Preisunterschiede aufgrund von Modalität und Tokenisierung
Bestellungen für bereitgestellten Durchsatz aufgeben oder ändern
Überwachte Feinabstimmung
Regressionstests

InfoSec, Governance und behördliche Genehmigungen

Holen Sie frühzeitig die Genehmigungen von Ihren Informationssicherheits-, Risiko- und Compliance-Teams ein. Berücksichtigen Sie alle spezifischen Risiko- und Compliance-Regeln, insbesondere in regulierten Branchen wie dem Gesundheitswesen und dem Finanzwesen.

Standort-Verfügbarkeit

Google- und Partnermodelle sowie generative KI-Funktionen auf der Gemini Enterprise Agent Platform sind über bestimmte regionale Endpunkte und einen globalen Endpunkt verfügbar. Globale Endpunkte decken die ganze Welt ab und bieten im Vergleich zu einzelnen Regionen eine verbesserte Verfügbarkeit und Zuverlässigkeit.

Die regionale Verfügbarkeit von Endpunkten variiert je nach Modell. Weitere Informationen zu den einzelnen Modellen finden Sie in unserem Leitfaden zu Standorten.

Preisunterschiede aufgrund von Modalität und Tokenisierung

Die Preise variieren je nach Gemini-Modell. Auf unserer Preisseite finden Sie die Kosten für alle Modalitäten (Text, Code, Bilder, Sprache usw.) pro Modell.

Provisioned Throughput-Bestellungen kaufen oder ändern

Bei Bedarf können Sie zusätzlichen bereitgestellten Durchsatz erwerben oder bestehende Bestellungen für bereitgestellten Durchsatz ändern.

Überwachte Feinabstimmung

Die neuesten Gemini-Modelle bieten eine bessere Ausgabequalität. Das kann bedeuten, dass Ihre Anwendung kein feinabgestimmtes Modell mehr benötigt. Wenn Ihre Anwendung überwachte Feinabstimmung mit einem älteren Gemini-Modell verwendet, testen Sie Ihre Anwendung zuerst mit dem neuesten Modell ohne Feinabstimmung und werten Sie die Ergebnisse aus.

Wenn Sie die überwachte Feinabstimmung verwenden, können Sie Ihr vorhandenes optimiertes Modell nicht aus älteren Gemini-Versionen übertragen. Sie müssen einen neuen Tuning-Job für die neue Gemini-Version ausführen.

Beginnen Sie beim Abstimmen eines neuen Gemini-Modells mit den Standardeinstellungen für die Abstimmung. Verwenden Sie keine Hyperparameterwerte aus früheren Gemini-Versionen wieder, da der Abstimmungsdienst für die neuesten Versionen optimiert ist. Wenn Sie alte Einstellungen wiederverwenden, erzielen Sie wahrscheinlich keine optimalen Ergebnisse.

Regressionstests

Wenn Sie auf die aktuelle Gemini-Version umstellen, benötigen Sie drei Haupttypen von Regressionstests:

Code-Regressionstests:Regressionstests aus der Sicht von Softwareentwicklung und Developer Operations (DevOps). Diese Art von Regressionstests ist immer erforderlich.
Regressionstests für die Modellleistung:Regressionstests aus Data-Science- oder Machine-Learning-Perspektive. Das bedeutet, dass die neue Gemini-Modellversion Ausgaben liefert, die mindestens die gleiche Qualität wie die vorherige Version haben.

Leistungsregressionstests für Modelle sind Modellbewertungen, die durchgeführt werden, wenn sich ein System oder das zugrunde liegende Modell ändert. Dazu gehören:
- Offline-Leistungstests:Tests, mit denen die Qualität der Modellausgaben in einer dedizierten Testumgebung anhand verschiedener Qualitätsmesswerte für Modellausgaben überprüft wird.
- Onlinemodell-Leistungstests:Tests, mit denen die Qualität der Modellausgaben in einer Live-Onlinebereitstellung auf der Grundlage von implizitem oder explizitem Nutzerfeedback überprüft wird.
Lasttests:Bei diesen Tests wird geprüft, wie gut die Anwendung mit vielen Anfragen gleichzeitig umgeht. Belastungstests sind für Anwendungen erforderlich, die bereitgestellten Durchsatz verwenden.

Zur neuesten Version migrieren

In den folgenden Abschnitten werden die Schritte für die Migration zur neuesten Gemini-Version beschrieben. Für optimale Ergebnisse sollten Sie die folgenden Schritte in der angegebenen Reihenfolge ausführen.

1. Anforderungen an die Bewertung und das Testen von Dokumentmodellen

Bereiten Sie sich darauf vor, alle relevanten Bewertungen zu wiederholen, die Sie bei der ersten Entwicklung Ihrer Anwendung durchgeführt haben, sowie alle Bewertungen, die seitdem durchgeführt wurden.
Wenn Ihre aktuellen Bewertungen nicht alle Aufgaben abdecken oder messen, die Ihre Anwendung ausführt, sollten Sie weitere Bewertungen konzipieren und vorbereiten. Unser Evaluierungs-Playbook und unsere Evaluierungsrezepte können Ihnen den Einstieg erleichtern.
Wenn Ihre Anwendung RAG, die Verwendung von Tools, komplexe Agent-Workflows oder Prompt-Ketten umfasst, müssen Sie dafür sorgen, dass Ihre vorhandenen Auswertungsdaten eine unabhängige Bewertung jeder Komponente ermöglichen. Falls nicht, sammeln Sie Eingabe-Ausgabe-Beispiele für jede Komponente.
Wenn Ihre Anwendung kritisch ist oder Teil eines größeren nutzerorientierten Echtzeitsystems ist, sollten Sie eine Online-Bewertung einbeziehen.

2. Code aktualisieren und Tests ausführen

Für die Aktualisierung Ihres Codes sind drei Hauptänderungen erforderlich:

Auf das Google Gen AI SDK umstellen
Gemini-Anrufe ändern
Fehlerhafte Codeänderungen beheben

In den folgenden Abschnitten werden diese Änderungen näher erläutert.

Auf das Google Gen AI SDK umstellen

Wenn Ihre Gemini 1.x-Anwendung das Vertex AI SDK verwendet, wechseln Sie zum Gen AI SDK. Weitere Informationen, einschließlich Codebeispielen für ähnliche Aufrufe mit dem Gen AI SDK, finden Sie in unserem Migrationsleitfaden für das Vertex AI SDK. Vertex AI SDK-Releases nach Juni 2026 unterstützen Gemini nicht mehr und neue Gemini-Funktionen sind nur im Gen AI SDK verfügbar.

Wir empfehlen dringend, auf die google-genai SDK-Version 2.0.0 oder höher zu aktualisieren, um alle neuen Funktionen in Gemini 3.5 Flash und späteren Modellen nutzen zu können.

Wenn Sie das Gen AI SDK noch nicht kennen, sehen Sie sich das Notebook Erste Schritte mit der generativen KI von Google und dem Gen AI SDK an.

Gemini-Anrufe ändern

Aktualisieren Sie Ihren Vorhersagecode, um eines der neuesten Gemini-Modelle zu verwenden. Das bedeutet mindestens, dass Sie den Namen des Modellendpunkts ändern müssen.

Die genauen Codeänderungen hängen davon ab, wie Sie Ihre Anwendung erstellt haben, insbesondere davon, ob Sie das Gen AI SDK oder das Vertex AI SDK verwendet haben.

Führen Sie nach dem Ändern des Codes Code-Regressionstests und andere Softwaretests durch, um sicherzustellen, dass der Code wie erwartet funktioniert. In diesem Schritt wird geprüft, ob der Code funktioniert, aber nicht die Qualität der Modellantworten.

Fehlerhafte Codeänderungen beheben

Dynamischer Abruf: Wechseln Sie zur Fundierung mit der Google Suche. Für diese Funktion ist das Gen AI SDK erforderlich. Sie wird vom Vertex AI SDK nicht unterstützt.
Inhaltsfilter: Beachten Sie die Standardeinstellungen für Inhaltsfilter. Ändern Sie Ihren Code, wenn er auf einem Standardwert basiert, der sich geändert hat.
Top-K-Parameter für das Token-Sampling: Bei Modellen nach gemini-1.0-pro-vision wird das Ändern des Top-K-Parameters nicht unterstützt.
Thinking: Bei Gemini 3 Pro und neueren Modellen wird der Parameter thinking_level anstelle von thinking_budget verwendet. Weitere Informationen
Gedankensignaturen: Bei Gemini 3 Pro und späteren Modellen gibt das Modell einen Fehler anstelle einer Warnung zurück, wenn in einem Zug eine Gedankensignatur erwartet wird, aber nicht angegeben ist. Weitere Informationen finden Sie unter Gedankensignaturen.
Media-Auflösung und Tokenisierung: Gemini 3 Pro und neuere Modelle verwenden für die Media-Tokenisierung eine variable Sequenzlänge anstelle von „Pan and Scan“ und haben neue Standardauflösungen und Tokenkosten für Bilder, PDFs und Videos. Weitere Informationen finden Sie unter Bildverständnis und Video-Verständnis.
Nutzungsmetadaten: Bei Gemini 3 Pro und späteren Modellen werden PDF-Tokenanzahlen in usage_metadata unter der Modalität IMAGE anstelle von DOCUMENT gemeldet.
Bildsegmentierung: Die Bildsegmentierung wird von Gemini 3 Pro und neueren Modellen nicht unterstützt.
Multimodale Funktionsantworten: Bei Gemini 3 Pro und späteren Modellen können Sie Bild- und PDF-Daten in Funktionsantworten einfügen. Weitere Informationen
PDF-Verarbeitung: Bei Gemini 3 Pro und späteren Modellen wird OCR bei der Verarbeitung gescannter PDFs nicht standardmäßig verwendet.

Konzentrieren Sie sich in diesem Schritt nur auf Codeänderungen. Möglicherweise müssen Sie später noch weitere Änderungen vornehmen. Warten Sie aber, bis Sie mit der Bewertung beginnen. Nach der Auswertung sollten Sie die folgenden Anpassungen auf Grundlage der Ergebnisse in Betracht ziehen:

Wenn Sie von der dynamischen Abfrage wechseln, müssen Sie möglicherweise Ihre Systemanweisungen anpassen, um zu steuern, wann die Google Suche verwendet wird (z. B. "Only generate queries for the Google Search tool if the user asks about sports. Don't generate queries for any other topic."). Warten Sie jedoch mit dem Ändern von Prompts, bis Sie die Ergebnisse ausgewertet haben.
Wenn Sie den Parameter Top-K verwendet haben, passen Sie andere Parameter für die Token-Stichprobenerhebung an, z. B. Top-P, um ähnliche Ergebnisse zu erhalten.

3. Offline-Evaluierungen durchführen

Wiederholen Sie die Bewertungen, die Sie bei der ersten Entwicklung und Einführung Ihrer Anwendung durchgeführt haben, alle Offline-Bewertungen, die seitdem erfolgt sind, und alle zusätzlichen Bewertungen, die Sie in Schritt 1 ermittelt haben. Wenn Sie der Meinung sind, dass Ihre Bewertung den Anwendungsbereich Ihrer Anwendung nicht vollständig abdeckt, führen Sie weitere Bewertungen durch.

Wenn Sie keine automatisierte Methode zum Ausführen von Offlinebewertungen haben, sollten Sie den Gen AI Evaluation Service verwenden.

Wenn Ihre Anwendung die Feinabstimmung verwendet, führen Sie eine Offline-Bewertung durch, bevor Sie Ihr Modell mit der neuesten Version von Gemini neu abstimmen. Die neuesten Modelle bieten eine verbesserte Ausgabequalität. Das bedeutet, dass Ihre Anwendung möglicherweise kein feinabgestimmtes Modell mehr benötigt.

4. Bewertungsergebnisse analysieren und Prompts und Hyperparameter optimieren

Wenn Ihre Offlinebewertung zeigt, dass Ihre Anwendung weniger effektiv ist, verbessern Sie sie, bis ihre Leistung dem älteren Modell entspricht. So gehts:

Sie verfeinern Ihre Prompts iterativ, um die Leistung zu steigern („Hill Climbing“). Wenn Sie mit Hill Climbing noch nicht vertraut sind, lesen Sie den Onlinekurs zu Vertex Gemini Hill Climbing. Der Gemini Enterprise Agent Platform Prompt Optimizer (Beispiel-Notebook) kann Ihnen ebenfalls helfen.
Wenn Ihre Anwendung von den Breaking Changes für Dynamic Retrieval und Top-K betroffen ist, können Sie versuchen, die Parameter für Prompt und Token-Sampling anzupassen.

5. Lasttests ausführen

Wenn Ihre Anwendung einen bestimmten Mindestdurchsatz benötigt, führen Sie Lasttests durch, um sicherzustellen, dass die aktuelle Version Ihrer Anwendung Ihre Durchsatzanforderungen erfüllt.

Lasttests müssen vor der Onlinebewertung erfolgen, da bei der Onlinebewertung das Modell Live-Traffic ausgesetzt wird. Verwenden Sie für diesen Schritt Ihre vorhandenen Lasttesttools und Instrumentierung.

Wenn Ihre Anwendung bereits die Anforderungen an den Durchsatz erfüllt, sollten Sie Bereitgestellter Durchsatz verwenden. Sie benötigen zusätzlichen kurzfristigen bereitgestellten Durchsatz, um Lasttests durchzuführen, während mit Ihrer aktuellen Bestellung für bereitgestellten Durchsatz Produktions-Traffic verarbeitet wird.

6. (Optional) Online-Bewertungen durchführen

Wechseln Sie erst dann zur Onlinebewertung, wenn Ihre Offlinebewertung eine hohe Gemini-Ausgabequalität zeigt und Ihre Anwendung eine Onlinebewertung erfordert.

Die Onlinebewertung ist eine spezielle Art von Onlinetests. Verwenden Sie die vorhandenen Tools und Methoden Ihrer Organisation für die Online-Bewertung. Beispiel:

Wenn in Ihrer Organisation regelmäßig A/B-Tests durchgeführt werden, führen Sie einen durch, um die aktuelle Version Ihrer Anwendung mit der neuesten Gemini-Version zu vergleichen.
Wenn Ihre Organisation regelmäßig Canary-Bereitstellungen verwendet, sollten Sie sie mit den neuesten Modellen nutzen und Änderungen im Nutzerverhalten messen.

Sie können auch eine Online-Bewertung durchführen, indem Sie Ihrer Anwendung neue Feedback- und Analysefunktionen hinzufügen. Für verschiedene Anwendungen sind unterschiedliche Feedbackmethoden erforderlich. Beispiel:

Wir fügen neben den Modellausgaben Schaltflächen für „Mag ich“ und „Mag ich nicht“ hinzu und vergleichen die Raten zwischen einem älteren Modell und den neuesten Gemini-Modellen.
Nutzern werden Ausgaben des älteren und der neuesten Modelle nebeneinander angezeigt und sie werden gebeten, ihren Favoriten auszuwählen.
Wir erfassen, wie oft Nutzer Ausgaben des alten Modells im Vergleich zu den neuesten Modellen überschreiben oder manuell anpassen.

Für diese Feedbackmethoden ist es oft erforderlich, die aktuelle Gemini-Version neben Ihrer vorhandenen Version auszuführen. Diese parallele Bereitstellung wird manchmal als „Schattenmodus“ oder „Blue-Green-Bereitstellung“ bezeichnet.

Wenn sich die Ergebnisse der Online-Bewertung stark von den Ergebnissen der Offline-Bewertung unterscheiden, werden in Ihrer Offline-Bewertung wichtige Aspekte der Live-Umgebung oder der Nutzererfahrung nicht berücksichtigt. Wenden Sie die Ergebnisse der Online-Bewertung an, um eine neue Offline-Bewertung zu erstellen, die die Lücke abdeckt. Fahren Sie dann mit Schritt 3 fort.

Wenn Sie Bereitgestellten Durchsatz verwenden, müssen Sie möglicherweise zusätzlichen kurzfristigen Bereitgestellten Durchsatz erwerben, um weiterhin die Durchsatzanforderungen für Nutzer in der Onlinebewertung zu erfüllen.

7. Für die Produktion bereitstellen

Wenn die Auswertung ergibt, dass das aktuelle Gemini-Modell genauso gut oder besser als ein älteres Modell funktioniert, ersetzen Sie die vorhandene Anwendungsversion durch die neue Version. Folgen Sie den Standardverfahren Ihrer Organisation für die Produktionsbereitstellung.

Wenn Sie Bereitgestellter Durchsatz verwenden, ändern Sie die Bestellung für den bereitgestellten Durchsatz in das von Ihnen ausgewählte Gemini-Modell. Wenn Sie Ihre Anwendung inkrementell einführen, können Sie kurzfristigen bereitgestellten Durchsatz verwenden, um den Durchsatzbedarf für zwei verschiedene Gemini-Modelle zu decken.

Parameterupdates und Best Practices in Gemini 3.x

Das Folgende gilt für alle Gemini 3.x-Modelle, einschließlich Gemini 3.5 Flash. Sie wurden mit Gemini 3 eingeführt und sind hier zur Erinnerung aufgeführt.

Sampling-Parameter (eingestellt)

temperature, top_p und top_k werden für alle Gemini 3.x-Modelle nicht mehr empfohlen. Das Modell führt selbst Stichproben durch, um optimale Ergebnisse zu erzielen. Entfernen Sie diese Parameter aus allen Anfragen.

Um die Deterministik zu maximieren, empfehlen wir, eine Systemanweisung mit expliziten Regeln für Ihren spezifischen Anwendungsfall zu definieren.

`thinking_budget` (verworfen)

Der numerische Rohparameter thinking_budget wird für alle Gemini 3.x-Modelle nicht mehr empfohlen. Verwenden Sie stattdessen das String-Enum thinking_level.

Funktionsaufrufe: Strikter Abgleich von Antworten

Die API gibt noch keinen Fehler zurück, aber bei nicht übereinstimmenden Antworten gibt das Modell in den meisten Fällen leere Antworten mit finish_reason: STOP zurück. Beachten Sie immer die folgenden Konventionen:

id einfügen: Jede FunctionResponse muss die id aus der entsprechenden FunctionCall enthalten.
name abgleichen: Der name in der Antwort muss mit dem name im Aufruf übereinstimmen.
Anzahl der Übereinstimmungen: Für jede empfangene FunctionCall wird genau ein FunctionResponse zurückgegeben.

Multimodale Funktionsantworten

Wenn Sie multimodale Inhalte (z. B. Bilder) als Reaktion auf einen Funktionsaufruf bereitstellen, fügen Sie die Inhalte innerhalb der Funktionsantwortteile und nicht außerhalb ein. So wird unerwartetes Modellverhalten wie das Durchsickern von Gedanken verhindert.

Inline-Anweisungen mit Funktionsantwort

Wenn Sie zusammen mit Funktionsantworten Plattformanleitungen bereitstellen müssen, hängen Sie sie an das Ende des Funktionsantworttexts an und trennen Sie sie durch zwei Zeilenumbrüche, anstatt sie als separate Teile zu formatieren.

Unnötige Tool-Aufrufe reduzieren

Wenn Sie feststellen, dass Tool-Aufrufe zu häufig erfolgen: 1. Denkstufe reduzieren (medium, low oder minimal). 2. Systemanweisung hinzufügen, um die Toolnutzung einzuschränken (z.B. "You have a limited action budget of <n> tool calls. Use them efficiently.").

Checkliste für die Migration

Von Gemini 3 Flash (Vorabversion)

Modellname aktualisiert: gemini-3-flash-preview → gemini-3.5-flash.
Preise prüfen. Gemini 3.5 Flash ist teurer als Gemini 3 Flash (Vorabversion).
Entfernen Sie temperature, top_p und top_k aus Ihrer Konfiguration.
Ersetzen Sie thinking_budget durch thinking_level.
Fügen Sie allen FunctionResponse-Teilen id und das entsprechende name hinzu.
Prompts testen Der Standardaufwand wurde von high in medium geändert.
Die Funktion zum Speichern von Gedanken ist jetzt standardmäßig aktiviert. Der Kontext der Begründung wird über mehrere Runden hinweg beibehalten.
Reduzieren Sie unnötige Tool-Aufrufe, indem Sie die Denkebene anpassen oder Systemanweisungen hinzufügen.
Die Computerverwendung wird in Gemini 3.5 Flash derzeit nicht unterstützt.
Schleimerei reduzieren: Wenn gemini-3.5-flash Anzeichen von Schleimerei zeigt, können Sie versuchen, dieses Verhalten über die Systemanweisungen zu reduzieren, indem Sie Folgendes hinzufügen: - Keep your responses concise. - Provide a summary of your work when you end your turn. Ground your response in the work you did. Keep your tone professional and avoid overconfident language, bragging, or overclaiming success. - AVOID using superlatives such as "perfectly", "flawlessly", "100% correct", "Summary of Accomplishments" etc. to summarize your work for the user. Be humble. - AVOID over-the-top politeness or complimenting the user excessively. - Format your responses in github-style markdown.

Von Gemini 2.5

PDF- und Dokumentarbeitslasten testen Der Tokenverbrauch für PDFs kann steigen.
Prompts vereinfachen Verwenden Sie stattdessen thinking_level: "medium" oder "high" mit einfacheren Prompts anstelle von komplexen Chain-of-Thought-Prompts.
Kombinierte Verwendung von Tools (Suche, URL-Kontext, Codeausführung, Funktionen)
Multimodale Inhalte in Antwortteilen von Funktionen verschieben.
Hängen Sie Inline-Anweisungen an den Funktionsantworttext an.

Modellleistung verbessern

Beachten Sie bei der Migration die folgenden Tipps, um die optimale Leistung des ausgewählten Gemini-Modells zu erzielen:

Für alle Gemini 3-Modelle sind die Sampling-Parameter (temperature, top_p und top_k) veraltet. Das Modell führt selbst Stichproben durch, um optimale Ergebnisse zu erzielen. Google empfiehlt, diese Parameter aus allen Anfragen zu entfernen.
Prüfen Sie Ihre Systemanweisungen, Prompts und Beispiele für Few-Shot Learning auf Inkonsistenzen, Widersprüche oder irrelevante Anweisungen und Beispiele.
Leistungsstärkeres Modell testen Wenn Sie beispielsweise Gemini 2.0 Flash-Lite getestet haben, probieren Sie Gemini 2.0 Flash aus.
Überprüfen Sie die Ergebnisse der automatischen Bewertung, um sicherzustellen, dass sie mit der menschlichen Bewertung übereinstimmen, insbesondere Ergebnisse, die ein judge-Modell verwenden. Achten Sie darauf, dass die Anweisungen für Ihr Judge-Modell klar, konsistent und eindeutig sind.
Um die Anweisungen für das Judge-Modell zu verbessern, sollten Sie sie von mehreren Personen testen lassen, die unabhängig voneinander arbeiten. Wenn Menschen die Anweisungen unterschiedlich interpretieren und unterschiedliche Bewertungen abgeben, sind die Anweisungen für Ihr Judge-Modell unklar.
Modell-Feinabstimmung
Untersuchen Sie die Ausgaben der Auswertung auf Muster, die auf bestimmte Arten von Fehlern hinweisen. Wenn Sie Fehler nach Modell, Typ oder Kategorie gruppieren, erhalten Sie gezieltere Auswertungsdaten, mit denen sich Prompts leichter anpassen lassen, um diese Fehler zu beheben.
Achten Sie darauf, dass Sie verschiedene generative KI-Komponenten unabhängig voneinander bewerten.
Experimentieren Sie mit der Anpassung der Token-Sampling-Parameter.

Hilfe

Wenn Sie Unterstützung benötigen, bietet Google Cloud Supportpakete für Ihre Anforderungen, etwa Rund-um-die-Uhr-Verfügbarkeit, Telefonsupport und Kontakt mit einem technischen Supportmanager. Weitere Informationen finden Sie unter Google Cloud Support.

Nächste Schritte

Leitfaden

Zur neuesten Version von Gemini migrieren

Welche Änderungen sind zu erwarten?

Aktualisierung der Berichterstellung zur Tokenanzahl

Zu welchem Gemini-Modell sollte ich migrieren?

Vor der Migration

InfoSec, Governance und behördliche Genehmigungen

Standort-Verfügbarkeit

Preisunterschiede aufgrund von Modalität und Tokenisierung

Provisioned Throughput-Bestellungen kaufen oder ändern

Überwachte Feinabstimmung

Regressionstests

Zur neuesten Version migrieren

1. Anforderungen an die Bewertung und das Testen von Dokumentmodellen

2. Code aktualisieren und Tests ausführen

Auf das Google Gen AI SDK umstellen

Gemini-Anrufe ändern

Fehlerhafte Codeänderungen beheben

3. Offline-Evaluierungen durchführen

4. Bewertungsergebnisse analysieren und Prompts und Hyperparameter optimieren

5. Lasttests ausführen

6. (Optional) Online-Bewertungen durchführen

7. Für die Produktion bereitstellen

Parameterupdates und Best Practices in Gemini 3.x

Sampling-Parameter (eingestellt)

`thinking_budget` (verworfen)

Funktionsaufrufe: Strikter Abgleich von Antworten

Multimodale Funktionsantworten

Inline-Anweisungen mit Funktionsantwort

Unnötige Tool-Aufrufe reduzieren

Checkliste für die Migration

Von Gemini 3 Flash (Vorabversion)

Von Gemini 2.5

Modellleistung verbessern

Hilfe

Nächste Schritte

Erste Schritte mit der Agent Platform

Google-Modelle

Partnermodelle

Offene Modelle

Häufig gestellte Fragen

Zur neuesten Version von Gemini migrieren Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Welche Änderungen sind zu erwarten?

Aktualisierung der Berichterstellung zur Tokenanzahl

Zu welchem Gemini-Modell sollte ich migrieren?

Vor der Migration

InfoSec, Governance und behördliche Genehmigungen

Standort-Verfügbarkeit

Preisunterschiede aufgrund von Modalität und Tokenisierung

Provisioned Throughput-Bestellungen kaufen oder ändern

Überwachte Feinabstimmung

Regressionstests

Zur neuesten Version migrieren

1. Anforderungen an die Bewertung und das Testen von Dokumentmodellen

2. Code aktualisieren und Tests ausführen

Auf das Google Gen AI SDK umstellen

Gemini-Anrufe ändern

Fehlerhafte Codeänderungen beheben

3. Offline-Evaluierungen durchführen

4. Bewertungsergebnisse analysieren und Prompts und Hyperparameter optimieren

5. Lasttests ausführen

6. (Optional) Online-Bewertungen durchführen

7. Für die Produktion bereitstellen

Parameterupdates und Best Practices in Gemini 3.x

Sampling-Parameter (eingestellt)

thinking_budget (verworfen)

Funktionsaufrufe: Strikter Abgleich von Antworten

Multimodale Funktionsantworten

Inline-Anweisungen mit Funktionsantwort

Unnötige Tool-Aufrufe reduzieren

Checkliste für die Migration

Von Gemini 3 Flash (Vorabversion)

Von Gemini 2.5

Modellleistung verbessern

Hilfe

Nächste Schritte

Erste Schritte mit der Agent Platform

Google-Modelle

Partnermodelle

Offene Modelle

Häufig gestellte Fragen

Zur neuesten Version von Gemini migrieren

`thinking_budget` (verworfen)