Auf dieser Seite finden Sie Voraussetzungen und eine detaillierte Anleitung zur Feinabstimmung von Gemini-Modellen mithilfe von Dokumentdaten und beaufsichtigtem Lernen.
Anwendungsfälle
Mit der Feinabstimmung können Sie leistungsstarke Sprachmodelle an Ihre spezifischen Anforderungen anpassen. Hier sind einige wichtige Anwendungsfälle, in denen die Leistung eines Modells durch die Feinabstimmung mit Ihren eigenen PDFs erheblich gesteigert werden kann:
- Interne Wissensdatenbank: Wandeln Sie Ihre internen Dokumente in eine KI-basierte Wissensdatenbank um, die sofort Antworten und Statistiken liefert. So kann ein Vertriebsmitarbeiter beispielsweise sofort auf Produktspezifikationen und Preisdetails aus früheren Schulungsmaterialien zugreifen.
- Recherche-Assistent: Erstellen Sie einen Recherche-Assistenten, der in der Lage ist, eine Sammlung von Forschungsarbeiten, Artikeln und Büchern zu analysieren. Ein Forscher, der sich mit dem Klimawandel befasst, könnte schnell wissenschaftliche Artikel analysieren, um Trends beim Anstieg des Meeresspiegels zu identifizieren oder die Wirksamkeit verschiedener Minderungsstrategien zu bewerten.
- Rechtliche oder Einhaltung regulatorischer Anforderungen: Durch das Fine-Tuning anhand von Rechtsdokumenten kann die Vertragsprüfung automatisiert werden. Dabei werden potenzielle Unstimmigkeiten oder Risikobereiche gekennzeichnet. So können sich Rechtsexperten auf anspruchsvollere Aufgaben konzentrieren und gleichzeitig die Compliance sicherstellen.
- Automatisierte Berichterstellung: Komplexe Finanzberichte lassen sich automatisch analysieren, wichtige Leistungskennzahlen extrahieren und Zusammenfassungen für Stakeholder erstellen. Das kann Zeit sparen und das Fehlerrisiko im Vergleich zur manuellen Analyse verringern.
- Inhaltszusammenfassung und ‑analyse: Lange PDF-Dokumente zusammenfassen, wichtige Informationen extrahieren und Trends analysieren. Ein Marktforschungsteam könnte beispielsweise eine Sammlung von Kundenumfragen analysieren, um wichtige Themen und die Stimmung zu ermitteln.
- Dokumentvergleich und Versionsverwaltung: Vergleichen Sie verschiedene Versionen eines Dokuments, um Änderungen zu erkennen und Überarbeitungen nachzuverfolgen. Das kann besonders in Umgebungen mit mehreren Autoren nützlich sein.
Beschränkungen
Wenn Sie PDFs in Ihr Dataset aufnehmen, gelten die folgenden Einschränkungen:
- Maximale Anzahl von PDF-Seiten pro Beispiel: 300
- Maximale Anzahl von PDF-Dateien pro Beispiel: 4
- Maximale Größe der PDF-Datei: 20 MB
Weitere Informationen zu den Anforderungen an die Dokumentenanalyse finden Sie unter Dokumentenanalyse.
Dataset-Format
Der fileUri für Ihr Dataset kann der URI für eine Datei in einem Cloud Storage-Bucket oder eine öffentlich verfügbare HTTP- oder HTTPS-URL sein.
Ein Beispiel für das generische Format finden Sie unter Dataset-Beispiel für Gemini.
Das folgende Beispiel zeigt ein Dokument-Dataset.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
(Nur Gemini 3 und höher) Ab den Gemini 3-Modellen können Sie auch die Media-Auflösung für einzelne Media-Elemente festlegenPart.
So können Sie Auflösungen in Ihrem Dataset kombinieren, indem Sie beispielsweise MEDIA_RESOLUTION_HIGH für ein Element und MEDIA_RESOLUTION_LOW für ein anderes festlegen.
Einstellungen für die Medienauflösung auf Part-Ebene haben Vorrang vor globalen Einstellungen.
Wenn Sie für ein bestimmtes Media-Element kein Part angeben, entspricht der Standardwert den Standardwerten für die Bereitstellung. Weitere Informationen zur Auflösung auf Teilebene und zur entsprechenden Anzahl von Tokens finden Sie unter Media-Auflösung.
Das folgende Beispiel-Dataset legt die Media-Auflösung sowohl auf Part- als auch auf globaler Ebene fest:
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://<path to another PDF>"
},
"mediaResolution": {
"level": "MEDIA_RESOLUTION_HIGH"
}
},
{
"text": "Describe these documents in detail."
}
]
},
{
"role": "model",
"parts": [
{
"text": "PDF 1 is low resolution while PDF 2 is sharp and clear"
}
]
}
],
"generationConfig": {
"mediaResolution": "MEDIA_RESOLUTION_LOW"
}
}
Nächste Schritte
- Weitere Informationen zur Dokumentenanalyse durch Gemini-Modelle finden Sie in der Übersicht zur Dokumentenanalyse.
- Weitere Informationen finden Sie unter Gemini-Modelle mithilfe der überwachten Feinabstimmung abstimmen.
- Informationen dazu, wie die überwachte Feinabstimmung in einer Lösung verwendet werden kann, die eine Wissensdatenbank für generative KI erstellt, finden Sie unter Schnellstartlösung: Wissensdatenbank für generative KI.