Auf dieser Seite finden Sie Voraussetzungen und eine detaillierte Anleitung zur Feinabstimmung von Gemini mithilfe von Dokumentdaten und beaufsichtigtem Lernen.
Anwendungsfälle
Mit der Feinabstimmung können Sie leistungsstarke Sprachmodelle an Ihre spezifischen Anforderungen anpassen. Hier sind einige wichtige Anwendungsfälle, in denen die Leistung eines Modells durch die Feinabstimmung mit Ihren eigenen PDFs erheblich gesteigert werden kann:
- Interne Wissensdatenbank: Wandeln Sie Ihre internen Dokumente in eine KI-basierte Wissensdatenbank um, die sofort Antworten und Statistiken liefert. Ein Vertriebsmitarbeiter könnte beispielsweise sofort auf Produktspezifikationen und Preisdetails aus früheren Schulungsunterlagen zugreifen.
- Rechercheassistent: Erstellen Sie einen Rechercheassistenten, der eine Sammlung von Forschungsarbeiten, Artikeln und Büchern analysieren kann. Ein Forscher, der sich mit dem Klimawandel befasst, könnte schnell wissenschaftliche Artikel analysieren, um Trends beim Anstieg des Meeresspiegels zu identifizieren oder die Wirksamkeit verschiedener Minderungsstrategien zu bewerten.
- Rechtliche oder behördliche Compliance: Durch das Fine-Tuning mit rechtlichen Dokumenten kann die Vertragsprüfung automatisiert werden. Dabei werden potenzielle Unstimmigkeiten oder Risikobereiche gekennzeichnet. So können sich Rechtsexperten auf anspruchsvollere Aufgaben konzentrieren und gleichzeitig die Einhaltung von Vorschriften sicherstellen.
- Automatisierte Berichterstellung: Analysieren Sie komplexe Finanzberichte automatisch, extrahieren Sie wichtige Leistungskennzahlen und erstellen Sie Zusammenfassungen für Stakeholder. Das kann Zeit sparen und das Fehlerrisiko im Vergleich zur manuellen Analyse verringern.
- Inhaltszusammenfassung und ‑analyse: Lange PDF-Dokumente zusammenfassen, wichtige Informationen extrahieren und Trends analysieren. Ein Marktforschungsteam könnte beispielsweise eine Sammlung von Kundenumfragen analysieren, um wichtige Themen und die Stimmung zu ermitteln.
- Dokumentvergleich und Versionskontrolle: Vergleichen Sie verschiedene Versionen eines Dokuments, um Änderungen zu erkennen und Überarbeitungen nachzuverfolgen. Das kann besonders in Umgebungen mit mehreren Autoren nützlich sein.
Beschränkungen
Gemini 2.5-Modelle
Spezifikation | Wert |
---|---|
Maximale Anzahl von PDF-Seiten pro Beispiel | 300 |
Maximale Anzahl von PDF-Dateien pro Beispiel | 4 |
Maximale Größe der PDF-Datei | 20 MB |
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
Spezifikation | Wert |
---|---|
Maximale Anzahl von PDF-Seiten pro Beispiel | 300 |
Maximale Anzahl von PDF-Dateien pro Beispiel | 4 |
Maximale Größe der PDF-Datei | 20 MB |
Weitere Informationen zu den Anforderungen an die Dokumentenanalyse finden Sie unter Dokumentenanalyse.
Dataset-Format
Der fileUri
für Ihr Dataset kann der URI für eine Datei in einem Cloud Storage-Bucket oder eine öffentlich verfügbare HTTP- oder HTTPS-URL sein.
Ein Beispiel für das generische Format finden Sie unter Dataset-Beispiel für Gemini.
Das folgende Beispiel zeigt ein Dokument-Dataset.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
Nächste Schritte
- Weitere Informationen zur Dokumentenanalyse durch Gemini-Modelle finden Sie in der Übersicht zur Dokumentenanalyse.
- Weitere Informationen finden Sie unter Gemini-Modelle mithilfe der überwachten Feinabstimmung abstimmen.
- Informationen dazu, wie die überwachte Feinabstimmung in einer Lösung verwendet werden kann, die eine Wissensdatenbank für generative KI erstellt, finden Sie unter Schnellstartlösung: Wissensdatenbank für generative KI.