Dokumentoptimierung

Auf dieser Seite finden Sie Voraussetzungen und eine detaillierte Anleitung zur Feinabstimmung von Gemini mithilfe von Dokumentdaten und beaufsichtigtem Lernen.

Anwendungsfälle

Mit der Feinabstimmung können Sie leistungsstarke Sprachmodelle an Ihre spezifischen Anforderungen anpassen. Hier sind einige wichtige Anwendungsfälle, in denen die Leistung eines Modells durch die Feinabstimmung mit Ihren eigenen PDFs erheblich gesteigert werden kann:

  • Interne Wissensdatenbank: Wandeln Sie Ihre internen Dokumente in eine KI-basierte Wissensdatenbank um, die sofort Antworten und Statistiken liefert. Ein Vertriebsmitarbeiter könnte beispielsweise sofort auf Produktspezifikationen und Preisdetails aus früheren Schulungsunterlagen zugreifen.
  • Rechercheassistent: Erstellen Sie einen Rechercheassistenten, der eine Sammlung von Forschungsarbeiten, Artikeln und Büchern analysieren kann. Ein Forscher, der sich mit dem Klimawandel befasst, könnte schnell wissenschaftliche Artikel analysieren, um Trends beim Anstieg des Meeresspiegels zu identifizieren oder die Wirksamkeit verschiedener Minderungsstrategien zu bewerten.
  • Rechtliche oder behördliche Compliance: Durch das Fine-Tuning mit rechtlichen Dokumenten kann die Vertragsprüfung automatisiert werden. Dabei werden potenzielle Unstimmigkeiten oder Risikobereiche gekennzeichnet. So können sich Rechtsexperten auf anspruchsvollere Aufgaben konzentrieren und gleichzeitig die Einhaltung von Vorschriften sicherstellen.
  • Automatisierte Berichterstellung: Analysieren Sie komplexe Finanzberichte automatisch, extrahieren Sie wichtige Leistungskennzahlen und erstellen Sie Zusammenfassungen für Stakeholder. Das kann Zeit sparen und das Fehlerrisiko im Vergleich zur manuellen Analyse verringern.
  • Inhaltszusammenfassung und ‑analyse: Lange PDF-Dokumente zusammenfassen, wichtige Informationen extrahieren und Trends analysieren. Ein Marktforschungsteam könnte beispielsweise eine Sammlung von Kundenumfragen analysieren, um wichtige Themen und die Stimmung zu ermitteln.
  • Dokumentvergleich und Versionskontrolle: Vergleichen Sie verschiedene Versionen eines Dokuments, um Änderungen zu erkennen und Überarbeitungen nachzuverfolgen. Das kann besonders in Umgebungen mit mehreren Autoren nützlich sein.

Beschränkungen

Gemini 2.5-Modelle

Spezifikation Wert
Maximale Anzahl von PDF-Seiten pro Beispiel 300
Maximale Anzahl von PDF-Dateien pro Beispiel 4
Maximale Größe der PDF-Datei 20 MB

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Spezifikation Wert
Maximale Anzahl von PDF-Seiten pro Beispiel 300
Maximale Anzahl von PDF-Dateien pro Beispiel 4
Maximale Größe der PDF-Datei 20 MB

Weitere Informationen zu den Anforderungen an die Dokumentenanalyse finden Sie unter Dokumentenanalyse.

Dataset-Format

Der fileUri für Ihr Dataset kann der URI für eine Datei in einem Cloud Storage-Bucket oder eine öffentlich verfügbare HTTP- oder HTTPS-URL sein.

Ein Beispiel für das generische Format finden Sie unter Dataset-Beispiel für Gemini.

Das folgende Beispiel zeigt ein Dokument-Dataset.

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

Nächste Schritte