ドキュメントのチューニング

このページでは、教師あり学習を使用してドキュメント データで Gemini モデルをファインチューニングするための前提条件と詳細な手順について説明します。

ユースケース

ファインチューニングによって、パワフルな言語モデルを特定のニーズに合わせてカスタマイズできます。独自の PDF セットでファインチューニングすることでモデルのパフォーマンスを大幅に向上させることができる主なユースケースは次のとおりです。

  • 社内ナレッジベース: 社内ドキュメントを、 即時に回答と分析情報を提供する AI 搭載ナレッジベースに変換します。たとえば、営業担当者は過去のトレーニング資料から商品の仕様や価格の詳細に即座にアクセスできます。
  • リサーチ アシスタント: 研究論文、記事、書籍のコレクションを分析できるリサーチ アシスタントを作成します。気候変動を調査している研究者は、科学論文を迅速に分析して海面上昇の傾向を特定したり、さまざまな緩和戦略の効果を評価したりできます。
  • 法令や規制の遵守: 法律文書をファインチューニングすることで、契約書の審査を自動化し、潜在的な不整合やリスクのある箇所にフラグを立てることができます。これにより、法務担当者はコンプライアンスを確保しながら、より高度なタスクに集中できます。
  • レポートの自動生成: 複雑な財務 レポートの分析を自動化し、重要業績評価指標を抽出して関係者向けの 要約を生成します。これにより、手動分析と比較して時間を節約し、エラーのリスクを軽減できます。
  • コンテンツの要約と分析: 長い PDF ドキュメントを要約し、 重要な分析情報を抽出してトレンドを分析します。たとえば、市場調査チームは顧客アンケートのコレクションを分析して、重要なテーマと感情を特定できます。
  • ドキュメントの比較とバージョン管理: ドキュメントの異なるバージョンを比較して変更箇所を特定し、リビジョンを追跡します。これは、1 つのドキュメントに複数の作成者が貢献するコラボレーション環境で特に便利です。

制限事項

データセットに PDF を含める場合の制限事項は次のとおりです。

  • 例あたりの PDF ページの最大数: 300
  • 例あたりの PDF ファイルの最大数: 4
  • PDF ファイルの最大サイズ: 20 MB

ドキュメントの理解の要件について詳しくは、ドキュメントの理解をご覧ください。

データセットのフォーマット

データセットの fileUri は、Cloud Storage バケット内のファイルの URI にすることも、一般公開されている HTTP または HTTPS URL にすることもできます。

汎用形式の例については、Gemini のデータセットの例をご覧ください。

ドキュメント データセットの例を次に示します。

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

(Gemini 3 以降のモデルのみ)Gemini 3 モデル以降では、個々のメディア メディアの解像度を設定することもできますPart。 これにより、データセット内の解像度を混在させることができます(たとえば、あるアイテムに MEDIA_RESOLUTION_HIGH を設定し、別のアイテムに MEDIA_RESOLUTION_LOW を設定するなど)。

Part レベルのメディア解像度設定は、グローバル設定よりも優先されます。

特定のメディアのメディア Part を指定しない場合、デフォルト値はサービング側のデフォルトと同じになります。パートレベルの 解像度と対応するトークン数の詳細については、メディアの 解像度をご覧ください。

次のデータセットの例では、Part レベルとグローバル レベルの両方でメディアの解像度を設定しています。

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
          }
        },
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://<path to another PDF>"
          },
          "mediaResolution": {
            "level": "MEDIA_RESOLUTION_HIGH"
          }
        },
        {
          "text": "Describe these documents in detail."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "PDF 1 is low resolution while PDF 2 is sharp and clear"
        }
      ]
    }
  ],
  "generationConfig": {
    "mediaResolution": "MEDIA_RESOLUTION_LOW"
  }
}

次のステップ