Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

文件調整

本頁面提供先決條件和詳細操作說明，說明如何使用監督式學習，根據文件資料微調 Gemini 模型。

用途

微調功能可讓您根據特定需求，自訂強大的語言模型。以下列舉幾個主要用途，您可使用自己的 PDF 檔案集微調模型，大幅提升模型效能：

內部知識庫：將內部文件轉換為 AI 輔助知識庫，提供即時答案和洞察資訊。舉例來說，業務代表可以立即從先前的訓練教材中，存取產品規格和價格詳細資料。
研究助理：建立研究助理，分析一系列研究論文、文章和書籍。研究氣候變遷的研究人員可以快速分析科學論文，找出海平面上升的趨勢，或評估不同減緩策略的成效。
法律或法規遵循：針對法律文件進行微調，有助於自動審查合約，標示潛在的不一致或風險領域。讓法律專業人員專注於更高層次的工作，同時確保法規遵循。
自動生成報表：自動分析複雜的財務報表、擷取主要成效指標，並為利害關係人生成摘要。與手動分析相比，這項功能可節省時間並降低錯誤風險。
內容摘要和分析：摘要長篇 PDF 文件、擷取重要洞察資訊，以及分析趨勢。舉例來說，市場研究團隊可以分析一系列顧客問卷調查，找出主要主題和情緒。
文件比較和版本管控：比較不同版本的文件，找出變更內容並追蹤修訂項目。如果多位作者共同編輯文件，這項功能就特別實用。

限制

在資料集中加入 PDF 時，有下列限制：

每個範例的 PDF 頁數上限：300
每個範例的 PDF 檔案數上限：4 個
PDF 檔案大小上限：20 MB

如要進一步瞭解文件理解功能的需求條件，請參閱「文件理解」。

資料集格式

資料集的 fileUri 可以是 Cloud Storage 值區中檔案的 URI，也可以是公開的 HTTP 或 HTTPS 網址。

如要查看一般格式範例，請參閱「Gemini 的資料集範例」。

以下是文件資料集的範例。

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

(僅限 Gemini 3 以上版本) 從 Gemini 3 模型開始，你也可以為個別媒體設定媒體解析度Part。這項功能可讓你在資料集中混合使用解析度 (例如，為一個項目設定 MEDIA_RESOLUTION_HIGH，為另一個項目設定 MEDIA_RESOLUTION_LOW)。

Part 層級的媒體解析度設定會優先於全域設定。

如果未指定特定媒體的媒體 Part，預設值會與放送端預設值相同。如要進一步瞭解零件層級解析度和對應的權杖計數，請參閱「媒體解析度」。

以下範例資料集會在 Part 和全域層級設定媒體解析度：

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
          }
        },
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://<path to another PDF>"
          },
          "mediaResolution": {
            "level": "MEDIA_RESOLUTION_HIGH"
          }
        },
        {
          "text": "Describe these documents in detail."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "PDF 1 is low resolution while PDF 2 is sharp and clear"
        }
      ]
    }
  ],
  "generationConfig": {
    "mediaResolution": "MEDIA_RESOLUTION_LOW"
  }
}

後續步驟

如要進一步瞭解 Gemini 模型的文件理解功能，請參閱「文件理解」總覽。
如要開始調整，請參閱「使用監督式微調功能調整 Gemini 模型」一文。
如要瞭解如何透過監督式微調，建構生成式 AI 知識庫解決方案，請參閱「快速部署解決方案：生成式 AI 知識庫」。

文件調整 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

用途

限制

資料集格式

後續步驟

文件調整