Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

選擇文件處理函式

本文比較 BigQuery ML 提供的文件處理函式，包括 AI.GENERATE_TEXT 和 ML.PROCESS_DOCUMENT。如果函式的功能重疊，您可以參考本文資訊，決定要使用哪個函式。

這兩項函式的主要差異如下：

AI.GENERATE_TEXT 是執行自然語言處理 (NLP) 工作的理想選擇，因為部分內容位於文件中。這項功能具備下列優點：
- 降低費用
- 支援更多語言
- 處理量更高
- 模型調整功能
- 多模態模型適用情形
如要查看最適合採用這種做法的文件處理工作範例，請參閱「透過 Gemini API 探索文件處理功能」。
ML.PROCESS_DOCUMENT 適合執行需要剖析文件和預先定義結構化回應的文件處理工作。

函式比較

請參閱下表，比較 AI.GENERATE_TEXT 和 ML.PROCESS_DOCUMENT 函式：

	`AI.GENERATE_TEXT`	`ML.PROCESS_DOCUMENT`
目的	將提示傳遞至 Gemini 或合作夥伴模型，或是開放式模型，即可執行任何文件相關的 NLP 工作。舉例來說，如果提供公司的財務文件，您可以透過 `What is the quarterly revenue for each division?` 等提示擷取文件資訊。	使用 Document AI API 針對不同文件類型 (例如發票、稅務表單和財務報表) 執行專門的文件處理作業。您也可以執行文件分塊。
帳單	系統會針對處理的資料收取 BigQuery ML 費用。詳情請參閱 BigQuery ML 定價。模型呼叫會產生 Gemini Enterprise Agent Platform 費用。如果使用 Gemini 2.0 以上版本，系統會按照批次 API 費率計費。詳情請參閱「Agent Platform 中建構及部署 AI 模型的成本」。	系統會針對處理的資料收取 BigQuery ML 費用。詳情請參閱 BigQuery ML 定價。呼叫 Document AI API 時會產生費用。詳情請參閱 Document AI API 定價。
每分鐘要求數 (RPM)	不適用於 Gemini 模型。合作夥伴模型：25 到 60。詳情請參閱「每分鐘要求次數限制」。	每種處理器類型每分鐘 120 次，每個專案每分鐘最多 600 次。詳情請參閱配額清單。
每分鐘權杖數	範圍從 8,192 到超過 100 萬，視使用的模型而定。	沒有詞元限制。不過，這項功能有不同的頁面限制，取決於您使用的處理器。詳情請參閱「限制」。
監督式調整	受監護微調適用於部分模型。	不支援。
支援的語言	支援的語言會因您選擇的 LLM 而異。	語言支援取決於文件處理器類型，大多數只支援英文。詳情請參閱處理器清單。
支援的地區	支援所有 Generative AI for Agent Platform 區域。	所有處理器都支援 `EU` 和 `US` 多區域。部分處理器也適用於特定單一區域。詳情請參閱「區域和多區域支援」。