配額與限制

這份文件列出 Gemini for Google Cloud適用的配額和系統限制。

  • 「配額」有預設值,但通常可以申請調整。
  • 「系統限制」是固定值,無法變更。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Gemini 資源也有「系統限制」, 而且無法變更。

每秒要求數

Gemini for Google Cloud 會針對專案中每位使用者的每秒要求數強制執行配額。

配額
每秒要求數 2

每日要求數

Gemini for Google Cloud 會為專案中每位使用者每天的要求總數設下配額。

配額
Gemini Code Assist 或 Gemini 每日可處理的 BigQuery 程式碼要求數,例如程式碼生成和程式碼完成。 6000
每天可發出聊天、視覺化、資料洞察表格掃描、中繼資料產生、資料準備等要求,以及在 Google Cloud 控制台和 IDE 的「Cloud Assist」面板中顯示回應的其他要求。 960

Gemini Code Assist 配額

Gemini Code Assist 會對特定功能強制執行配額。

配額
本機程式碼集認知 支援 100 萬個詞元的脈絡窗口
程式碼自訂存放區 20,000

Agent 模式和 Gemini CLI 的配額

Gemini Code Assist Agent 模式和 Gemini CLI 的要求配額會合併計算。在代理程式模式下或使用 Gemini CLI 時,一個提示詞可能會產生多個模型要求。

配額 Gemini Code Assist 版本
每位使用者每分鐘的要求數 標準 120
Enterprise 120
每位使用者每日的要求數 標準 1500
Enterprise 2000

GitHub 專用 Gemini Code Assist 的配額

在 GitHub 上使用 Gemini Code Assist 不會計入 Gemini Code Assist 的一般配額。

  • 在 GitHub 上使用 Gemini Code Assist 消費者版時,每天最多可審查 33 項提取要求。

  • GitHub 上的 Gemini Code Assist 企業版(預先發布版) 使用者每天至少有 100 次提取要求審查配額。

    • 提取要求審查的確切次數取決於程式碼集,以及完成每次程式碼審查所需的模型呼叫次數。因此,在某些情況下,配額可能會遠大於 100。

Gemini in BigQuery 的配額

對於程式碼輔助功能,Gemini Code Assist 和 Gemini in BigQuery 的程式碼要求配額相同,適用於程式碼完成和程式碼生成等功能。

如果客戶使用 Gemini in BigQuery,並搭配 BigQuery 隨選運算或 Enterprise/Enterprise Plus 版,系統會根據上一個完整日曆月每日平均掃描的 TiB 數或時段數,提供資料洞察等進階功能配額。這項配額適用於機構層級,且該機構中的所有專案都能使用。配額會無條件進位至最接近的 100 個時段小時用量。

每 100 個時數配額 (Enterprise 或 Enterprise Plus 版每日平均用量),或每 TiB 掃描量 (使用隨選運算模型)
在 Google Cloud 控制台的「Cloud Assist」面板中顯示回覆的聊天、視覺化、表格掃描和其他要求,每日要求次數。 5

示例:假設某機構預訂了 Enterprise 版本,並以 100 個運算單元做為基準,則每天平均會使用 2,400 個運算單元小時 (100 個運算單元 * 24 小時 = 2,400 個運算單元小時)。因此,他們在下個月會獲得下列每日配額:

  • 每天 120 次的對話、視覺化、資料洞察資料表掃描和自動中繼資料生成

如果貴機構目前尚未購買任何 BigQuery Enterprise 版、Enterprise Plus 版運算單元或隨選運算 (TiB),首次使用後,您會在第一個完整曆月收到下列預設配額:

  • 每天 250 次的對話、視覺化、資料洞察資料表掃描和自動產生中繼資料

如果您在當月開始使用隨選運算資源、Enterprise 版或 Enterprise Plus 版預留項目,則預設配額會套用至下個月底。

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。