配額與限制

這份文件列出 Gemini for Google Cloud適用的配額和系統限制。

  • 「配額」有預設值,但通常可以申請調整。
  • 「系統限制」是固定值,無法變更。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Gemini 資源也有「系統限制」,而且無法變更。

每秒要求數

Gemini for Google Cloud 會對專案中每位使用者的每秒要求數強制執行配額。

配額
每秒要求數 2

每日要求數

Gemini for Google Cloud 會為專案中每位使用者每天的要求總數設下配額。

配額
Gemini Code Assist 或 Gemini in BigQuery 程式碼要求 (例如程式碼生成和程式碼完成) 的每日要求數。 6000
每天可發出聊天、視覺化、資料洞察表格掃描、中繼資料產生、資料準備,以及其他要求 (這些要求的回應會顯示在 Google Cloud 控制台和 IDE 的「Cloud Assist」面板中)。 960

Gemini Code Assist 配額

Gemini Code Assist 會對特定功能強制執行配額。

配額
本機程式碼集認知 支援 100 萬個詞元的脈絡窗口
程式碼自訂存放區 20,000

Agent 模式和 Gemini CLI 的配額

Gemini Code Assist Agent 模式和 Gemini CLI 的要求配額會合併計算。在代理程式模式下或使用 Gemini CLI 時,一個提示可能會產生多個模型要求。

配額 Gemini Code Assist 版本
每位使用者每分鐘的要求數 標準 120
Enterprise 120
每位使用者每日的要求數 標準 1500
Enterprise 2000

GitHub 專用 Gemini Code Assist 的配額

GitHub 專用 Gemini Code Assist 的使用量不會計入 Gemini Code Assist 的一般配額。

  • 在 GitHub 上使用 Gemini Code Assist 消費者版時,每天最多可審查 33 個提取要求。

  • GitHub 專用 Gemini Code Assist 企業版(預先發布版) 的使用者每天至少有 100 次提取要求審查配額。

    • 提取要求審查的確切次數取決於程式碼集,以及完成每次程式碼審查所需的模型呼叫次數。因此,在某些情況下,配額可能會遠大於 100。

Gemini in BigQuery

如要瞭解 Gemini in BigQuery 限制,請參閱 BigQuery 的「配額與限制」一文。

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。