這份文件列出 Gemini for Google Cloud適用的配額和系統限制。
- 「配額」有預設值,但通常可以申請調整。
- 「系統限制」是固定值,無法變更。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
Gemini 資源也有「系統限制」, 而且無法變更。
每秒要求數
Gemini for Google Cloud 會針對專案中每位使用者的每秒要求數強制執行配額。
| 配額 | 值 |
|---|---|
| 每秒要求數 | 2 |
每日要求數
Gemini for Google Cloud 會為專案中每位使用者每天的要求總數設下配額。
| 配額 | 值 |
|---|---|
| Gemini Code Assist 或 Gemini 每日可處理的 BigQuery 程式碼要求數,例如程式碼生成和程式碼完成。 | 6000 |
| 每天可發出聊天、視覺化、資料洞察表格掃描、中繼資料產生、資料準備等要求,以及在 Google Cloud 控制台和 IDE 的「Cloud Assist」面板中顯示回應的其他要求。 | 960 |
Gemini Code Assist 配額
Gemini Code Assist 會對特定功能強制執行配額。
| 配額 | 值 |
|---|---|
| 本機程式碼集認知 | 支援 100 萬個詞元的脈絡窗口 |
| 程式碼自訂存放區 | 20,000 |
Agent 模式和 Gemini CLI 的配額
Gemini Code Assist Agent 模式和 Gemini CLI 的要求配額會合併計算。在代理程式模式下或使用 Gemini CLI 時,一個提示詞可能會產生多個模型要求。
| 配額 | Gemini Code Assist 版本 | 值 |
|---|---|---|
| 每位使用者每分鐘的要求數 | 標準 | 120 |
| Enterprise | 120 | |
| 每位使用者每日的要求數 | 標準 | 1500 |
| Enterprise | 2000 |
GitHub 專用 Gemini Code Assist 的配額
在 GitHub 上使用 Gemini Code Assist 不會計入 Gemini Code Assist 的一般配額。
在 GitHub 上使用 Gemini Code Assist 消費者版時,每天最多可審查 33 項提取要求。
GitHub 上的 Gemini Code Assist 企業版(預先發布版) 使用者每天至少有 100 次提取要求審查配額。
- 提取要求審查的確切次數取決於程式碼集,以及完成每次程式碼審查所需的模型呼叫次數。因此,在某些情況下,配額可能會遠大於 100。
Gemini in BigQuery 的配額
對於程式碼輔助功能,Gemini Code Assist 和 Gemini in BigQuery 的程式碼要求配額相同,適用於程式碼完成和程式碼生成等功能。
如果客戶使用 Gemini in BigQuery,並搭配 BigQuery 隨選運算或 Enterprise/Enterprise Plus 版,系統會根據上一個完整日曆月每日平均掃描的 TiB 數或時段數,提供資料洞察等進階功能配額。這項配額適用於機構層級,且該機構中的所有專案都能使用。配額會無條件進位至最接近的 100 個時段小時用量。
| 每 100 個時數配額 (Enterprise 或 Enterprise Plus 版每日平均用量),或每 TiB 掃描量 (使用隨選運算模型) | 值 |
|---|---|
| 在 Google Cloud 控制台的「Cloud Assist」面板中顯示回覆的聊天、視覺化、表格掃描和其他要求,每日要求次數。 | 5 |
示例:假設某機構預訂了 Enterprise 版本,並以 100 個運算單元做為基準,則每天平均會使用 2,400 個運算單元小時 (100 個運算單元 * 24 小時 = 2,400 個運算單元小時)。因此,他們在下個月會獲得下列每日配額:
- 每天 120 次的對話、視覺化、資料洞察資料表掃描和自動中繼資料生成
如果貴機構目前尚未購買任何 BigQuery Enterprise 版、Enterprise Plus 版運算單元或隨選運算 (TiB),首次使用後,您會在第一個完整曆月收到下列預設配額:
- 每天 250 次的對話、視覺化、資料洞察資料表掃描和自動產生中繼資料
如果您在當月開始使用隨選運算資源、Enterprise 版或 Enterprise Plus 版預留項目,則預設配額會套用至下個月底。
申請提高配額
如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。