配额和限制

本文档列出了适用于 Gemini for Google Cloud的配额和系统限制。

  • 配额具有默认值,但您通常可以申请 调整。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用多少Google Cloud 资源。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级别应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

如需了解详情,请参阅 Cloud 配额概览

Gemini 资源也有系统限制。系统限制不能更改。

每秒请求数

Gemini for Google Cloud 会对项目中每位用户每秒的请求数施加配额。

配额
每秒请求数 2

每日请求数

Gemini for Google Cloud 会对项目中每位用户每天的请求总数实施配额。

配额
每天针对 Gemini Code Assist 或 Gemini in BigQuery 代码请求(例如代码生成和代码补全)的请求数。 6000
在 Google Cloud 控制台和 IDE 的 Cloud Assist 面板中显示回答的对话、可视化、数据分析洞见表格扫描、元数据生成、数据准备以及其他请求的每日请求数。 960

Gemini Code Assist 配额

Gemini Code Assist 会对某些功能强制执行配额。

配额
本地代码库感知 100 万个 token 的上下文窗口
代码自定义代码库 20,000

代理模式和 Gemini CLI 的配额

Gemini Code Assist 代理模式和 Gemini CLI 的请求配额会合并计算。在代理模式下或使用 Gemini CLI 时,一个提示可能会生成多个模型请求。 请求会受到每用户每分钟的限制,并且在需求量较高时,请求会受到服务可用性的限制。这些每日请求限制会汇总到与 Gemini CLI 或代理模式搭配使用的任何模型版本或系列(例如 Pro、Flash)的所有互动中。达到每日请求数上限后,在配额重置之前,无法通过这些界面向任何模型发出更多请求。

Quota Gemini Code Assist 版本
每位用户每天的请求数上限 标准版 1500
企业 2000

Gemini Code Assist on GitHub 的配额

Gemini Code Assist on GitHub 的用量不会计入 Gemini Code Assist 的常规配额。

  • 个人用户版 Gemini Code Assist on GitHub 应用的安装每天有 33 次拉取请求审核的配额。

  • 企业版 Gemini Code Assist on GitHub 应用 (预览版)安装每天至少有 100 次拉取请求审核的配额。

    • 拉取请求审核的具体次数取决于代码库以及完成每次代码审核所需的模型调用次数。因此,在某些情况下,配额可能会远高于 100。

Gemini Code Assist on GitHub 配额会与 配额重置保持一致 Google Cloud

申请增加配额

如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅 申请配额调整