이 문서에서는 Gemini for Google Cloud에 적용되는 할당량과 시스템 한도를 설명합니다.
- 할당량 에는 기본값이 있지만 일반적으로 조정을 요청할 수 있습니다.
- 시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량값 변경을 요청하고 할당량 조정을 자동화하는 방법 제공
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
자세한 내용은 Cloud Quotas 개요를 참고하세요.
Gemini 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.
초당 요청 수
Gemini for Google Cloud 는 프로젝트에 있는 각 사용자의 초당 요청에 할당량을 적용합니다.
| 할당량 | 값 |
|---|---|
| 초당 요청 수 | 2 |
일일 요청 수
Gemini for Google Cloud 는 프로젝트의 사용자마다 일일 요청 총개수에 대한 할당량을 적용합니다.
| 할당량 | 값 |
|---|---|
| 코드 생성 및 코드 완성과 같은 Gemini Code Assist 또는 BigQuery의 Gemini 코드 요청에 대한 일일 요청 수입니다. | 6000 |
| Google Cloud 콘솔 및 IDE의 Cloud Assist 패널에 응답을 표시하는 채팅, 시각화, 데이터 인사이트 표 스캔, 메타데이터 생성, 데이터 준비, 기타 요청에 대한 일일 요청 수입니다. | 960 |
Gemini Code Assist 할당량
Gemini Code Assist는 특정 기능에 할당량을 적용합니다.
| 할당량 | 값 |
|---|---|
| 로컬 코드베이스 인식 | 토큰 컨텍스트 윈도우 1,000,000개 |
| 코드 맞춤설정 저장소 | 20,000 |
에이전트 모드 및 Gemini CLI 할당량
Gemini Code Assist 에이전트 모드 및 Gemini CLI의 요청 할당량은 합산됩니다. 에이전트 모드이거나 Gemini CLI를 사용하는 경우 하나의 프롬프트로 인해 여러 모델 요청이 발생할 수 있습니다. 요청은 사용자당 분당으로 제한되며 수요가 많은 시간대에 서비스 가용성에 따라 달라집니다. 이러한 일일 요청 한도는 Gemini CLI 또는 에이전트 모드에서 사용되는 모든 모델 버전 또는 제품군 (예: Pro, Flash)과의 모든 상호작용에서 집계됩니다. 일일 최대 요청 수에 도달하면 할당량이 재설정될 때까지 이러한 인터페이스를 통해 모델에 추가 요청을 할 수 없습니다.
| Quota | Gemini Code Assist 버전 | 값 |
|---|---|---|
| 사용자당 일일 최대 요청 수 | 표준 | 1500 |
| Enterprise | 2000 |
GitHub의 Gemini Code Assist 할당량
GitHub의 Gemini Code Assist 사용량 은 Gemini Code Assist의 일반 할당량에 포함되지 않습니다.
GitHub의 Gemini Code Assist 앱 소비자 버전 설치에는 일일 33개의 pull 요청 검토 할당량이 있습니다.
GitHub의 Gemini Code Assist 앱 엔터프라이즈 버전(프리뷰)의 설치에는 일일 최소 100개의 pull 요청 검토 할당량이 있습니다.
- 정확한 pull 요청 검토 수는 코드베이스와 각 코드 검토를 완료하는 데 필요한 모델 호출 수에 따라 다릅니다. 따라서 경우에 따라 할당량이 100보다 훨씬 클 수 있습니다.
GitHub의 Gemini Code Assist 할당량은 할당량 재설정과 Google Cloud 일치하여 재설정됩니다.
할당량 상향 조정 요청
대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다. 자세한 내용은 할당량 조정 요청을 참조하세요.