이 문서에서는 Gemini Enterprise의 할당량과 시스템 한도를 설명합니다. 시스템 한도는 변경할 수 없는 고정 값입니다. 다른 서비스와 달리 Gemini Enterprise 할당량은 수동 증가 요청이 필요하지 않습니다. Google Cloud할당량은 구매한 라이선스 또는 좌석 수에 따라 자동으로 조정됩니다.
Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량값 변경을 요청하고 할당량 조정을 자동화하는 방법 제공
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
자세한 내용은 Cloud Quotas 개요를 참고하세요.
Gemini Enterprise 리소스에도 시스템 한도 가 있습니다. 한도는 변경할 수 없습니다.
Gemini Enterprise의 초과분 가격 책정에 대한 자세한 내용은 할당량 및 초과분을 참고하세요.
배정 할당량
다음 표에서는 Discovery Engine API의 할당량을 보여줍니다. 이러한 할당량은 시간이 지나도 재설정되지 않습니다. 대신 리소스를 해제할 때 해제됩니다.
| Quota | 값 |
|---|---|
| 프로젝트당 총 데이터 스토어 수 | 1001 |
| 프로젝트당 총 엔진 수 | 1502 |
| 위치별 프로젝트당 리전별 데이터 스토어 수 (전역, 미국, EU) | 100 |
| 위치별 프로젝트당 리전별 문서 수 (전역, 미국, EU) | 10,000,000 |
| 위치별 프로젝트당 리전별 엔진 수 (전역, 미국, EU) | 150 |
1 기술적 제한으로 인해 데이터 스토어의 최대 할당량은
500개입니다. 데이터 스토어가 더 필요한 경우 새 프로젝트를 사용하세요.
데이터 스토어의 각 항목은 데이터 스토어 인스턴스로 계산되므로
이 할당량에 포함됩니다. 예를 들어 항목이 3개인 데이터 스토어는 할당량에 대해 3개의 데이터 스토어로 계산됩니다.
2 기술적 제한으로 인해 엔진의 최대 할당량은 500 프로젝트당입니다. 엔진이 더 필요한 경우 새 프로젝트를 사용하세요.
비율 할당량
Discovery Engine API 요청에 적용되는 할당량은 다음과 같습니다.
| Quota | 값 |
|---|---|
| 프로젝트별 분당 완료된 쿼리 요청 수 | 300 |
| 위치별 프로젝트당 리전별 분당 검색 요청 수 (전역, 미국, EU) | 300 |