할당량

이 문서에서는 Document AI에 적용되는 할당량과 시스템 한도를 설명합니다.

  • 할당량에는 기본값이 있지만 일반적으로 조정을 요청할 수 있습니다.
  • 시스템 한도는 변경할 수 없는 고정 값입니다.

Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

이 문서에는 Document AI에 적용되는 할당량이 나와 있습니다.

서비스 등급

Document AI는 생성형 AI 기반 프로세서 버전에 대한 온라인 처리 요청에 대해 프로비저닝된 등급과 최선의 등급이라는 두 가지 서비스 등급과 관련 할당량을 지원합니다.

프로비저닝된 등급 할당량은 맞춤 추출기 v1.4 및 v1.5와 같은 기본 프로세서 버전의 경우 분당 120페이지, 맞춤 추출기 v1.5 Pro와 같은 기본 프로세서 버전의 경우 분당 30페이지를 제공합니다.

최선을 다하는 등급 할당량은 맞춤 추출기 v1.4 및 v1.5와 같은 기본 프로세서 버전의 경우 120, 맞춤 추출기 v1.5 Pro와 같은 Pro 프로세서 버전의 경우 60을 제공하며 프로비저닝된 할당량이 소진된 후에만 사용됩니다. 이는 콘솔의 할당량 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(측정항목 best_effort_online_process_document_pages_us) 및 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(측정항목 best_effort_online_process_document_pages_eu)에 적용됩니다.

참고 맞춤 추출기 v1.4 (Gemini 2.0 Flash 기반) 맞춤 추출기 v1.5 (Gemini 2.5 Flash 기반) 맞춤 추출기 1.5 Pro (Gemini 2.5 Pro 기반)
프로비저닝됨 120 120 30
최선의 노력 120 120 60
조직 수준 프로비저닝 240 240 60

최선을 다한 할당량에 나열된 것보다 더 많은 할당량이 필요한 경우 영업팀에 문의하여 할당량 증가 요청 (QIR)을 할 수 있습니다.

트래픽이 많은 기간에 더 많은 사용 가능한 용량을 확보하려면 용량 예약 요청을 제출하는 방법을 설명하는 섹션을 참고하세요.

최선을 다하는 지원 티어에는 서비스수준계약이 없습니다.

할당량 목록

다음 할당량이 Document AI에 적용됩니다. 이 할당량은 각각의 Google Cloud 콘솔 프로젝트에 적용되며, 같은 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에서 공유됩니다.

더 많은 요청을 처리하려면 Google Cloud 콘솔에서 프로젝트에 대한 Document AI 할당량 요청을 제출하세요.

요청에 구체적인 요구사항과 사용 사례에 관한 정보를 제공하세요.

요청 할당량 기본값 참고
분당 요청 수 사용자당 1,800개 Google Cloud 콘솔에서 할당량 보기
분당 온라인 처리 요청 수 (미국) 프로세서 유형별 프로젝트당 120개 Google Cloud 콘솔에서 할당량 보기
분당 온라인 처리 요청 수 (EU) 프로세서 유형별 프로젝트당 120개 Google Cloud 콘솔에서 할당량 보기
프로세서 유형 및 모델 버전별 분당 온라인 프로세스 문서 페이지 수 (미국)(Gemini 2.0 Flash가 적용된 맞춤 추출기 v1.4만 해당) 분당 120페이지* Google Cloud 콘솔에서 할당량 보기
프로세서 유형 및 모델 버전별 분당 온라인 프로세스 문서 페이지 수 (EU)(Gemini 2.0 Flash가 적용된 맞춤 추출기 v1.4만 해당) 분당 120페이지* Google Cloud 콘솔에서 할당량 보기
프로세서 유형 및 모델 버전별 분당 온라인 문서 처리 페이지 수 (미국)(Gemini 2.5 Flash가 적용된 맞춤 추출기 v1.5만 해당) 분당 120페이지* Google Cloud 콘솔에서 할당량 보기
프로세서 유형 및 모델 버전별 분당 온라인 프로세스 문서 페이지 수 (EU)(Gemini 2.5 Flash가 적용된 Custom Extractor v1.5만 해당) 분당 120페이지* Google Cloud 콘솔에서 할당량 보기
분당 온라인 처리 요청 수 (단일 리전) 프로세서 유형별 프로젝트당 6개 Google Cloud 콘솔에서 할당량 보기
프로젝트 및 지역별 동시 일괄 처리 요청 (미국) 프로젝트당 5개 Google Cloud 콘솔에서 할당량 보기
프로젝트 및 리전별 동시 일괄 처리 요청 (EU) 프로젝트당 5개 Google Cloud 콘솔에서 할당량 보기
프로세서당 동시 일괄 처리 요청 (단일 리전) 프로젝트당 5개 Google Cloud 콘솔에서 할당량 보기
동시 프로세서 버전 학습 요청 (미국) 프로젝트당 1개 Google Cloud 콘솔에서 할당량 보기
동시 프로세서 버전 학습 요청 (EU) 프로젝트당 1개 Google Cloud 콘솔에서 할당량 보기
동시 프로세서 버전 학습 요청 (단일 리전) 프로젝트당 1개 Google Cloud 콘솔에서 할당량 보기
배포된 맞춤 프로세서 버전 (미국) 프로젝트당 5개 Google Cloud 콘솔에서 할당량 보기
배포된 맞춤 프로세서 버전 (EU) 프로젝트당 5개 Google Cloud 콘솔에서 할당량 보기
배포된 맞춤 프로세서 버전 (단일 리전) 프로젝트당 5개 Google Cloud 콘솔에서 할당량 보기
배포된 생성형 프로세서 버전 (미국) 프로젝트별 맞춤 추출 프로세서당 100개 Google Cloud 콘솔에서 할당량 보기
배포된 생성형 프로세서 버전 (EU) 프로젝트별 맞춤 추출 프로세서당 100개 Google Cloud 콘솔에서 할당량 보기
배포된 생성형 프로세서 버전 (단일 리전) 프로젝트별 맞춤 추출 프로세서당 100개 Google Cloud 콘솔에서 할당량 보기
동시 가져오기 문서 요청 (미국) 프로젝트당 3개 Google Cloud 콘솔에서 할당량 보기
동시 가져오기 문서 요청 (EU) 프로젝트당 3개 Google Cloud 콘솔에서 할당량 보기
동시 가져오기 문서 요청 (단일 리전) 프로젝트당 3개 Google Cloud 콘솔에서 할당량 보기
동시 문서 내보내기 요청 (미국) 프로젝트당 1개 Google Cloud 콘솔에서 할당량 보기
동시 내보내기 문서 요청 (EU) 프로젝트당 1개 Google Cloud 콘솔에서 할당량 보기
동시 내보내기 문서 요청 (단일 리전) 프로젝트당 1개 Google Cloud 콘솔에서 할당량 보기

* 이 버전에서는 할당량 조정 요청이 아직 지원되지 않습니다.

할당량 조정 요청이 있는 australia-southeast1에서 지원됩니다.

용량 예약 요청하기

Document AI 용량 예약은 구독 기간 동안 실시간 대량 예측 트래픽을 처리할 수 있는 예약된 용량을 제공하여 서비스수준계약 (SLA) 요구사항을 충족하는 데 도움이 됩니다. 각 단위는 기본 할당량을 초과하는 추가 페이지/분에 해당합니다.

용량 예약은 맞춤 추출기 모델 v1.4 및 v1.5의 프로비저닝된 티어 할당량을 늘리는 데 지원되며 필요합니다. 여기에는 이러한 모델을 기반으로 빌드된 미세 조정된 프로세서 버전이 포함됩니다.

용량 예약 가격은 월별 분당 추가 페이지당 300달러입니다.

용량 예약 요청을 하려면 다음 단계를 따르세요.

  1. Google Cloud 콘솔에서 IAM 및 관리자 > 용량 예약 페이지로 이동합니다.

    용량 예약

  2. 페이지 헤더 근처에서 새 용량 예약 만들기를 클릭합니다. 그러면 2페이지 요청 양식으로 이동합니다.

  3. 구성 페이지에 다음을 입력합니다.

    • 주문 이름을 입력합니다.
    • 리전을 선택하세요.
    • 드롭다운 메뉴에서 프로세서 버전을 선택합니다.
    • 월별로 필요한 분당 추가 페이지 수를 입력합니다.
    • 월간 구독 기간을 선택합니다.
    • 시작일 및 시간을 선택합니다.
    • 드롭다운에서 자동 갱신 옵션을 선택합니다.
  4. 계속을 클릭합니다.

  5. 두 번째 페이지에는 월별 예상 비용이 표시됩니다. 구매를 확인하려면 확인을 입력합니다.

  6. 확인 및 제출을 클릭합니다.

용량 예약 탭에서 요청 상태를 확인할 수 있습니다.

가능한 상태는 다음과 같습니다.

  • 비활성: 정기 결제가 아직 시작되지 않았습니다.
  • 활성: 정기 결제가 진행 중입니다.
  • 완료됨: 구독이 종료되었습니다.

용량 예약 구매 전 고려사항

용량 예약 구매 여부를 결정하려면 다음을 고려하세요.

  • 계약 기간 중에는 주문을 취소할 수 없습니다.

    용량 예약 구매는 약정이므로 계약 기간 중에는 주문을 취소할 수 없습니다. 하지만 구매한 GSU 수를 늘릴 수는 있습니다. 약정을 실수로 구매했거나 구성에 문제가 있는 경우 Google Cloud 계정 담당자에게 문의하여 도움을 받으세요.

  • 구독을 자동 갱신할 수 있습니다.

    주문을 제출할 때 기간 종료 시 구독을 자동 갱신하거나 구독을 만료시킬 수 있습니다. 자동 갱신 프로세스를 취소할 수 있습니다. 자동 갱신 전에 구독을 취소하려면 다음 기간이 시작되기 30일 전에 자동 갱신을 취소합니다.

    월간 구독이 매월 자동으로 갱신되도록 구성할 수 있습니다. 주간 단위 계약은 자동 갱신을 지원하지 않습니다.