할당량

정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 Agent Assist 기능과 함께 사용되는 API의 할당량을 간략하게 설명합니다.

할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참조하세요. 요청을 제출하면 Google에서 추가 정보를 요청하고 요청이 승인 또는 거부될 때 알려드릴 수 있습니다.

프로젝트 유형

다음 할당량 표에는 소비자 및 리소스라는 두 가지 유형의 프로젝트가 나와 있습니다. 이러한 두 가지 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참조하세요.

음성 텍스트 변환

이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.

전화 통신 통합

전화 통신 통합과 함께 사용되는 API의 Dialogflow 할당량을 참조하세요.

gRPC 통합

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
AnalyzeContentOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 동시 요청 50개 리전 (전역 트래픽은 us-central1 리전에서 집계됨) 소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트) 리전별 동시 양방향 스트리밍 세션

Chirp 모델을 사용한 텍스트 변환

할당량 이름 기본값 리전 청구 리소스 또는 소비자 프로젝트 설명
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 분당 요청 20개 리전 (전역 트래픽은 us-central1 리전에서 집계됨) 소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트) 리소스 유형별로 STT V2로 전송된 새 StreamingRecognize 요청 수

감정 분석

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
AnalyzeSentimentOperationsPerVersion 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
AnalyzeSentimentOperationsPerVersionPerRegion 분당 요청 300개 리전 소비자 프로젝트 AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
AnalyzeSentimentOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 분당 요청 300개 리전 소비자 프로젝트 AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청

자체 어시스턴트 빌드

이 기능은 다음 AI 모델을 사용합니다.

  • text-bison@001 (기본 한도 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
GeneratorSuggestionOperationsPerMinutePerModelType 분당 요청 10개 전역 소비자 프로젝트 모델 유형별 생성기 제안 작업
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 분당 요청 10개 리전 소비자 프로젝트 모델 유형 및 리전별 생성기 제안 작업

스마트 답장

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
SmartReplyBaselineModelOperationsPerMinutePerProject 분당 요청 120개 전역 소비자 프로젝트 AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 분당 요청 60개 전역 소비자 프로젝트 AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 분당 요청 60개 리전 소비자 프로젝트 AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기

생성형 스마트 답장

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
SmartReplyBaselineModelOperationsPerMinutePerProject 분당 요청 120개 전역 소비자 프로젝트 AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 분당 요청 60개 전역 소비자 프로젝트 AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 분당 요청 60개 리전 소비자 프로젝트 AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기

요약

AI 생성 요약은 다음 모델을 사용합니다.

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

다음 표에서는 요약의 각 버전에 사용되는 할당량 유형과 모델을 보여줍니다.


요약 버전

할당량 유형

백엔드 모델

생성기 5.0

생성기 기반

사전 학습된 Gemini-2.5-flash

생성기 4.0

생성기 기반

사전 학습된 Gemini-2.0-flash-001

생성기 3.1

생성기 기반

Lora 조정된 gemini-1.5-flash-001

생성기 3.0

생성기 기반

Lora 조정된 gemini-1.0-pro-002

생성기 2.1

생성기 기반

Lora 조정된 text-bison-32k@002

생성기 2.0

생성기 기반

Lora 조정된 text-bison-32k@002

생성기 1.0

생성기 기반

Lora 조정된 text-bison@001

기준 v2

기준 v2 모델

text-bison

기준 v1

생성기 기반 아님

LongT5 모델

맞춤 2.0

생성기 기반 아님

LongT5 모델

이전 표의 할당량 유형은 요약과 함께 사용되는 API의 다음 할당량 목록에 반영됩니다.


할당량 유형

할당량 한도 이름

기본값

리전

청구 리소스/소비자 프로젝트

설명

생성기 기반

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

분당 요청 10개

리전

소비자 프로젝트

모델 유형 및 리전별 생성기 제안 작업

생성기 기반

GeneratorSuggestionOperationsPerMinutePerModelType

분당 요청 10개

전역

소비자 프로젝트

모델 유형별 생성기 제안 작업

생성기 기반

SuggestConversationSummaryOperationsPerMinutePerProject

분당 요청 60개

전역

리소스 프로젝트

대화 요약 제안 작업

생성기 기반 아님

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

분당 요청 0~2개

리전

리소스 프로젝트

각 리전의 대화 요약 제안 작업

기준 v2 모델

SuggestSummaryV2BaselineOperationsPerMinutePerProject

분당 요청 120개

전역

리소스 프로젝트

대화 요약 제안 V2 기준 폴링 요청

기준 v2 모델

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

분당 요청 60개

리전

리소스 프로젝트

각 리전의 대화 요약 제안 V2 기준 폴링 요청

요약 자동 평가

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
ConcurrentSummarizationEvaluationsPerProject 프로젝트당 요청 1개 소비자 프로젝트 자동 평가 요청

동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제기하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.

생성형 지식 어시스트

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
SearchKnowledgeRequestsPerMinutePerProject 분당 요청 60개 전역 소비자 프로젝트 SearchKnowledge 요청
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 분당 요청 30개 리전 소비자 프로젝트 각 리전의 SearchKnowledge 요청

선제적 생성형 지식 어시스트

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
SuggestKnowledgeAssistOperationsPerMinutePerProject 분당 요청 60개 전역 리소스 프로젝트 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 분당 요청 30개 리전 리소스 프로젝트 각 리전의 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청

AI 코치 (LLM)

이 기능은 agent-coaching-2.5 AI 모델을 사용합니다.

할당량 한도 이름 기본값 리전 청구 리소스 또는 소비자 프로젝트 설명
GeneratorSuggestionOperationsPerMinutePerModelType 분당 요청 60개 전역 소비자 프로젝트 모델 유형별 생성기 제안 작업
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 분당 요청 60개 리전 소비자 프로젝트 모델 유형 및 리전별 생성기 제안 작업

기타 API 할당량

할당량 한도 이름 기본값 리전 청구 리소스/소비자 프로젝트 설명
ConversationOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
MessagePollingOperationsPerMinutePerProject 분당 요청 1,200개 전역 소비자 프로젝트 ListMessages 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
AnswerRecordOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnswerRecord 요청