정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 Agent Assist 기능과 함께 사용되는 API의 할당량을 간략하게 설명합니다.
할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참조하세요. 요청을 제출하면 Google에서 추가 정보를 요청하고 요청이 승인 또는 거부될 때 알려드릴 수 있습니다.
프로젝트 유형
다음 할당량 표에는 소비자 및 리소스라는 두 가지 유형의 프로젝트가 나와 있습니다. 이러한 두 가지 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참조하세요.
음성 텍스트 변환
이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.
전화 통신 통합
전화 통신 통합과 함께 사용되는 API의 Dialogflow 할당량을 참조하세요.
gRPC 통합
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 동시 요청 50개 | 리전 (전역 트래픽은 us-central1 리전에서 집계됨) |
소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트) | 리전별 동시 양방향 스트리밍 세션 |
Chirp 모델을 사용한 텍스트 변환
| 할당량 이름 | 기본값 | 리전 | 청구 리소스 또는 소비자 프로젝트 | 설명 |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
분당 요청 20개 | 리전 (전역 트래픽은 us-central1 리전에서 집계됨) |
소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트) | 리소스 유형별로 STT V2로 전송된 새 StreamingRecognize 요청 수 |
감정 분석
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
| AnalyzeSentimentOperationsPerVersionPerRegion | 분당 요청 300개 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
| AnalyzeSentimentOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 분당 요청 300개 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
자체 어시스턴트 빌드
이 기능은 다음 AI 모델을 사용합니다.
- text-bison@001 (기본 한도 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 분당 요청 10개 | 전역 | 소비자 프로젝트 | 모델 유형별 생성기 제안 작업 |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 분당 요청 10개 | 리전 | 소비자 프로젝트 | 모델 유형 및 리전별 생성기 제안 작업 |
스마트 답장
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 분당 요청 120개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 모델 요청 가져오기 |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 분당 요청 60개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기 |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 분당 요청 60개 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기 |
생성형 스마트 답장
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 분당 요청 120개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 모델 요청 가져오기 |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 분당 요청 60개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기 |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 분당 요청 60개 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 V2 모델 요청 가져오기 |
요약
AI 생성 요약은 다음 모델을 사용합니다.
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
다음 표에서는 요약의 각 버전에 사용되는 할당량 유형과 모델을 보여줍니다.
요약 버전 |
할당량 유형 |
백엔드 모델 |
|---|---|---|
생성기 5.0 |
생성기 기반 |
사전 학습된 Gemini-2.5-flash |
생성기 4.0 |
생성기 기반 |
사전 학습된 Gemini-2.0-flash-001 |
생성기 3.1 |
생성기 기반 |
Lora 조정된 gemini-1.5-flash-001 |
생성기 3.0 |
생성기 기반 |
Lora 조정된 gemini-1.0-pro-002 |
생성기 2.1 |
생성기 기반 |
Lora 조정된 text-bison-32k@002 |
생성기 2.0 |
생성기 기반 |
Lora 조정된 text-bison-32k@002 |
생성기 1.0 |
생성기 기반 |
Lora 조정된 text-bison@001 |
기준 v2 |
기준 v2 모델 |
text-bison |
기준 v1 |
생성기 기반 아님 |
LongT5 모델 |
맞춤 2.0 |
생성기 기반 아님 |
LongT5 모델 |
이전 표의 할당량 유형은 요약과 함께 사용되는 API의 다음 할당량 목록에 반영됩니다.
할당량 유형 |
할당량 한도 이름 |
기본값 |
리전 |
청구 리소스/소비자 프로젝트 |
설명 |
|---|---|---|---|---|---|
생성기 기반 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
분당 요청 10개 |
리전 |
소비자 프로젝트 |
모델 유형 및 리전별 생성기 제안 작업 |
생성기 기반 |
GeneratorSuggestionOperationsPerMinutePerModelType |
분당 요청 10개 |
전역 |
소비자 프로젝트 |
모델 유형별 생성기 제안 작업 |
생성기 기반 |
SuggestConversationSummaryOperationsPerMinutePerProject |
분당 요청 60개 |
전역 |
리소스 프로젝트 |
대화 요약 제안 작업 |
생성기 기반 아님 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
분당 요청 0~2개 |
리전 |
리소스 프로젝트 |
각 리전의 대화 요약 제안 작업 |
기준 v2 모델 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
분당 요청 120개 |
전역 |
리소스 프로젝트 |
대화 요약 제안 V2 기준 폴링 요청 |
기준 v2 모델 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
분당 요청 60개 |
리전 |
리소스 프로젝트 |
각 리전의 대화 요약 제안 V2 기준 폴링 요청 |
요약 자동 평가
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 프로젝트당 요청 1개 | 소비자 프로젝트 | 자동 평가 요청 |
동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제기하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.
생성형 지식 어시스트
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 분당 요청 60개 | 전역 | 소비자 프로젝트 | SearchKnowledge 요청 |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 분당 요청 30개 | 리전 | 소비자 프로젝트 | 각 리전의 SearchKnowledge 요청 |
선제적 생성형 지식 어시스트
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 분당 요청 60개 | 전역 | 리소스 프로젝트 | AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청 |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 분당 요청 30개 | 리전 | 리소스 프로젝트 | 각 리전의 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청 |
AI 코치 (LLM)
이 기능은 agent-coaching-2.5 AI 모델을 사용합니다.
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스 또는 소비자 프로젝트 | 설명 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
분당 요청 60개 | 전역 | 소비자 프로젝트 | 모델 유형별 생성기 제안 작업 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
분당 요청 60개 | 리전 | 소비자 프로젝트 | 모델 유형 및 리전별 생성기 제안 작업 |
기타 API 할당량
| 할당량 한도 이름 | 기본값 | 리전 | 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
| MessagePollingOperationsPerMinutePerProject | 분당 요청 1,200개 | 전역 | 소비자 프로젝트 | ListMessages 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
| AnswerRecordOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnswerRecord 요청 |