Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

할당량

정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 Agent Assist 기능과 함께 사용되는 API의 할당량을 간략히 설명합니다.

할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참고하세요. 요청이 제출된 후 Google에서 추가 정보를 위해 연락할 수도 있고, 요청의 승인 또는 거부 여부를 알릴 수도 있습니다.

Google Cloud 콘솔에서 멀티 리전 할당량의 할당량 증가를 요청할 때 측정기준을 지정할 수 없는 경우 Google Cloud CLI를 사용하거나 Cloud Customer Care에 문의하세요.

프로젝트 유형

다음 할당량 표에는 소비자 및 리소스라는 두 가지 유형의 프로젝트가 나열되어 있습니다. 이 두 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참고하세요.

음성 스크립트

이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.

전화 통신 통합

전화 통신 통합에 사용되는 API의 경우 Dialogflow 할당량을 참고하세요.

gRPC 통합

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
AnalyzeContentOperationsPerMinutePerProject	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	동시 요청 50개	리전별 (전역 및 미국 멀티 리전 트래픽은 `us-central1` 리전에서 집계됨)	소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트)	리전별 동시 양방향 스트리밍 세션

Chirp 모델을 사용한 스크립트 작성

음성 텍스트 변환은 다음 Chirp 모델을 지원합니다.

chirp_2
chirp_3

할당량 이름	기본값	리전	리소스 또는 소비자 프로젝트에 요금 청구	설명
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	요청 20개/분	리전별 (전역 및 미국 멀티 리전 트래픽은 `us-central1` 리전에서 집계됨)	소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트)	할당량 측정기준: `resource_type={stt_model_name}` (리소스 유형별로 STT V2에 전송된 새 `StreamingRecognize` 요청 수)

감정 분석

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion	분당 요청 300개	미국 멀티 리전	소비자 프로젝트	할당량 측정기준: `multi-region=us,version=v3`. 버전별, 멀티 리전별 AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
AnalyzeSentimentOperationsPerMinutePerProject	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	분당 요청 300개	리전	소비자 프로젝트	AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청

나만의 어시스트 만들기

이 기능은 다음 AI 모델을 사용합니다.

text-bison@001 (기본 한도 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
GeneratorSuggestionOperationsPerMinutePerModelType	요청 10개/분	전역	소비자 프로젝트	모델 유형별 생성기 제안 작업
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	요청 10개/분	리전	소비자 프로젝트	할당량 측정기준: `model_type={model_name}`. 모델 유형 및 리전별 생성기 제안 작업

스마트 답장

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
SmartReplyBaselineModelOperationsPerMinutePerProject	요청 120회/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	요청 60개/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	요청 60개/분	리전	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청 가져오기

생성형 스마트 답장

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
SmartReplyBaselineModelOperationsPerMinutePerProject	요청 120회/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	요청 60개/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청 가져오기
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	요청 60개/분	리전	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청 가져오기

요약

AI 생성 요약은 다음 모델을 사용합니다.

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0
summarization-6.0

다음 표에는 각 버전의 요약에 사용되는 할당량 유형과 모델이 나와 있습니다.

요약 버전	할당량 유형	백엔드 모델
Generator 6.0	생성기 기반	사전 학습된 Gemini-3.5-flash
Generator 5.0	생성기 기반	사전 학습된 Gemini-2.5-flash
Generator 4.0	생성기 기반	사전 학습된 Gemini-2.0-flash-001
Generator 3.1	생성기 기반	LoRA로 조정된 gemini-1.5-flash-001
생성기 3.0	생성기 기반	LoRA로 조정된 gemini-1.0-pro-002
Generator 2.1	생성기 기반	Lora로 조정된 text-bison-32k@002
Generator 2.0	생성기 기반	Lora로 조정된 text-bison-32k@002
Generator 1.0	생성기 기반	Lora로 조정된 text-bison@001
기준 v2	기준 v2 모델	text-bison
기준 v1	생성기 기반이 아님	LongT5 모델
맞춤 2.0	생성기 기반이 아님	LongT5 모델

이전 표의 할당량 유형은 요약에 사용되는 API의 다음 할당량 목록에 반영됩니다.

할당량 유형	할당량 한도 이름	기본값	리전	리소스/소비자 프로젝트 요금 청구	설명
생성기 기반	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	분당 요청 10개	지역	소비자 프로젝트	할당량 측정기준: `model_type=summarization-{version_num}`.모델 유형 및 리전별 생성기 제안 작업
생성기 기반	GeneratorSuggestionOperationsPerMinutePerModelType	분당 요청 10개	전역	소비자 프로젝트	모델 유형별 생성기 제안 작업
생성기 기반	GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion	분당 요청 10개	미국 멀티 리전	소비자 프로젝트	할당량 측정기준: `multi-region=us, model_type=summarization-{version_num}` 모델 유형 및 리전별 생성기 제안 작업
생성기 기반	SuggestConversationSummaryOperationsPerMinutePerProject	요청 60개/분	전역	리소스 프로젝트	대화 요약 작업 제안
생성기 기반이 아님	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0~2회 요청/분	지역	리소스 프로젝트	각 리전에서 대화 요약 작업 제안
기준 v2 모델	SuggestSummaryV2BaselineOperationsPerMinutePerProject	분당 요청 120개	전역	리소스 프로젝트	대화 요약 제안 V2 기준 폴링 요청
기준 v2 모델	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	요청 60개/분	지역	리소스 프로젝트	각 리전의 대화 요약 제안 V2 Baseline 폴링 요청

요약 자동 평가

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
ConcurrentSummarizationEvaluationsPerProject	프로젝트당 1개 요청	소비자 프로젝트	자동 평가 요청

동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제출하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.

생성형 지식 지원

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
SearchKnowledgeRequestsPerMinutePerProject	요청 60개/분	전역	소비자 프로젝트	SearchKnowledge 요청
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	요청 30회/분	리전	소비자 프로젝트	각 리전의 SearchKnowledge 요청
SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion	요청 30회/분	미국 멀티 리전	소비자 프로젝트	할당량 측정기준: `multi-region=us`. 각 멀티 리전의 SearchKnowledge 요청

선제적 생성형 지식 지원

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
SuggestKnowledgeAssistOperationsPerMinutePerProject	요청 60개/분	전역	리소스 프로젝트	AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	요청 30회/분	리전	리소스 프로젝트	각 리전에서 AnalyzeContent 또는 SuggestKnowledgeKnowledgeAssist를 통한 KnowledgeAssist 요청
SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion	요청 30회/분	미국 멀티 리전	리소스 프로젝트	할당량 측정기준: `multi-region=us`. 각 멀티 리전의 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청

AI 코치 (LLM)

이 기능은 agent-coaching-2.5 AI 모델을 사용합니다.

할당량 한도 이름	기본값	리전	리소스 또는 소비자 프로젝트에 요금 청구	설명
`GeneratorSuggestionOperationsPerMinutePerModelType`	요청 60개/분	전역	소비자 프로젝트	할당량 측정기준: `model_type=agent-coaching-2.5`. 모델 유형별 생성기 제안 작업
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	요청 60개/분	리전	소비자 프로젝트	할당량 측정기준: `model_type=agent-coaching-2.5`. 모델 유형 및 리전별 생성기 제안 작업
`GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion`	요청 10개/분	미국 멀티 리전	소비자 프로젝트	할당량 측정기준: `multi-region=us,model_type=agent-coaching-2.5`. 모델 유형 및 멀티 리전별 생성기 제안 작업

기타 API 할당량

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
ConversationOperationsPerMinutePerProject	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
MessagePollingOperationsPerMinutePerProject	1,200개 요청 / 분	전역	소비자 프로젝트	ListMessages 요청입니다. 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
AnswerRecordOperationsPerMinutePerProject	300 요청 / 분	전역	소비자 프로젝트	AnswerRecord 요청

할당량 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.