모델 적응을 사용하면 Cloud Speech-to-Text에서 가져온 스크립트 작성 결과의 정확성을 향상할 수 있습니다. 모델 적응을 사용하면 Cloud STT가 오디오 데이터에서 다른 경우에 추천될 수 있는 대안보다 더 자주 인식해야 하는 단어와 문구를 지정할 수 있습니다. 모델 적응은 특히 다음과 같은 사용 사례에서 스크립트 작성 정확도를 향상하는 데 유용합니다.
- 오디오에 매우 자주 나타날 가능성이 높은 단어나 문구가 포함되어 있는 경우
- 고유 이름과 같이 일반적인 오디오에 포함될 가능성이 높지 않은 사용 빈도가 낮은 단어가 오디오에 포함될 가능성이 높은 경우
- 오디오에 노이즈가 있거나 명확하게 들리지 않는 경우
이 문서를 읽기 전에 모델 적응 소개를 읽고 이 기능의 작동 방식을 개략적으로 파악하세요. 모델 적응 요청별 구문 및 글자 수 제한에 대한 자세한 내용은 할당량 및 한도를 참조하세요.
코드 샘플
모델 적응은 필요에 따라 스크립트 작성 결과를 맞춤설정하는 데 사용할 수 있는 Cloud STT 구성(선택사항)입니다. 인식 요청 본문 구성에 대한 자세한 내용은 RecognitionConfig 문서를 참조하세요.
다음 코드 샘플은 SpeechAdaptation 리소스인 PhraseSet, CustomClass, 모델 조정 부스트를 사용하여 스크립트 작성 정확도를 향상하는 방법을 보여줍니다.
이후 요청에서 PhraseSet 또는 CustomClass를 사용하려면 리소스를 만들 때 응답에 반환되는 리소스 name을 기록해 둡니다.
사용 중인 언어에 사용할 수 있는 사전 빌드된 클래스 목록은 지원되는 클래스 토큰을 참조하세요.
Python
Cloud STT용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Cloud STT 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Cloud STT Python API 참고 문서를 확인하세요.
Cloud STT에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.