Live API 네이티브 오디오가 지원되는 Gemini 2.5 Flash는 Live API를 위한 최첨단 네이티브 오디오 기능을 제공합니다. 이 프리뷰 모델에는 표준 Live API 기능 외에도 다음이 포함됩니다.
- 향상된 오디오 품질: 사람과 대화하는 듯한 오디오 품질을 경험하세요.
- 향상된 음성 품질 및 적응성: Live API 네이티브 오디오는 24개 언어의 30개 HD 음성을 통해 더 풍부하고 자연스러운 음성 상호작용을 제공합니다.
- 능동적 오디오 도입: 능동적 오디오가 사용 설정되면 관련성이 있을 때만 모델이 응답합니다. 모델은 기기로 향하는 쿼리에 대해서만 텍스트 스크립트와 오디오 응답을 능동적으로 생성하며, 기기로 향하지 않는 쿼리에는 응답하지 않습니다.
- 공감형 대화 도입: Live API 네이티브 오디오를 사용하는 모델은 사용자의 감정 표현을 이해하고 적절하게 응답하여 더 섬세한 대화를 나눌 수 있습니다.
- 향상된 끼어들기: 시끄러운 환경에서도 Gemini의 응답이 끝나기 전에 더 자연스럽고 안정적으로 끼어들 수 있습니다.
- 강력한 함수 호출: 트리거링 레이트가 개선되어 Gemini가 사용 사례를 지원하기 위해 정의한 함수를 성공적으로 실행할 수 있습니다.
- 정확한 스크립트 작성: 오디오를 텍스트 스크립트로 작성하는 정확도가 크게 향상되었습니다.
- 원활한 다국어 지원: 여러 언어로 Gemini와 대화할 때, 사전 구성 없이도 언어 간에 원활하게 전환됩니다. 언어는 더 이상 장벽이 아닙니다.
Live API에 대한 자세한 내용은 다음을 참고하세요.
| 모델 ID | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| 지원되는 입력 및 출력 |
|
|
| 토큰 한도 |
|
|
| 기능 | ||
| 사용량 유형 |
|
|
| 기술 사양 | ||
| 이미지 |
|
|
| 동영상 |
|
|
| 오디오 |
|
|
| 파라미터 기본값 |
|
|
| 지원되는 리전 | ||
|
모델 가용성 |
|
|
| 자세한 내용은 데이터 저장 위치를 참고하세요. | ||
| 지식 단절 날짜 | 2025년 1월 | |
| 버전 |
|
|
| 보안 제어 | ||
| 자세한 내용은 보안 제어를 참고하세요. | ||
| 지원 언어 | 지원되는 언어를 참고하세요. | |
| 가격 책정 | 가격 책정을 참고하세요. | |