Gemini 2.5 Flash con funciones de audio nativas de Live API ofrece nuestra funcionalidad de audio nativa de vanguardia para Live API. Además de las funciones estándar de la API Live, este modelo de vista previa incluye lo siguiente:
- Calidad de audio mejorada: disfruta de una calidad de audio significativamente mejorada que te hará sentir como si estuvieras hablando con una persona.
- Calidad de voz y adaptabilidad mejoradas: la API Live de audio nativo ofrece interacciones de voz más naturales y enriquecidas con 30 voces en HD en 24 idiomas.
- Presentamos Audio proactivo: Cuando Audio proactivo está habilitado, el modelo solo responde cuando es pertinente. El modelo genera transcripciones de texto y respuestas de audio de forma proactiva solo para las consultas dirigidas al dispositivo y no responde a las consultas que no se dirigen al dispositivo.
- Presentamos Affective Dialog: los modelos que usan el audio nativo de la API Live pueden entender y responder adecuadamente a las expresiones emocionales de los usuarios para mantener conversaciones más matizadas.
- Interrupción mejorada: interrumpe a Gemini de forma más natural y fiable, incluso en entornos ruidosos.
- Llamadas a funciones sólidas: hemos mejorado la tasa de activación, lo que permite a Gemini ejecutar correctamente las funciones que definas para dar respuesta a tus casos prácticos.
- Transcripción precisa: la precisión de la transcripción de audio a texto se ha mejorado significativamente.
- Compatibilidad multilingüe fluida: habla con Gemini en varios idiomas y cambiará de uno a otro sin problemas y sin necesidad de preconfiguración. El idioma ya no es un obstáculo.
Para obtener más información sobre la API Live, consulta los siguientes artículos:
- Nuestra documentación independiente de la API Live.
- Formatos de audio admitidos por la API Live
- Nuestros límites de sesiones simultáneas de la API Live.
ID del modelo | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
---|---|---|
Entradas y salidas admitidas |
|
|
Límites de tokens |
|
|
Funciones |
|
|
Tipos de uso | ||
Especificaciones técnicas | ||
Vídeo |
|
|
Audio |
|
|
Valores predeterminados de los parámetros |
|
|
Regiones disponibles | ||
Disponibilidad del modelo |
|
|
Consulta más información sobre la residencia de los datos. | ||
Fecha de corte de conocimiento | Enero del 2025 | |
Versiones |
|
|
Controles de seguridad | ||
Para obtener más información, consulta Controles de seguridad. | ||
Idiomas disponibles | Consulta los idiomas admitidos. | |
Precios | Consulta Precios. |