Gemini 2.5 Flash con las funciones de audio nativas de la API Gemini Live ofrece nuestra funcionalidad de audio nativa de vanguardia para la API Gemini Live. Además de las funciones estándar de la API Gemini Live, este modelo de vista previa incluye lo siguiente:
- Calidad de audio mejorada: disfruta de una calidad de audio significativamente mejorada que te hará sentir como si estuvieras hablando con una persona.
- Calidad de voz y adaptabilidad mejoradas: el audio nativo de la API Gemini Live ofrece interacciones de voz más ricas y naturales con 30 voces en HD en 24 idiomas.
- Presentamos Audio proactivo: Cuando Audio proactivo está habilitado, el modelo solo responde cuando es pertinente. El modelo genera transcripciones de texto y respuestas de audio de forma proactiva solo para las consultas dirigidas al dispositivo y no responde a las consultas que no se dirigen al dispositivo.
- Presentamos Affective Dialog: los modelos que usan el audio nativo de la API Gemini Live pueden entender y responder adecuadamente a las expresiones emocionales de los usuarios para mantener conversaciones más matizadas.
- Interrupción mejorada: interrumpe a Gemini de forma más natural y fiable, incluso en entornos ruidosos.
- Llamadas a funciones sólidas: hemos mejorado la tasa de activación, lo que permite a Gemini ejecutar correctamente las funciones que definas para dar respuesta a tus casos prácticos.
- Transcripción precisa: la precisión de la transcripción de audio a texto se ha mejorado significativamente.
- Compatibilidad multilingüe fluida: habla con Gemini en varios idiomas y cambiará de uno a otro sin esfuerzo y sin necesidad de preconfiguración. El idioma ya no es un obstáculo.
Para obtener más información sobre la API Gemini Live, consulta los siguientes recursos:
- Nuestra documentación independiente de la API Gemini Live.
- Los formatos de audio admitidos por la API Gemini Live.
- Nuestros límites de sesiones simultáneas de la API de Gemini Live.
| ID del modelo | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Entradas y salidas admitidas |
|
|
| Límites de tokens |
|
|
| Funciones |
|
|
| Tipos de uso | ||
| Especificaciones técnicas | ||
| Imágenes |
|
|
| Vídeo |
|
|
| Audio |
|
|
| Valores predeterminados de los parámetros |
|
|
| Regiones disponibles | ||
|
Disponibilidad del modelo |
|
|
| Consulta más información sobre la residencia de los datos. | ||
| Fecha de corte de conocimiento | Enero del 2025 | |
| Versiones |
|
|
| Controles de seguridad | ||
| Para obtener más información, consulta Controles de seguridad. | ||
| Idiomas disponibles | Consulta los idiomas admitidos. | |
| Precios | Consulta Precios. | |