Gemini 2.5 Flash avec les fonctionnalités audio natives de l'API Live intègre notre fonctionnalité audio native de pointe pour l'API Live. En plus des fonctionnalités standards de l'API Live, ce modèle Preview inclut les éléments suivants :
- Qualité audio améliorée : profitez d'une qualité audio considérablement améliorée qui donne l'impression de parler à une personne.
- Qualité et adaptabilité vocales améliorées : l'audio natif de l'API Live offre des interactions vocales plus riches et plus naturelles avec 30 voix HD dans 24 langues.
- Découvrez l'audio proactif : Lorsque l'audio proactif est activé, le modèle ne répond que lorsque c'est pertinent. Le modèle génère des transcriptions textuelles et des réponses audio de manière proactive uniquement pour les requêtes adressées à l'appareil. Il ne répond pas aux requêtes non adressées à l'appareil.
- Découvrez le dialogue affectif : les modèles utilisant l'audio natif de l'API Live peuvent comprendre les expressions émotionnelles des utilisateurs et y répondre de manière appropriée pour des conversations plus nuancées.
- Interruption améliorée : interrompez Gemini de manière plus naturelle et fiable, même dans des environnements bruyants.
- Appel de fonctions robuste : nous avons amélioré le taux de déclenchement, ce qui permet à Gemini d'exécuter avec succès les fonctions que vous définissez pour prendre en charge vos cas d'utilisation.
- Transcription précise : la précision de la transcription audio en texte a été considérablement améliorée.
- Compatibilité multilingue fluide : parlez à Gemini dans plusieurs langues, et il passera de l'une à l'autre sans effort, sans aucune préconfiguration. La langue n'est plus une barrière.
Pour en savoir plus sur l'API Live, consultez les ressources suivantes :
- Notre documentation autonome sur l'API Live
- Formats audio acceptés par l'API Live
- Nos limites de sessions simultanées de l'API Live.
ID du modèle | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
---|---|---|
Entrées et sorties acceptées |
|
|
Limites de jetons |
|
|
Capacités |
|
|
Types d'utilisation |
|
|
Spécifications techniques | ||
Vidéo |
|
|
Audio |
|
|
Paramètres par défaut |
|
|
Régions où le service est disponible | ||
Disponibilité du modèle |
|
|
Pour en savoir plus, consultez Résidence des données. | ||
Date limite des connaissances | Janvier 2025 | |
Versions |
|
|
Contrôles de sécurité | ||
Pour en savoir plus, consultez Contrôles de sécurité. | ||
Langues disponibles | Consultez Langues acceptées. | |
Tarifs | Voir les tarifs |