Gemini 2.5 Flash avec les fonctionnalités audio natives de l'API Gemini Live : notre fonctionnalité audio native de pointe pour l'API Gemini Live. En plus des fonctionnalités standards de l'API Gemini Live, ce modèle inclut :
- Qualité audio améliorée : profitez d'une qualité audio considérablement améliorée qui donne l'impression de parler à une personne.
- Qualité et adaptabilité vocales améliorées : l'audio natif de l'API Gemini Live offre des interactions vocales plus riches et plus naturelles avec 30 voix HD dans 24 langues.
- Découvrez l'audio proactif (aperçu) Lorsque l'audio proactif est activé, le modèle ne répond que lorsque c'est pertinent. Le modèle génère des transcriptions textuelles et des réponses audio de manière proactive uniquement pour les requêtes adressées à l'appareil. Il ne répond pas aux requêtes non adressées à l'appareil.
- Présentation du dialogue affectif : les modèles utilisant l'audio natif de l'API Gemini Live peuvent comprendre les expressions émotionnelles des utilisateurs et y répondre de manière appropriée pour des conversations plus nuancées.
- Interruption améliorée : interrompez Gemini de manière plus naturelle et fiable, même dans des environnements bruyants.
- Appel de fonctions robuste : nous avons amélioré le taux de déclenchement, ce qui permet à Gemini d'exécuter avec succès les fonctions que vous définissez pour prendre en charge vos cas d'utilisation.
- Transcription précise : la précision de la transcription audio en texte a été considérablement améliorée.
- Compatibilité multilingue fluide : parlez à Gemini dans plusieurs langues, et il passera de l'une à l'autre sans effort et sans aucune préconfiguration. La langue n'est plus une barrière.
Pour en savoir plus sur l'API Gemini Live, consultez les ressources suivantes :
- Notre documentation autonome sur l'API Gemini Live.
- Nos formats audio compatibles avec l'API Gemini Live.
- Nos limites de sessions simultanées de l'API Gemini Live.
Live 2.5 Flash Native Audio
| ID du modèle | gemini-live-2.5-flash-native-audio |
|
|---|---|---|
| Entrées et sorties acceptées |
|
|
| Limites de jetons |
|
|
| Capacités | ||
| Types d'utilisation |
|
|
| Spécifications techniques | ||
| Images |
|
|
| Vidéo |
|
|
| Audio |
|
|
| Paramètres par défaut |
|
|
| Régions où le service est disponible | ||
|
Disponibilité du modèle |
|
|
| Pour en savoir plus, consultez Déploiements et points de terminaison. | ||
| Versions |
|
|
| Contrôles de sécurité | ||
| Prédiction en ligne |
|
|
| Pour en savoir plus, consultez Contrôles de sécurité. | ||
| Langues disponibles | Consultez Langues acceptées. | |
| Tarifs | Voir les tarifs | |
Aperçu audio natif Live 2.5 Flash
| ID du modèle | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Entrées et sorties acceptées |
|
|
| Limites de jetons |
|
|
| Capacités | ||
| Types d'utilisation |
|
|
| Spécifications techniques | ||
| Images |
|
|
| Vidéo |
|
|
| Audio |
|
|
| Paramètres par défaut |
|
|
| Régions où le service est disponible | ||
|
Disponibilité du modèle |
|
|
| Pour en savoir plus, consultez Déploiements et points de terminaison. | ||
| Date limite des connaissances | Août 2025 | |
| Versions |
|
|
| Contrôles de sécurité | ||
| Pour en savoir plus, consultez Contrôles de sécurité. | ||
| Langues disponibles | Consultez Langues acceptées. | |
| Tarifs | Voir les tarifs | |