Gemini 2.5 Flash avec les fonctionnalités audio natives de l'API Gemini Live : notre fonctionnalité audio native de pointe pour l'API Gemini Live. En plus des fonctionnalités standards de l'API Gemini Live, ce modèle Preview inclut :
- Qualité audio améliorée : profitez d'une qualité audio considérablement améliorée qui donne l'impression de parler avec une personne.
- Qualité et adaptabilité vocales améliorées : l'audio natif de l'API Gemini Live offre des interactions vocales plus riches et plus naturelles avec 30 voix HD dans 24 langues.
- Découvrez l'audio proactif : Lorsque l'audio proactif est activé, le modèle ne répond que lorsque c'est pertinent. Le modèle génère des transcriptions textuelles et des réponses audio de manière proactive uniquement pour les requêtes adressées à l'appareil. Il ne répond pas aux requêtes non adressées à l'appareil.
- Présentation du dialogue affectif : les modèles utilisant l'audio natif de l'API Gemini Live peuvent comprendre les expressions émotionnelles des utilisateurs et y répondre de manière appropriée pour des conversations plus nuancées.
- Interruption améliorée : interrompez Gemini de manière plus naturelle et fiable, même dans des environnements bruyants.
- Appel de fonctions robuste : nous avons amélioré le taux de déclenchement, ce qui permet à Gemini d'exécuter correctement les fonctions que vous définissez pour répondre à vos cas d'utilisation.
- Transcription précise : la précision de la transcription audio en texte a été considérablement améliorée.
- Compatibilité multilingue fluide : parlez à Gemini dans plusieurs langues, et il passera de l'une à l'autre sans aucune préconfiguration. La langue n'est plus une barrière.
Pour en savoir plus sur l'API Gemini Live, consultez les ressources suivantes :
- Notre documentation autonome sur l'API Gemini Live.
- Nos formats audio compatibles avec l'API Gemini Live.
- Nos limites de sessions simultanées de l'API Gemini Live.
| ID du modèle | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Entrées et sorties acceptées |
|
|
| Limites de jetons |
|
|
| Capacités | ||
| Types d'utilisation |
|
|
| Spécifications techniques | ||
| Images |
|
|
| Vidéo |
|
|
| Audio |
|
|
| Paramètres par défaut |
|
|
| Régions où le service est disponible | ||
|
Disponibilité du modèle |
|
|
| Pour en savoir plus, consultez Résidence des données. | ||
| Date limite des connaissances | Janvier 2025 | |
| Versions |
|
|
| Contrôles de sécurité | ||
| Pour en savoir plus, consultez Contrôles de sécurité. | ||
| Langues disponibles | Consultez Langues acceptées. | |
| Tarifs | Voir les tarifs | |