Gemini 2.5 Flash con funzionalità audio native dell'API Live, la nostra funzionalità audio nativa all'avanguardia per l'API Live. Oltre alle funzionalità standard dell'API Live, questo modello di anteprima include:
- Qualità audio migliorata: goditi una qualità audio notevolmente migliorata che ti farà sentire come se stessi parlando con una persona.
- Qualità e adattabilità della voce migliorate:l'audio nativo dell'API Live offre interazioni vocali più ricche e naturali con 30 voci HD in 24 lingue.
- Ti presentiamo Audio Proattivo: Quando Audio Proattivo è attivo, il modello risponde solo quando è pertinente. Il modello genera trascrizioni di testo e risposte audio in modo proattivo solo per le query indirizzate al dispositivo e non risponde alle query non indirizzate al dispositivo.
- Ti presentiamo Affective Dialog: i modelli che utilizzano l'audio nativo dell'API Live possono comprendere e rispondere in modo appropriato alle espressioni emotive degli utenti per conversazioni più sfumate.
- Interruzione migliorata: interrompi Gemini in modo più naturale e affidabile, anche in ambienti rumorosi.
- Chiamata di funzioni affidabile: abbiamo migliorato la frequenza di attivazione, consentendo a Gemini di eseguire correttamente le funzioni che definisci per supportare i tuoi casi d'uso.
- Trascrizione accurata:l'accuratezza della trascrizione dell'audio in testo è stata notevolmente migliorata.
- Supporto multilingue senza interruzioni: parla con Gemini in più lingue e passerà da una all'altra senza alcuna preconfigurazione. La lingua non è più un ostacolo.
Per ulteriori informazioni sull'API Live, consulta:
- La nostra documentazione dell'API Live autonoma.
- I formati audio supportati dall'API Live.
- I nostri limiti di sessioni simultanee dell'API Live.
ID modello | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
---|---|---|
Ingressi e uscite supportati |
|
|
Limiti di token |
|
|
Funzionalità |
|
|
Tipi di utilizzo |
|
|
Specifiche tecniche | ||
Video |
|
|
Audio |
|
|
Valori predefiniti dei parametri |
|
|
Aree geografiche supportate | ||
Disponibilità del modello |
|
|
Per saperne di più, consulta Residenza dei dati. | ||
Data del knowledge cutoff | Gennaio 2025 | |
Versioni |
|
|
Controlli di sicurezza | ||
Per ulteriori informazioni, consulta Controlli di sicurezza. | ||
Lingue supportate | Vedi Lingue supportate. | |
Prezzi | Vedi Prezzi. |