Gemini 2.5 Flash con le funzionalità audio native dell'API Gemini Live offre funzionalità audio native all'avanguardia per l'API Gemini Live. Oltre alle funzionalità standard dell'API Gemini Live, questo modello di anteprima include:
- Qualità audio migliorata:goditi una qualità audio notevolmente migliorata che ti farà sentire come se stessi parlando con una persona.
- Qualità e adattabilità della voce migliorate:l'API Gemini Live offre un audio nativo che consente interazioni vocali più ricche e naturali con 30 voci HD in 24 lingue.
- Ti presentiamo Audio Proattivo: Quando Audio Proattivo è attivo, il modello risponde solo quando è pertinente. Il modello genera trascrizioni di testo e risposte audio in modo proattivo solo per le query indirizzate al dispositivo e non risponde alle query non indirizzate al dispositivo.
- Ti presentiamo Affective Dialog: i modelli che utilizzano l'audio nativo dell'API Gemini Live possono comprendere e rispondere in modo appropriato alle espressioni emotive degli utenti per conversazioni più sfumate.
- Interruzione migliorata: interrompi Gemini in modo più naturale e affidabile, anche in ambienti rumorosi.
- Chiamata di funzioni affidabile: abbiamo migliorato la frequenza di attivazione, consentendo a Gemini di eseguire correttamente le funzioni che definisci per supportare i tuoi casi d'uso.
- Trascrizione accurata: l'accuratezza della trascrizione dell'audio in testo è stata notevolmente migliorata.
- Supporto multilingue senza interruzioni: parla con Gemini in più lingue e passerà da una all'altra senza problemi e senza alcuna preconfigurazione. La lingua non è più un ostacolo.
Per saperne di più sull'API Gemini Live, consulta:
- La nostra documentazione dell'API Gemini Live autonoma.
- I formati audio supportati dall'API Gemini Live.
- I nostri limiti di sessioni simultanee dell'API Gemini Live.
| ID modello | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Ingressi e uscite supportati |
|
|
| Limiti di token |
|
|
| Funzionalità |
|
|
| Tipi di utilizzo |
|
|
| Specifiche tecniche | ||
| Immagini |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per saperne di più, consulta Residenza dei dati. | ||
| Data del knowledge cutoff | Gennaio 2025 | |
| Versioni |
|
|
| Controlli di sicurezza | ||
| Per ulteriori informazioni, consulta Controlli di sicurezza. | ||
| Lingue supportate | Consulta la sezione Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |