Gemini 2.5 Flash con le funzionalità audio native dell'API Gemini Live offre funzionalità audio native all'avanguardia per l'API Gemini Live. Oltre alle funzionalità standard dell'API Gemini Live, questo modello include:
- Qualità audio migliorata:goditi una qualità audio notevolmente migliorata che ti farà sentire come se stessi parlando con una persona.
- Qualità e adattabilità della voce migliorate:l'API Gemini Live offre un audio nativo che consente interazioni vocali più ricche e naturali con 30 voci HD in 24 lingue.
- Ti presentiamo Audio Proattivo: (anteprima) Quando Audio Proattivo è attivo, il modello risponde solo quando è pertinente. Il modello genera trascrizioni di testo e risposte audio in modo proattivo solo per le query indirizzate al dispositivo e non risponde alle query non indirizzate al dispositivo.
- Ti presentiamo Affective Dialog: i modelli che utilizzano l'audio nativo dell'API Gemini Live possono comprendere e rispondere in modo appropriato alle espressioni emotive degli utenti per conversazioni più sfumate.
- Interruzione migliorata: interrompi Gemini in modo più naturale e affidabile, anche in ambienti rumorosi.
- Chiamata di funzioni affidabile: abbiamo migliorato la frequenza di attivazione, consentendo a Gemini di eseguire correttamente le funzioni che definisci per supportare i tuoi casi d'uso.
- Trascrizione accurata: l'accuratezza della trascrizione dell'audio in testo è stata notevolmente migliorata.
- Supporto multilingue senza interruzioni: parla con Gemini in più lingue e passerà da una all'altra senza problemi e senza alcuna preconfigurazione. La lingua non è più un ostacolo.
Per saperne di più sull'API Gemini Live, consulta:
- La nostra documentazione dell'API Gemini Live autonoma.
- I formati audio supportati dall'API Gemini Live.
- I nostri limiti di sessioni simultanee dell'API Gemini Live.
Live 2.5 Flash Native Audio
| ID modello | gemini-live-2.5-flash-native-audio |
|
|---|---|---|
| Ingressi e uscite supportati |
|
|
| Limiti di token |
|
|
| Funzionalità |
|
|
| Tipi di utilizzo |
|
|
| Specifiche tecniche | ||
| Immagini |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per ulteriori informazioni, consulta Deployment ed endpoint. | ||
| Versioni |
|
|
| Controlli di sicurezza | ||
| Previsione online |
|
|
| Per ulteriori informazioni, consulta Controlli di sicurezza. | ||
| Lingue supportate | Consulta la sezione Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |
Anteprima audio nativa di Live 2.5 Flash
| ID modello | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Ingressi e uscite supportati |
|
|
| Limiti di token |
|
|
| Funzionalità |
|
|
| Tipi di utilizzo |
|
|
| Specifiche tecniche | ||
| Immagini |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per ulteriori informazioni, consulta Deployment ed endpoint. | ||
| Data del knowledge cutoff | Agosto 2025 | |
| Versioni |
|
|
| Controlli di sicurezza | ||
| Per ulteriori informazioni, consulta Controlli di sicurezza. | ||
| Lingue supportate | Consulta la sezione Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |