Gemini 2.5 Flash con le funzionalità audio native dell'API Gemini Live offre la nostra funzionalità audio nativa all'avanguardia per l'API Gemini Live. Oltre alle funzionalità standard dell'API Gemini Live, questo modello include:
- Qualità audio migliorata:goditi una qualità audio notevolmente migliorata che ti farà sentire come se stessi parlando con una persona.
- Qualità e adattabilità della voce migliorate:l'API Gemini Live offre un audio nativo che consente interazioni vocali più ricche e naturali con 30 voci HD in 24 lingue.
- Ti presentiamo Audio Proattivo: (anteprima) Quando Audio Proattivo è attivo, il modello risponde solo quando è pertinente. Il modello genera trascrizioni di testo e risposte audio in modo proattivo solo per le query indirizzate al dispositivo e non risponde alle query non indirizzate al dispositivo.
- Ti presentiamo Affective Dialog: i modelli che utilizzano l'audio nativo dell'API Gemini Live possono comprendere e rispondere in modo appropriato alle espressioni emotive degli utenti per conversazioni più sfumate.
- Interruzione migliorata: interrompi Gemini in modo più naturale e affidabile, anche in ambienti rumorosi.
- Chiamata di funzioni affidabile: abbiamo migliorato la frequenza di attivazione, consentendo a Gemini di eseguire correttamente le funzioni che definisci per supportare i tuoi casi d'uso.
- Trascrizione accurata: l'accuratezza della trascrizione dell'audio in testo è stata notevolmente migliorata.
- Supporto multilingue senza interruzioni: parla con Gemini in più lingue e passerà da una all'altra senza problemi e senza alcuna preconfigurazione. La lingua non è più un ostacolo.
Per saperne di più sull'API Gemini Live, consulta:
- La nostra documentazione dell'API Gemini Live autonoma.
- I formati audio supportati dall'API Gemini Live.
- I nostri limiti di sessioni simultanee dell'API Gemini Live.
Live 2.5 Flash Native Audio
| ID modello | gemini-live-2.5-flash-native-audio |
|
|---|---|---|
| Input e output supportati |
|
|
| Limiti di token |
|
|
| Numero massimo di sessioni simultanee | ||
| Funzionalità |
|
|
| Opzioni di consumo |
|
|
| Per saperne di più, consulta Opzioni di consumo. | ||
| Specifiche tecniche | ||
| Immagini |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per ulteriori informazioni, consulta Deployment ed endpoint. | ||
| Versioni |
|
|
| Controlli di sicurezza | ||
| Previsione online |
|
|
| Per saperne di più, consulta Controlli di sicurezza. | ||
| Lingue supportate | Consulta la sezione Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |
Anteprima audio nativa di Live 2.5 Flash
| ID modello | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Input e output supportati |
|
|
| Limiti di token |
|
|
| Numero massimo di sessioni simultanee | ||
| Funzionalità |
|
|
| Opzioni di consumo |
|
|
| Per saperne di più, consulta Opzioni di consumo. | ||
| Specifiche tecniche | ||
| Immagini |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per ulteriori informazioni, consulta Deployment ed endpoint. | ||
| Data del knowledge cutoff | Agosto 2025 | |
| Versioni |
|
|
| Lingue supportate | Consulta la sezione Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |