Gemini 2.5 Flash mit nativen Audiofunktionen der Gemini Live API bietet unsere innovative native Audiofunktion für die Gemini Live API. Zusätzlich zu den Standardfunktionen der Gemini Live API bietet dieses Modell:
- Audio-Optimierung:Erleben Sie eine deutlich verbesserte Audioqualität, die sich anfühlt, als würden Sie mit einer echten Person sprechen.
- Verbesserte Sprachqualität und Anpassungsfähigkeit:Die Gemini Live API bietet mit nativem Audio reichhaltigere und natürlichere Sprachinteraktionen mit 30 HD-Stimmen in 24 Sprachen.
- Proaktives Audio (Vorabversion) Wenn „Proaktives Audio“ aktiviert ist, reagiert das Modell nur, wenn es relevant ist. Das Modell generiert proaktiv nur für Anfragen, die an das Gerät gerichtet sind, Texttranskripte und Audioantworten und reagiert nicht auf Anfragen, die nicht an das Gerät gerichtet sind.
- Affektiver Dialog:Modelle, die die native Audiofunktion der Gemini Live API verwenden, können die emotionalen Äußerungen von Nutzern verstehen und angemessen darauf reagieren, um nuanciertere Unterhaltungen zu ermöglichen.
- Verbesserte Unterbrechungsfunktion:Sie können Gemini jetzt natürlicher und zuverlässiger unterbrechen, auch in lauten Umgebungen.
- Robuste Funktionsaufrufe:Wir haben die Auslöserate verbessert, sodass Gemini die von Ihnen definierten Funktionen zur Unterstützung Ihrer Anwendungsfälle erfolgreich ausführen kann.
- Genaue Transkription:Die Genauigkeit der Audio-zu-Text-Transkription wurde deutlich verbessert. Um noch bessere Ergebnisse zu erzielen, können Sie dem Modell Sprachhinweise geben, damit es die richtige Sprache verwendet. Weitere Informationen finden Sie unter Audio-Transkription für die Sitzung aktivieren.
- Nahtlose mehrsprachige Unterstützung:Sie können mit Gemini in mehreren Sprachen sprechen und die KI wechselt mühelos zwischen den Sprachen, ohne dass Sie etwas vorkonfigurieren müssen. Sprache ist kein Hindernis mehr.
Weitere Informationen zur Gemini Live API finden Sie hier:
- Eigenständige Dokumentation zur Gemini Live API
- Von der Gemini Live API unterstützte Audioformate
- Gleichzeitige Sitzungen mit der Gemini Live API
Live 2.5 Flash Native Audio
In der Agent Platform ausprobieren
| Modell-ID | gemini-live-2.5-flash-native-audio |
|
|---|---|---|
| Unterstützte Ein- und Ausgaben |
|
|
| Token limits |
|
|
| Maximale Anzahl gleichzeitiger Sitzungen | ||
| Leistungsspektrum |
|
|
| Nutzungsoptionen |
|
|
| Weitere Informationen finden Sie unter Nutzungsoptionen. | ||
| Technische Spezifikationen | ||
| Google Bilder |
|
|
| Video |
|
|
| Audio |
|
|
| Parameterstandardwerte |
|
|
| Unterstützte Regionen | ||
|
Modellverfügbarkeit |
|
|
| Weitere Informationen finden Sie unter Bereitstellungen und Endpunkte. | ||
| Versionen |
|
|
| Sicherheitskontrollen | ||
| Onlinevorhersage |
|
|
| Weitere Informationen finden Sie unter Sicherheitskontrollen. | ||
| Unterstützte Sprachen | Siehe unterstützte Sprachen | |
| Preise | Weitere Informationen finden Sie unter Preise. | |
Live-Vorschau von nativen Audioanzeigen mit Gemini 2.5 Flash
In der Agent Platform ausprobieren
| Modell-ID | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
|---|---|---|
| Unterstützte Ein- und Ausgaben |
|
|
| Token limits |
|
|
| Maximale Anzahl gleichzeitiger Sitzungen | ||
| Leistungsspektrum |
|
|
| Nutzungsoptionen |
|
|
| Weitere Informationen finden Sie unter Nutzungsoptionen. | ||
| Technische Spezifikationen | ||
| Google Bilder |
|
|
| Video |
|
|
| Audio |
|
|
| Parameterstandardwerte |
|
|
| Unterstützte Regionen | ||
|
Modellverfügbarkeit |
|
|
| Weitere Informationen finden Sie unter Bereitstellungen und Endpunkte. | ||
| Wissensstichtag | August 2025 | |
| Versionen |
|
|
| Unterstützte Sprachen | Siehe unterstützte Sprachen | |
| Preise | Weitere Informationen finden Sie unter Preise. | |