Gemini 2.5 Flash mit nativen Audiofunktionen der Live API bietet unsere hochmoderne native Audiofunktion für die Live API. Zusätzlich zu den Standardfunktionen der Live API bietet dieses Vorschau-Modell Folgendes:
- Bessere Audioqualität:Die Audioqualität wurde deutlich verbessert und es fühlt sich an, als würden Sie mit einer echten Person sprechen.
- Verbesserte Sprachqualität und Anpassungsfähigkeit:Die native Audiofunktion der Live API bietet dank 30 HD-Stimmen in 24 Sprachen natürlichere Sprachinteraktionen.
- Einführung von Proactive Audio:Wenn Proactive Audio aktiviert ist, reagiert das Modell nur, wenn es relevant ist. Das Modell generiert proaktiv nur für Anfragen, die an das Gerät gerichtet sind, Texttranskripte und Audioantworten und reagiert nicht auf Anfragen, die nicht an das Gerät gerichtet sind.
- Affektiver Dialog:Modelle, die die native Audio-Funktion der Live API verwenden, können die emotionalen Äußerungen von Nutzern verstehen und angemessen darauf reagieren, um nuanciertere Unterhaltungen zu ermöglichen.
- Verbesserte Unterbrechungsfunktion:Sie können Gemini jetzt natürlicher und zuverlässiger unterbrechen, auch in lauten Umgebungen.
- Robuste Funktionsaufrufe:Wir haben die Auslöserate verbessert, sodass Gemini die von Ihnen definierten Funktionen zur Unterstützung Ihrer Anwendungsfälle erfolgreich ausführen kann.
- Genaue Transkription:Die Genauigkeit der Audio-zu-Text-Transkription wurde deutlich verbessert.
- Nahtlose mehrsprachige Unterstützung:Sie können mit Gemini in mehreren Sprachen sprechen und die KI wechselt mühelos zwischen den Sprachen, ohne dass eine Vorkonfiguration erforderlich ist. Sprache ist kein Hindernis mehr.
Weitere Informationen zur Live API finden Sie hier:
- Eigenständige Live API-Dokumentation
- Von der Live API unterstützte Audioformate
- Gleichzeitige Sitzungen mit der Live API
Modell-ID | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
---|---|---|
Unterstützte Ein- und Ausgaben |
|
|
Token limits |
|
|
Leistungsspektrum |
|
|
Nutzungstypen |
|
|
Technische Spezifikationen | ||
Video |
|
|
Audio |
|
|
Parameterstandardwerte |
|
|
Unterstützte Regionen | ||
Modellverfügbarkeit |
|
|
Weitere Informationen finden Sie unter Datenstandort. | ||
Wissensstichtag | Januar 2025 | |
Versionen |
|
|
Sicherheitskontrollen | ||
Weitere Informationen finden Sie unter Sicherheitskontrollen. | ||
Unterstützte Sprachen | Unterstützte Sprachen | |
Preise | Weitere Informationen finden Sie unter Preise. |