Verhalten bei einzelner gesprochener Eingabe

Cloud Speech-to-Text stellt das Modell latest_short zur Erkennung von Sprache bereit, die aus einzelnen gesprochenen Eingaben besteht. Dies kann für Anwendungen nützlich sein, bei denen Nutzer einzelne Sprachbefehle anstatt eines langen Monologs oder Diktats ausgeben.

Wenn ein Recognizer mit dem Modell latest_short für eine Erkennungsanfrage verwendet wird, beendet Cloud STT die Erkennung, sobald eine gesprochene Eingabe abgeschlossen ist. Cloud STT gibt eine Ereignisantwort für die Sprachaktivität vom Typ END_OF_SINGLE_UTTERANCE zurück, gefolgt von den Transkriptionsergebnissen.

Einzelne Äußerung und StreamingRecognize

Wenn für eine StreamingRecognize-Anfrage ein latest_short-Modell Recognizer ausgewählt wird, schließt Cloud STT den Stream automatisch, nachdem die Spracheingabe beendet ist.

Mit Sprachaktivitätsereignissen

Wenn Sprachaktivitätsereignisse auch für eine StreamingRecognize-Anfrage aktiviert wurden, gibt Cloud STT weiterhin Ereignisse vom Typ „Anfang“ und „Ende“ für Sprachaktivitätsereignisse zurück.

Auch die Zeitlimits von Sprachaktivitäten für den Sprachbeginn werden weiterhin angewendet. Hingegen werden die Zeitlimits von Sprachaktivitäten für das Ende der Sprache nicht weiter angewendet, da der Stream geschlossen wird, sobald die Spracheingabe endet.