Kontingente und Limits

In diesem Dokument sind die aktuell gültigen Einschränkungen und Nutzungslimits für die Cloud Speech-to-Text API aufgeführt. Bei Änderungen der Einschränkungen und Nutzungslimits wird die Seite entsprechend aktualisiert. Wir behalten uns das Recht vor, diese Limits zu ändern.

Bei Bedarf können Sie eine Kontingenterhöhung anfordern. Weitere Informationen zum Aufrufen und Verwalten Ihres Kontingents finden Sie in Google Cloud auf der Kontingentseite.

Wenn Sie Ihre Anfrage eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihre Anfrage erfolgreich war.

Limits für Inhalte

Synchrone Anfragen

Synchrone Erkennungsanfragen (mit der Methode Recognize) akzeptieren Audiodaten entweder inline im Feld content der Anfrage oder als Cloud Storage-URI im Feld uri der Anfrage. Audiodaten, die an eine synchrone Anfrage gesendet werden, sind auf 10 MB oder eine Minute Audiolänge beschränkt (je nachdem, was zuerst erreicht wird). Weitere Informationen zur synchronen Erkennung finden Sie unter Kurze Audiodateien transkribieren.

Streaminganfragen

Anfragen zur Streamingerkennung (mit der Methode StreamingRecognize) akzeptieren Inline-Audio nur im Feld audio der Anfrage. Jede Anfrage im Stream ist auf 25 KB an Audiodaten beschränkt. Ein Stream kann bis zu 5 Minuten lang geöffnet bleiben und die Audiodaten müssen mit einer Rate gesendet werden, die ungefähr Echtzeit entspricht. Falls Sie Inhalte streamen müssen, die länger als 5 Minuten sind, lesen Sie die Anleitung unter Audio aus Streamingdaten transkribieren. Weitere Informationen zur Streamingerkennung finden Sie unter Audio aus Streamingdaten transkribieren.

Batchanfragen

Batcherkennungsanfragen (mit der Methode BatchRecognize) akzeptieren die Audiodaten nur als Cloud Storage-URI im Feld uri der Anfrage. Jede BatchRecognizeRequest-Anfrage kann bis zu 15 files zum Transkribieren enthalten. Jede Datei kann eine Dauer von bis zu 8 Stunden haben. Weitere Informationen zur asynchronen Erkennung finden Sie in der Übersicht zur Batcherkennung.

Erkennung bei mehreren Sprachen

Spracherkennung für mehrere Sprachen ist nur an den globalen Cloud Speech-to-Text-Endpunkten und an den Endpunkten in den USA und in der EU verfügbar.

Anpassung

Zusammen mit einer Anfrage können Sie auch PhraseSet- und CustomClass-Ressourcen bereitstellen. Für diese Felder gelten die folgenden Limits:

Limit für die Sprachanpassung	Wert
Maximal zulässiger Optimierungswert für Wortgruppe	20
Wortgruppen in einem PhraseSet	1.200
Wortgruppen pro Anfrage	5.000
Zeichen pro Wortgruppe	100
Zeichen pro Anfrage	100.000
Maximale Anzahl von Elementen in einer CustomClass	500
Maximale Anzahl von Zeichen pro CustomClass-Element	500
Maximale Anzahl von PhraseSets pro SpeechAdaptation	20
Maximale Anzahl von CustomClasses pro SpeechAdaptation	20

Ressourcenlimits

Für Cloud Speech-to-Text gelten aktuell die folgenden API-Ressourcenlimits (Änderungen vorbehalten):

Art des Limits	Nutzungslimit
Anzahl der Erkennungssysteme (pro Region)	5.000
Anzahl der benutzerdefinierten Klassen (pro Region)	5.000
Anzahl der Wortgruppensets (pro Region)	5.000

Anfragelimits

Für Cloud Speech-to-Text gelten aktuell die folgenden API-Nutzungslimits (Änderungen vorbehalten):

Art des Limits	Nutzungslimit
Ressourcenanforderungen pro 60 Sekunden (pro Region)	100
Vorgangsanfragen pro 60 Sekunden (pro Region)	150
Synchrone Erkennungsanfragen pro 60 Sekunden (pro Region)	300
Streamingerkennungsanfragen pro 60 Sekunden (pro Region)*	1.000.000
Gleichzeitige StreamingRecognize-Sitzungen (pro Region)*	300
Batcherkennungsanfragen pro 60 Sekunden (pro Region)	150

* Die Streamingerkennung hat ein Kontingentlimit von 300 gleichzeitigen Sitzungen pro 5 Minuten und ein Limit von 3.000 Anfragen pro Minute. Dies gilt für alle gleichzeitigen Sitzungen zusammen. Die anfängliche Konfigurationsanfrage für eine Sitzung wird nicht auf das Anfragekontingent angerechnet.

Diese Limits gelten für alle Cloud Speech-to-Text-Entwicklerprojekte sowie für alle Anwendungen und IP-Adressen, die von einem bestimmten Entwicklerprojekt verwendet werden.