Bei Bedarf können Sie eine Kontingenterhöhung anfordern. Weitere Informationen zum Aufrufen und Verwalten Ihres Kontingents finden Sie in Google Cloud auf der Kontingentseite.
Wenn Sie Ihre Anfrage eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihre Anfrage erfolgreich war.
Limits für Inhalte
Synchrone Anfragen
Synchrone Erkennungsanfragen (mit der Methode Recognize) akzeptieren Audiodaten entweder inline im Feld content der Anfrage oder als Cloud Storage-URI im Feld uri der Anfrage. Audiodaten, die an eine synchrone Anfrage gesendet werden, sind auf 10 MB oder eine Minute Audiolänge beschränkt (je nachdem, was zuerst erreicht wird). Weitere Informationen zur synchronen Erkennung finden Sie unter Kurze Audiodateien transkribieren.
Streaminganfragen
Anfragen zur Streamingerkennung (mit der Methode StreamingRecognize) akzeptieren Inline-Audio nur im Feld audio der Anfrage. Jede Anfrage im Stream ist auf 25 KB an Audiodaten beschränkt. Ein Stream kann bis zu 5 Minuten lang geöffnet bleiben und die Audiodaten müssen mit einer Rate gesendet werden, die ungefähr Echtzeit entspricht. Falls Sie Inhalte streamen müssen, die länger als 5 Minuten sind, lesen Sie die Anleitung unter Audio aus Streamingdaten transkribieren. Weitere Informationen zur Streamingerkennung finden Sie unter Audio aus Streamingdaten transkribieren.
Batchanfragen
Batcherkennungsanfragen (mit der Methode BatchRecognize) akzeptieren die Audiodaten nur als Cloud Storage-URI im Feld uri der Anfrage. Jede BatchRecognizeRequest-Anfrage kann bis zu 15 files zum Transkribieren enthalten.
Jede Datei kann eine Dauer von bis zu 8 Stunden haben. Weitere Informationen zur asynchronen Erkennung finden Sie in der Übersicht zur Batcherkennung.
Erkennung bei mehreren Sprachen
Spracherkennung für mehrere Sprachen ist nur an den globalen Cloud Speech-to-Text-Endpunkten und an den Endpunkten in den USA und in der EU verfügbar.
Anpassung
Zusammen mit einer Anfrage können Sie auch PhraseSet- und CustomClass-Ressourcen bereitstellen. Für diese Felder gelten die folgenden Limits:
| Limit für die Sprachanpassung | Wert |
|---|---|
| Maximal zulässiger Optimierungswert für Wortgruppe | 20 |
| Wortgruppen in einem PhraseSet | 1.200 |
| Wortgruppen pro Anfrage | 5.000 |
| Zeichen pro Wortgruppe | 100 |
| Zeichen pro Anfrage | 100.000 |
| Maximale Anzahl von Elementen in einer CustomClass | 500 |
| Maximale Anzahl von Zeichen pro CustomClass-Element | 500 |
| Maximale Anzahl von PhraseSets pro SpeechAdaptation | 20 |
| Maximale Anzahl von CustomClasses pro SpeechAdaptation | 20 |
Ressourcenlimits
Für Cloud Speech-to-Text gelten aktuell die folgenden API-Ressourcenlimits (Änderungen vorbehalten):
| Art des Limits | Nutzungslimit |
|---|---|
| Anzahl der Erkennungssysteme (pro Region) | 5.000 |
| Anzahl der benutzerdefinierten Klassen (pro Region) | 5.000 |
| Anzahl der Wortgruppensets (pro Region) | 5.000 |
Anfragelimits
Für Cloud Speech-to-Text gelten aktuell die folgenden API-Nutzungslimits (Änderungen vorbehalten):
| Art des Limits | Nutzungslimit |
|---|---|
| Ressourcenanforderungen pro 60 Sekunden (pro Region) | 100 |
| Vorgangsanfragen pro 60 Sekunden (pro Region) | 150 |
| Synchrone Erkennungsanfragen pro 60 Sekunden (pro Region) | 300 |
| Streamingerkennungsanfragen pro 60 Sekunden (pro Region)* | 1.000.000 |
| Gleichzeitige StreamingRecognize-Sitzungen (pro Region)* | 300 |
| Batcherkennungsanfragen pro 60 Sekunden (pro Region) | 150 |
* Die Streamingerkennung hat ein Kontingentlimit von 300 gleichzeitigen Sitzungen pro 5 Minuten und ein Limit von 3.000 Anfragen pro Minute. Dies gilt für alle gleichzeitigen Sitzungen zusammen. Die anfängliche Konfigurationsanfrage für eine Sitzung wird nicht auf das Anfragekontingent angerechnet.
Diese Limits gelten für alle Cloud Speech-to-Text-Entwicklerprojekte sowie für alle Anwendungen und IP-Adressen, die von einem bestimmten Entwicklerprojekt verwendet werden.