Auf dieser Seite wird gezeigt, wie kurze Audiodateien mithilfe der synchronen Spracherkennung in Text transkribiert werden.
Bei der synchronen Spracherkennung wird der erkannte Text für eine kurze Audiosequenz (unter 60 Sekunden) zurückgegeben. Zur Verarbeitung einer Spracherkennungsanfrage für Audiodaten, die länger als 60 Sekunden sind, verwenden Sie die asynchrone Spracherkennung.
Audioinhalte können direkt aus einer lokalen Datei an Cloud Speech-to-Text gesendet werden. Alternativ kann Cloud Speech-to-Text in einem Cloud Storage-Bucket gespeicherte Audioinhalte verarbeiten. Auf der Seite Kontingente und Limits finden Sie Limits für Anfragen zur synchronen Spracherkennung.
Synchrone Spracherkennung für eine lokale Datei durchführen
Hier ist ein Beispiel für eine synchrone Spracherkennung mit einer lokalen Audiodatei:
REST
Ausführliche Informationen finden Sie unter dem API-Endpunkt speech:recognize. Weitere Informationen zum Konfigurieren des Anfragetexts finden Sie in der Referenzdokumentation zu RecognitionConfig.
Der im Anfragetext bereitgestellte Audioinhalt muss base64-codiert sein.
Weitere Informationen zur Base64-Codierung erhalten Sie unter Base64-Codierung von Audioinhalten. Weitere Informationen zum Feld content finden Sie in der Referenzdokumentation zu RecognitionAudio.
Ersetzen Sie folgende Werte in den Anfragedaten:
- LANGUAGE_CODE: BCP-47-Code der Sprache, die im Audioclip gesprochen wird
- ENCODING: Codierung der zu transkribierenden Audiodaten
- SAMPLE_RATE_HERTZ: Abtastrate der zu transkribierenden Audiodaten in Hertz
- ENABLE_WORD_TIME_OFFSETS: Aktivieren Sie dieses Feld, wenn Zeitstempel für Beginn und Ende von Wörtern zurückgegeben werden sollen.
- INPUT_AUDIO: base64-codierter String der zu transkribierenden Audiodaten
- PROJECT_ID: alphanumerische ID Ihres Projekts in Google Cloud
HTTP-Methode und URL:
POST https://speech.googleapis.com/v2/speech:recognize
JSON-Text der Anfrage:
{
"config": {
"languageCode": "LANGUAGE_CODE",
"encoding": "ENCODING",
"sampleRateHertz": SAMPLE_RATE_HERTZ,
"enableWordTimeOffsets": ENABLE_WORD_TIME_OFFSETS
},
"audio": {
"content": "INPUT_AUDIO"
}
}
Wenn Sie die Anfrage senden möchten, erweitern Sie eine der folgenden Optionen:
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98267895
}
]
}
]
}
gcloud
Ausführliche Informationen finden Sie auf der Seite für den Befehl recognize.
Verwenden Sie für die Spracherkennung mit einer lokalen Datei die Google Cloud CLI und geben Sie den Pfad der Datei an.
gcloud ml speech recognize PATH-TO-LOCAL-FILE --language-code='en-US'
Wenn die Anfrage erfolgreich ist, gibt der Server eine Antwort im JSON-Format zurück:
{
"results": [
{
"alternatives": [
{
"confidence": 0.9840146,
"transcript": "how old is the Brooklyn Bridge"
}
]
}
]
}Go
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Go.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Java.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Node.js.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Python.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Weitere Sprachen
C#: Folgen Sie der Einrichtungsanleitung für C# auf der Seite der Clientbibliotheken und rufen Sie dann die Cloud STT-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Einrichtungsanleitung für PHP auf der Seite der Clientbibliotheken und rufen Sie dann die Cloud STT-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Einrichtungsanleitung für Ruby auf der Seite der Clientbibliotheken und rufen Sie dann die Cloud STT-Referenzdokumentation für Ruby auf.
Synchrone Spracherkennung für eine Remotedatei durchführen
Die Cloud Speech-to-Text API kann die synchrone Spracherkennung direkt für eine Audiodatei in Cloud Storage ausführen, ohne dass Sie den Inhalt der Audiodatei im Text Ihrer Anfrage senden müssen.
Hier ist ein Beispiel für eine synchrone Spracherkennung mit einer Datei in Cloud Storage:
REST
Ausführliche Informationen finden Sie unter dem API-Endpunkt speech:recognize. Weitere Informationen zum Konfigurieren des Anfragetexts finden Sie in der Referenzdokumentation zu RecognitionConfig.
Der im Anfragetext bereitgestellte Audioinhalt muss base64-codiert sein.
Weitere Informationen zur Base64-Codierung erhalten Sie unter Base64-Codierung von Audioinhalten. Weitere Informationen zum Feld content finden Sie in der Referenzdokumentation zu RecognitionAudio.
Ersetzen Sie folgende Werte in den Anfragedaten:
- LANGUAGE_CODE: BCP-47-Code der Sprache, die im Audioclip gesprochen wird
- ENCODING: Codierung der zu transkribierenden Audiodaten
- SAMPLE_RATE_HERTZ: Abtastrate der zu transkribierenden Audiodaten in Hertz
- ENABLE_WORD_TIME_OFFSETS: Aktivieren Sie dieses Feld, wenn Zeitstempel für Beginn und Ende von Wörtern zurückgegeben werden sollen.
- STORAGE_BUCKET: Cloud Storage-Bucket
- INPUT_AUDIO: die zu transkribierende Audiodatei
- PROJECT_ID: alphanumerische ID Ihres Projekts in Google Cloud
HTTP-Methode und URL:
POST https://speech.googleapis.com/v2/speech:recognize
JSON-Text der Anfrage:
{
"config": {
"languageCode": "LANGUAGE_CODE",
"encoding": "ENCODING",
"sampleRateHertz": SAMPLE_RATE_HERTZ,
"enableWordTimeOffsets": ENABLE_WORD_TIME_OFFSETS
},
"audio": {
"uri": "gs://STORAGE_BUCKET/INPUT_AUDIO"
}
}
Wenn Sie die Anfrage senden möchten, erweitern Sie eine der folgenden Optionen:
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98267895
}
]
}
]
}
gcloud
Ausführliche Informationen finden Sie auf der Seite für den Befehl recognize.
Verwenden Sie für die Spracherkennung mit einer lokalen Datei die Google Cloud CLI und geben Sie den Pfad der Datei an.
gcloud ml speech recognize 'gs://cloud-samples-tests/speech/brooklyn.flac' \ --language-code='en-US'
Wenn die Anfrage erfolgreich ist, gibt der Server eine Antwort im JSON-Format zurück:
{
"results": [
{
"alternatives": [
{
"confidence": 0.9840146,
"transcript": "how old is the Brooklyn Bridge"
}
]
}
]
}Go
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Go.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Java.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Node.js.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Cloud STT finden Sie unter Cloud STT-Clientbibliotheken. Weitere Informationen finden Sie in der API-Referenzdokumentation zu Cloud STT Python.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud STT zu authentifizieren. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Weitere Sprachen
C#: Folgen Sie der Einrichtungsanleitung für C# auf der Seite der Clientbibliotheken und rufen Sie dann die Cloud STT-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Einrichtungsanleitung für PHP auf der Seite der Clientbibliotheken und rufen Sie dann die Cloud STT-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Einrichtungsanleitung für Ruby auf der Seite der Clientbibliotheken und rufen Sie dann die Cloud STT-Referenzdokumentation für Ruby auf.