En esta página, se describe cómo usar Cloud Speech-to-Text para transcribir archivos de audio que incluyen más de un canal. El reconocimiento de varios canales está disponible para la mayoría de las codificaciones de audio compatibles con Cloud STT, pero no para todas. Para obtener información sobre cuántos canales se reconocen en los archivos de audio de cada tipo de codificación, consulta audioChannelCount.
Los datos de audio suelen incluir un canal para cada interlocutor presente en la grabación. Por ejemplo, el audio de dos personas que hablan por teléfono puede contener dos canales, en los que cada línea se graba por separado.
Para transcribir datos de audio que incluyen varios canales, debes proporcionar la cantidad de canales en tu solicitud a la API de Cloud Speech-to-Text. En tu solicitud, configura el campo audioChannelCount con la cantidad de canales presentes en tu audio.
Cuando envías una solicitud con varios canales, Cloud STT te muestra un resultado que identifica los distintos canales presentes en el audio y etiqueta las alternativas para cada resultado con el campo channelTag.
En la siguiente muestra de código, se explica cómo transcribir audio que contiene varios canales.
Protocolo
Consulta el extremo de la API de speech:recognize para obtener más detalles.
Para realizar un reconocimiento de voz síncrono, haz una solicitud POST y proporciona el cuerpo de la solicitud apropiado. A continuación, se muestra un ejemplo de una solicitud POST con curl. En el ejemplo, se usa Google Cloud CLI para generar un token
de acceso. Para obtener instrucciones sobre cómo instalar gcloud CLI,
consulta la guía de inicio rápido.
En el siguiente ejemplo, se muestra cómo enviar una solicitud POST con curl, donde el cuerpo de la solicitud especifica el número de canales presentes en la muestra de audio.
curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "audioChannelCount": 2, "enableSeparateRecognitionPerChannel": true }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_stereo.wav" } }' "https://speech.googleapis.com/v1/speech:recognize" > multi-channel.txt
Si la solicitud se completa correctamente, el servidor muestra un código de estado HTTP 200 OK y la respuesta en formato JSON, guardada en un archivo llamado multi-channel.json.
{
"results": [
{
"alternatives": [
{
"transcript": "hi I'd like to buy a Chromecast I'm always wondering whether you could help me with that",
"confidence": 0.8991147
}
],
"channelTag": 1,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": "certainly which color would you like we have blue black and red",
"confidence": 0.9408236
}
],
"channelTag": 2,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " let's go with the black one",
"confidence": 0.98783094
}
],
"channelTag": 1,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " would you like the new Chromecast Ultra model or the regular Chromecast",
"confidence": 0.9573053
}
],
"channelTag": 2,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " regular Chromecast is fine thank you",
"confidence": 0.9671048
}
],
"channelTag": 1,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " okay sure would you like to ship it regular or Express",
"confidence": 0.9544821
}
],
"channelTag": 2,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " express please",
"confidence": 0.9487205
}
],
"channelTag": 1,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " terrific it's on the way thank you",
"confidence": 0.97655964
}
],
"channelTag": 2,
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " thank you very much bye",
"confidence": 0.9735077
}
],
"channelTag": 1,
"languageCode": "en-us"
}
]
}
Go
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Cloud STT, consulta las bibliotecas cliente de Cloud STT. Si deseas obtener más información, consulta la documentación de referencia de la API de Cloud STT Go.
Para autenticarte en Cloud STT, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Cloud STT, consulta las bibliotecas cliente de Cloud STT. Si deseas obtener más información, consulta la documentación de referencia de la API de Cloud STT Java.
Para autenticarte en Cloud STT, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Cloud STT, consulta las bibliotecas cliente de Cloud STT. Si deseas obtener más información, consulta la documentación de referencia de la API de Cloud STT Node.js.
Para autenticarte en Cloud STT, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Cloud STT, consulta las bibliotecas cliente de Cloud STT. Si deseas obtener más información, consulta la documentación de referencia de la API de Cloud STT Python.
Para autenticarte en Cloud STT, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Idiomas adicionales
C#: Sigue las instrucciones de configuración de C# en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Cloud STT para .NET.
PHP: Sigue las instrucciones de configuración de PHP en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Cloud STT para PHP.
Ruby: Sigue las instrucciones de configuración de Ruby en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Cloud STT para Ruby.