Transcribir voz a texto con la CLI de gcloud
En esta página se explica cómo enviar una solicitud de reconocimiento de voz a Cloud Speech-to-Text mediante la herramienta gcloud desde la línea de comandos.
Cloud Speech-to-Text permite integrar de forma sencilla las tecnologías de reconocimiento de voz de Google en las aplicaciones de desarrolladores. Puedes enviar datos de audio a la API Cloud Speech-to-Text, que devuelve una transcripción de texto de ese archivo de audio. Para obtener más información sobre el servicio, consulta el artículo Conceptos básicos de Cloud STT.
Antes de empezar
Antes de enviar una solicitud a la API Cloud Speech-to-Text, debes haber completado las siguientes acciones. Consulta la página Antes de empezar para obtener más información.
- Habilita Cloud Speech-to-Text en un proyecto de GCP.
- Asegúrate de que la facturación esté habilitada en Transcripción de voz de Cloud.
-
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud initSi utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
- (Opcional) Crea un segmento de Google Cloud Storage para almacenar tus datos de audio.
Hacer una solicitud de transcripción de audio
Ahora puedes usar Cloud STT para transcribir un archivo de audio a texto. Usa el siguiente código de ejemplo para enviar una solicitud recognize a la API Cloud Speech-to-Text.
Abre el shell de línea de comandos y ejecuta el siguiente comando.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Este comando solicita que Cloud STT transcriba el audio contenido en un archivo FLAC alojado en una ubicación de acceso público.
Si la solicitud se realiza de forma correcta, el servidor devuelve una respuesta en formato JSON:
{
"results": [
{
"alternatives": [
{
"confidence": 0.9840146,
"transcript": "how old is the Brooklyn Bridge"
}
]
}
]
}¡Enhorabuena! Has enviado tu primera solicitud a Cloud STT.
Si recibes un error o una respuesta vacía de Cloud STT, consulta los pasos para solucionar problemas y mitigar errores.
Limpieza
Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.
- Usa el Google Cloud console para eliminar el proyecto si no lo necesitas.
Siguientes pasos
- Practica transcribiendo archivos de audio cortos.
- Consulta cómo procesar por lotes archivos de audio largos para el reconocimiento de voz.
- Consulta cómo transcribir audio en streaming, como el de un micrófono.
- Empieza a usar Cloud STT en el idioma que elijas con una biblioteca de cliente de Cloud STT.
- Consulta las aplicaciones de ejemplo.
- Para obtener el mejor rendimiento, precisión y otros consejos, consulta la documentación sobre prácticas recomendadas.