Transcribe voz a texto con gcloud CLI
En esta página, se muestra cómo enviar una solicitud de reconocimiento de voz a Cloud Speech-to-Text con la herramienta de línea de comandos gcloud.
Cloud Speech-to-Text permite la integración sencilla de las tecnologías de reconocimiento de voz de Google en las aplicaciones del desarrollador. Puedes enviar datos de audio a la API de Cloud Speech-to-Text, en la que luego se muestra una transcripción de texto de ese archivo de audio. Para obtener más información sobre el servicio, consulta Conceptos básicos de Cloud STT.
Antes de comenzar
Antes de enviar una solicitud a la API de Cloud Speech-to-Text, debes completar las siguientes acciones. Consulta la página Antes de comenzar para obtener más detalles.
- Habilita Cloud Speech-to-Text en un proyecto de Google Cloud.
- Asegúrate de que la facturación esté habilitada para Cloud Speech-to-Text.
-
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad (IdP) externo, primero debes Acceder a gcloud CLI con tu identidad federada.
- Crea un bucket de Google Cloud Storage nuevo para almacenar tus datos de audio (opcional).
Realiza una solicitud de transcripción de audio
Ahora puedes usar Cloud STT para transcribir un archivo de audio a texto. Usa la siguiente muestra de código para enviar una solicitud recognize a la API de Cloud Speech-to-Text.
Abre el shell de línea de comandos y ejecuta el comando que se indica a continuación.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Con este comando, se solicita que Cloud STT transcriba el audio contenido en un FLAC alojado en una ubicación de acceso público.
Si la solicitud es exitosa, el servidor muestra una respuesta en formato JSON:
{
"results": [
{
"alternatives": [
{
"confidence": 0.9840146,
"transcript": "how old is the Brooklyn Bridge"
}
]
}
]
}¡Felicitaciones! Enviaste tu primera solicitud a Cloud STT.
Si recibes un error o una respuesta vacía de Cloud STT, consulta los pasos de solución de problemas y mitigación de errores.
Realiza una limpieza
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
- Usa Google Cloud console para borrar tu proyecto si no lo necesitas.
¿Qué sigue?
- Practica transcribir archivos de audio cortos.
- Aprende a agrupar archivos de audio largos para reconocimiento de voz.
- Aprende a transcribir audio con transmisión continua como, por ejemplo, desde un micrófono.
- Comienza a usar Cloud STT en el idioma de tu preferencia con una biblioteca cliente de Cloud STT.
- Trabaja con las aplicaciones de muestra.
- Para mejorar el rendimiento y la exactitud, así como ver otras sugerencias, consulta la documentación de prácticas recomendadas.