Transcribir la voz a texto con bibliotecas cliente
En esta página, se muestra cómo enviar una solicitud de reconocimiento de voz a Cloud Speech-to-Text en tu lenguaje de programación favorito con lasGoogle Cloud bibliotecas cliente.
Cloud Speech-to-Text permite la integración sencilla de las tecnologías de reconocimiento de voz de Google en las aplicaciones del desarrollador. Puedes enviar datos de audio a la API de Cloud Speech-to-Text, que luego muestra una transcripción de texto de ese archivo de audio. Para obtener más información sobre el servicio, consulta Conceptos básicos de Cloud STT.
Antes de comenzar
Antes de enviar una solicitud a la API de Cloud Speech-to-Text, debes completar las siguientes acciones. Consulta la página Antes de comenzar para obtener más detalles.
- Habilita Cloud Speech-to-Text en un proyecto de Google Cloud .
- Asegúrate de que la facturación esté habilitada para Cloud Speech-to-Text.
-
Instala Google Cloud CLI. Después de instalarla, inicializa Google Cloud CLI ejecutando el siguiente comando:
gcloud initSi usas un proveedor de identidad (IdP) externo, primero debes Acceder a gcloud CLI con tu identidad federada.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- Verifica que tengas los permisos necesarios para completar esta guía. Si creaste un proyecto nuevo para esta guía, ya tienes los permisos necesarios.
- Crea un bucket de Cloud Storage nuevo para almacenar tus datos de audio (opcional).
Roles obligatorios
Para obtener los permisos que necesitas para transcribir voz a texto, pídele a tu administrador que te otorgue el rol de IAM de Consumidor de Service Usage (roles/serviceusage.serviceUsageConsumer) en tu proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Instala la biblioteca cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code or IntelliJ, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Node.js.
npm install @google-cloud/speech
Python
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Python.
pip install --upgrade google-cloud-speech
Realiza una solicitud de transcripción de audio
Ahora puedes usar Cloud STT para transcribir un archivo de audio a texto. Usa el siguiente código para enviar una solicitud recognize a la API de Cloud Speech-to-Text.
Go
Java
Node.js
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Node.js.
Python
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Python.
¡Felicitaciones! Enviaste tu primera solicitud a Cloud STT.
Si recibes un error o una respuesta vacía de Cloud STT, consulta los pasos de solución de problemas y mitigación de errores.
Realiza una limpieza
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
- Usa Google Cloud console para borrar tu proyecto si no lo necesitas.
¿Qué sigue?
- Practica transcribir archivos de audio cortos.
- Aprende a agrupar archivos de audio largos para reconocimiento de voz.
- Aprende a transcribir audio con transmisión continua como, por ejemplo, desde un micrófono.
- Comienza a usar Cloud STT en el idioma de tu preferencia con una biblioteca cliente de Cloud STT.
- Trabaja con las aplicaciones de muestra.
- Para mejorar el rendimiento y la exactitud, así como ver otras sugerencias, consulta la documentación de prácticas recomendadas.