Sintetiza la voz con transmisión bidireccional
En este documento, se explica el proceso de sintetizar audio con la transmisión bidireccional.
La transmisión bidireccional te permite enviar entradas de texto y recibir datos de audio de forma simultánea. Esto significa que puedes empezar a sintetizar la voz antes de que se envíe el texto de entrada completo, lo que reduce la latencia y habilita interacciones en tiempo real. Los asistentes por voz y los juegos interactivos usan la transmisión bidireccional para crear aplicaciones más dinámicas y responsivas.
Para obtener más información sobre los conceptos básicos de Text-to-Speech, consulta los conceptos básicos de Text-to-Speech.
Antes de comenzar
Antes de enviar una solicitud a la API de Text-to-Speech, debes haber realizado las siguientes acciones. Consulta la página Antes de comenzar para obtener más detalles.
- Habilita Text-to-Speech en un proyecto de Google Cloud .
- Asegúrate de que la facturación esté habilitada para Text-to-Speech.
-
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad (IdP) externo, primero debes Acceder a gcloud CLI con tu identidad federada.
Sintetiza la voz con transmisión bidireccional
Instala la biblioteca cliente
Python
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Python.
pip install --upgrade google-cloud-texttospeech
Envía una transmisión de texto y recibe una transmisión de audio
La API acepta una transmisión de solicitudes con el tipo StreamingSynthesizeRequest,
que contiene StreamingSynthesisInput o StreamingSynthesizeConfig.
Antes de enviar una transmisión StreamingSynthesizeRequest con
StreamingSynthesisInput, que proporciona una entrada de texto, envía exactamente un
StreamingSynthesizeRequest con un StreamingSynthesizeConfig.
Transmitir Text-to-Speech solo es compatible con Chirp 3: Voces en HD.
Python
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Python.
Limpia
Si quieres evitar cargos innecesarios de Google Cloud, usa Google Cloud console para borrar el proyecto si no lo necesitas.
¿Qué sigue?
- Obtén más información sobre Cloud Text-to-Speech en el artículo de Conceptos básicos.
- Revisa la lista de las voces disponibles que puedes usar como voz sintética.