Synthétiser la voix avec le streaming bidirectionnel
Ce document vous explique comment synthétiser des contenus audio à l'aide du streaming bidirectionnel.
Le streaming bidirectionnel vous permet d'envoyer des entrées de texte et de recevoir des données audio simultanément. Cela signifie que vous pouvez commencer à synthétiser la parole avant l'envoi du texte d'entrée complet, ce qui réduit la latence et permet des interactions en temps réel. Les assistants vocaux et les jeux interactifs utilisent le streaming bidirectionnel pour créer des applications plus dynamiques et réactives.
Pour en savoir plus sur les concepts fondamentaux de Cloud Text-to-Speech, consultez la page Concepts de base de Cloud Text-to-Speech.
Avant de commencer
Pour pouvoir envoyer une requête à l'API Cloud Text-to-Speech, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.
- Activez Cloud Text-to-Speech sur un projet Google Cloud .
- Assurez-vous que la facturation est activée pour Cloud Text-to-Speech.
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
Synthétiser la voix avec le streaming bidirectionnel
Installer la bibliothèque cliente
Python
Avant d'installer la bibliothèque, assurez-vous d'avoir préparé votre environnement pour le développement Python.
pip install --upgrade google-cloud-texttospeech
Envoyer un flux de texte et recevoir un flux audio
L'API accepte un flux de requêtes de type StreamingSynthesizeRequest, qui contient StreamingSynthesisInput ou StreamingSynthesizeConfig.
Avant d'envoyer un flux StreamingSynthesizeRequest avec StreamingSynthesisInput, qui fournit une entrée de texte, envoyez exactement un StreamingSynthesizeRequest avec un StreamingSynthesizeConfig.
Le streaming Cloud Text-to-Speech n'est compatible qu'avec les voix Chirp 3 HD.
Python
Avant d'exécuter l'exemple, assurez-vous d'avoir préparé l'environnement pour le développement Python.
Effectuer un nettoyage
Pour éviter d'encourir des frais inutiles liés à Google Cloud Platform, supprimez votre projet à l'aide deGoogle Cloud console si vous n'en avez plus besoin.
Étapes suivantes
- Pour en savoir plus sur Cloud Text-to-Speech, consultez la page Concepts de base.
- Passez en revue la liste des voix disponibles que vous pouvez utiliser pour la voix synthétique.