Ce tutoriel explique comment transcrire un fichier audio enregistré à partir d'un téléphone à l'aide de Cloud Speech-to-Text.
Les fichiers audio peuvent provenir de nombreuses sources différentes et contenir des données audio enregistrées à partir d'un téléphone, par exemple d'une messagerie vocale ou de la bande-son incluse dans un fichier vidéo.
Cloud STT peut s'appuyer sur différents modèles de machine learning pour transcrire votre fichier audio, afin de correspondre au mieux à la source audio d'origine. Vous pouvez obtenir de meilleurs résultats de transcription vocale en spécifiant la source du fichier audio d'origine. Cloud STT peut ainsi traiter vos fichiers audio à l'aide d'un modèle de machine learning entraîné pour gérer des données semblables à celles de vos fichiers.
Objectifs
- Envoyer une requête de transcription audio à Cloud STT pour un contenu audio enregistré à partir d'un téléphone (par exemple, d'une messagerie vocale).
- Spécifier un modèle de reconnaissance vocale amélioré pour une requête de transcription audio.
Coûts
Ce tutoriel fait appel à des composants payants de Cloud Platform, par exemple :
- Cloud Speech-to-Text
Utilisez le Simulateur de coût pour générer une estimation des coûts en fonction de votre utilisation prévue.
Avant de commencer
Ce tutoriel a plusieurs prérequis :
- Vous devez avoir configuré un projet Cloud Speech-to-Text dans la console Google Cloud .
- Vous devez avoir configuré votre environnement à l'aide des identifiants par défaut de l'application dans la console Google Cloud .
- Vous devez avoir configuré l'environnement de développement pour le langage de programmation de votre choix.
- Vous devez avoir installé la bibliothèque cliente Google Cloud correspondant au langage de programmation de votre choix.
Envoyer une requête
Pour transcrire au mieux un fichier audio enregistré sur un téléphone (provenant par exemple d'un appel téléphonique ou d'un message vocal), vous pouvez définir le champ model de la charge utile RecognitionConfig sur phone_call. Le champ model indique à l'API Cloud Speech-to-Text quel modèle de reconnaissance vocale utiliser pour la requête de transcription.
Vous pouvez améliorer les résultats de la transcription d'un fichier audio provenant d'un téléphone en utilisant un modèle amélioré. Pour utiliser un modèle amélioré, définissez le champ useEnhanced sur true dans la charge utile RecognitionConfig.
Les exemples de code suivants montrent comment sélectionner un modèle de transcription spécifique lorsque vous appelez Cloud STT.
Protocole
Reportez-vous au point de terminaison speech:recognize de l'API pour obtenir des informations complètes.
Pour réaliser une reconnaissance vocale synchrone, exécutez une requête POST en fournissant le corps de requête approprié. Voici un exemple de requête POST utilisant curl. L'exemple utilise Google Cloud CLI pour générer un jeton d'accès. Pour obtenir des instructions sur l'installation de gcloud CLI, consultez le guide de démarrage rapide.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "enableWordTimeOffsets": false, "enableAutomaticPunctuation": true, "model": "phone_call", "useEnhanced": true }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }'
Pour en savoir plus sur la configuration du corps de la requête, consultez la documentation de référence sur RecognitionConfig.
Si la requête aboutit, le serveur renvoie un code d'état HTTP 200 OK ainsi que la réponse au format JSON :
{ "results": [ { "alternatives": [ { "transcript": "Hi, I'd like to buy a Chromecast. I was wondering whether you could help me with that.", "confidence": 0.8930228 } ], "resultEndTime": "5.640s" }, { "alternatives": [ { "transcript": " Certainly, which color would you like? We are blue black and red.", "confidence": 0.9101991 } ], "resultEndTime": "10.220s" }, { "alternatives": [ { "transcript": " Let's go with the black one.", "confidence": 0.8818244 } ], "resultEndTime": "13.870s" }, { "alternatives": [ { "transcript": " Would you like the new Chromecast Ultra model or the regular Chromecast?", "confidence": 0.94733626 } ], "resultEndTime": "18.460s" }, { "alternatives": [ { "transcript": " Regular Chromecast is fine. Thank you. Okay. Sure. Would you like to ship it regular or Express?", "confidence": 0.9519095 } ], "resultEndTime": "25.930s" }, { "alternatives": [ { "transcript": " Express, please.", "confidence": 0.9101229 } ], "resultEndTime": "28.260s" }, { "alternatives": [ { "transcript": " Terrific. It's on the way. Thank you. Thank you very much. Bye.", "confidence": 0.9321616 } ], "resultEndTime": "34.150s" } ] }
Go
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Go.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Java.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Node.js.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Python.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Langages supplémentaires
C# : Veuillez suivre les instructions de configuration pour C# sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour .NET.
PHP : Veuillez suivre les instructions de configuration pour PHP sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour PHP.
Ruby : Veuillez suivre les instructions de configuration pour Ruby sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour Ruby.
Effectuer un nettoyage
Pour éviter que les ressources utilisées dans ce tutoriel soient facturées sur votre compte Google Cloud, supprimez le projet contenant les ressources, ou conservez le projet et supprimez chaque ressource individuellement.
Supprimer le projet
Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.
Pour supprimer le projet :
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Supprimer les instances
Pour supprimer une instance Compute Engine, procédez comme suit :
- In the Google Cloud console, go to the VM instances page.
- Select the checkbox for the instance that you want to delete.
- To delete the instance, click More actions, click Delete, and then follow the instructions.
Supprimer des règles de pare-feu pour le réseau par défaut
Pour supprimer une règle de pare-feu, procédez comme suit :
- In the Google Cloud console, go to the Firewall page.
- Select the checkbox for the firewall rule that you want to delete.
- To delete the firewall rule, click Delete.