Cette page explique comment activer la reconnaissance de la langue pour les requêtes de transcription audio envoyées à Cloud Speech-to-Text.
Dans certaines situations, vous ne connaissez pas avec certitude la langue de vos enregistrements audio. Par exemple, si vous publiez votre service, votre application ou votre produit dans un pays où plusieurs langues officielles sont parlées, il est possible que vous receviez des entrées audio des utilisateurs dans différentes langues. Cela peut complexifier considérablement la spécification d'un code de langue unique pour les requêtes de transcription.
Reconnaissance multilingue
Cloud Speech-to-Text vous permet de spécifier un ensemble de langues supplémentaires que vos données audio peuvent contenir. Lorsque vous envoyez une requête de transcription audio à Cloud Speech-to-Text, vous pouvez fournir une liste de langues supplémentaires pouvant être parlées dans les données audio. Si vous incluez une liste de langues à votre requête, Cloud Speech-to-Text tente de transcrire le fichier audio en se basant sur la langue correspondant le mieux à un échantillon de langue supplémentaire fourni. Cloud Speech-to-Text identifie ensuite les résultats de la transcription en leur attribuant le code de langue ayant fait l'objet d'une prédiction.
L'utilisation de cette fonctionnalité convient parfaitement aux applications devant transcrire des instructions courtes, telles que des commandes ou des recherches vocales. Vous pouvez répertorier jusqu'à trois langues différentes parmi celles disponibles dans Cloud Speech-to-Text en plus de votre langue principale, soit un total de quatre langues.
Même si vous pouvez spécifier d'autres langues dans votre requête de transcription vocale, vous devez tout de même fournir un code de langue principal dans le champ languageCode. De plus, vous devez limiter autant que possible le nombre de codes de langues que vous spécifiez. Plus ce nombre est faible, plus la sélection du code approprié sera facile pour Cloud Speech-to-Text. Une requête ne spécifiant qu'une seule langue sera celle renvoyant les meilleurs résultats.
Activer la reconnaissance de la langue dans les requêtes de transcription audio
Pour spécifier d'autres langues dans votre transcription audio, vous devez définir le champ alternativeLanguageCodes sur une liste de codes de langue dans les paramètres RecognitionConfig de la requête. Cloud SST autorise la spécification de codes de langues alternatives pour toutes les méthodes de reconnaissance vocale : speech:recognize, speech:longrunningrecognize et Streaming.
Utiliser un fichier local
Protocole
Reportez-vous au point de terminaison speech:recognize de l'API pour obtenir des informations complètes.
Pour réaliser une reconnaissance vocale synchrone, exécutez une requête POST en fournissant le corps de requête approprié. Voici un exemple de requête POST utilisant curl. L'exemple utilise Google Cloud CLI pour générer un jeton d'accès. Pour obtenir des instructions sur l'installation de gcloud CLI, consultez le guide de démarrage rapide.
L'exemple suivant montre comment obtenir la transcription d'un fichier audio pouvant inclure des phrases prononcées en anglais, en allemand ou en français.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Si la requête aboutit, le serveur renvoie un code d'état HTTP 200 OK et la réponse au format JSON, enregistrée dans un fichier nommé multi-language.txt.
{
"results": [
{
"alternatives": [
{
"transcript": "hi I'd like to buy a Chromecast I'm ..."
"confidence": 0.9466864
}
],
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " let's go with the black one",
"confidence": 0.9829583
}
],
"languageCode": "en-us"
},
]
}
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Java.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Node.js.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Python.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Utiliser un fichier distant
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Java.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Node.js.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Python.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.