Vous trouverez dans cette section la procédure à suivre pour transcrire en texte des fichiers audio à partir de données diffusées en streaming, comme le contenu enregistré avec un micro.
La reconnaissance vocale en streaming vous permet de diffuser du contenu audio dans Cloud Speech-to-Text et de recevoir les résultats de la reconnaissance vocale en streaming et en temps réel à mesure que les données audio sont traitées. Consultez également les limites audio pour les requêtes de reconnaissance vocale en streaming. Ce type de reconnaissance est uniquement disponible via gRPC.
Effectuer une reconnaissance vocale en streaming sur un fichier local
Voici un exemple d'exécution de reconnaissance vocale en streaming sur un fichier audio local. La taille des requêtes de streaming envoyées à l'API est limitée à 10 Mo. Cette limite s'applique aussi bien à la requête StreamingRecognize initiale qu'à la taille de chaque message contenu dans le flux. Tout dépassement de cette limite génère une erreur.
Go
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Go.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Java.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Node.js.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Python.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Langages supplémentaires
C# : Veuillez suivre les instructions de configuration pour C# sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour .NET.
PHP : Veuillez suivre les instructions de configuration pour PHP sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour PHP.
Ruby : Veuillez suivre les instructions de configuration pour Ruby sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour Ruby.
Bien qu'il soit possible de transmettre un fichier audio local en streaming à l'API Cloud Speech-to-Text, il est recommandé d'effectuer une reconnaissance audio synchrone ou asynchrone pour les résultats traités par lot.
Effectuer une reconnaissance vocale en streaming sur un flux audio
Cloud STT peut également effectuer une reconnaissance vocale sur un flux audio en streaming et en temps réel.
Voici un exemple d'exécution de reconnaissance vocale en streaming sur un flux audio provenant d'un micro :
Go
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Go.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Python.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Java.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Cet exemple nécessite l'installation de SoX, dont le chemin d'accès doit être spécifié dans votre variable d'environnement $PATH.
- Pour macOS :
brew install sox. - Pour la plupart des distributions Linux :
sudo apt-get install sox libsox-fmt-all. - Pour Windows : téléchargez les fichiers binaires.
Pour en savoir plus sur l'installation et la création d'un client Cloud STT, consultez Bibliothèques clientes Cloud STT.
Langages supplémentaires
C# : Veuillez suivre les instructions de configuration pour C# sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour .NET.
PHP : Veuillez suivre les instructions de configuration pour PHP sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour PHP.
Ruby : Veuillez suivre les instructions de configuration pour Ruby sur la page des bibliothèques clientes, puis consultez la documentation de référence sur Cloud STT pour Ruby.
Procéder à une reconnaissance vocale en continu d'un flux sans fin
Voici un exemple d'exécution de reconnaissance vocale en streaming sur un flux audio sans fin provenant d'un micro :
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Python.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Cloud STT, consultez Bibliothèques clientes Cloud STT. Pour en savoir plus, consultez la documentation de référence de l'API Cloud STT en langage Java.
Pour vous authentifier auprès de Cloud STT, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Cet exemple nécessite l'installation de SoX, dont le chemin d'accès doit être spécifié dans votre variable d'environnement $PATH.
- Pour macOS :
brew install sox. - Pour la plupart des distributions Linux :
sudo apt-get install sox libsox-fmt-all. - Pour Windows : téléchargez les fichiers binaires.
Pour en savoir plus sur l'installation et la création d'un client Cloud STT, consultez Bibliothèques clientes Cloud STT.
Étape suivante
- Découvrez comment mesurer et améliorer la précision.
Faites l'essai
Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Cloud SST en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits offerts pour exécuter, tester et déployer des charges de travail.
Profiter d'un essai offert de Cloud STT