Transcrire des paroles en texte à l'aide de la gcloud CLI
Vous trouverez sur cette page la procédure à suivre pour envoyer une requête de reconnaissance vocale à Cloud Speech-to-Text en utilisant l'outil gcloud depuis la ligne de commande.
Cloud Speech-to-Text permet d'intégrer facilement les technologies de reconnaissance vocale Google aux applications de développeurs. Vous pouvez envoyer des données audio à l'API Cloud Speech-to-Text qui renvoie ensuite une transcription de ce fichier audio en texte. Pour en savoir plus sur ce service, consultez Principes de base de Cloud STT.
Avant de commencer
Avant de pouvoir envoyer une requête à l'API Cloud Speech-to-Text, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.
- Activez Cloud Speech-to-Text sur un projet GCP.
- Assurez-vous que la facturation est activée pour Cloud Speech-to-Text.
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
- (Facultatif) Créez un bucket Google Cloud Storage où stocker vos données audio.
Envoyer une requête de transcription audio
Vous pouvez désormais utiliser Cloud STT pour transcrire un fichier audio en texte. Servez-vous de l'exemple de code suivant pour envoyer une requête recognize à l'API Cloud Speech-to-Text.
Ouvrez le shell de la ligne de commande, puis exécutez la commande suivante :
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Cette commande demande à Cloud STT de transcrire le contenu audio d'un fichier FLAC hébergé sur un emplacement accessible publiquement.
Si la requête aboutit, le serveur renvoie une réponse au format JSON :
{
"results": [
{
"alternatives": [
{
"confidence": 0.9840146,
"transcript": "how old is the Brooklyn Bridge"
}
]
}
]
}Félicitations ! Vous avez envoyé votre première requête à Cloud STT !
Si vous recevez une erreur ou une réponse vide de Cloud STT, reportez-vous aux étapes de dépannage et de réduction des erreurs.
Effectuer un nettoyage
Pour éviter que les ressources utilisées dans cette démonstration soient facturées sur votre compte Google Cloud , procédez comme suit :
- Utilisez Google Cloud console pour supprimer votre projet si vous n'en avez plus besoin.
Étapes suivantes
- Entraînez-vous à transcrire des fichiers audio courts.
- Découvrez comment traiter des fichiers audio longs par lot pour la reconnaissance vocale.
- Découvrez comment transcrire du contenu audio diffusé en streaming, à partir d'un micro par exemple.
- Faites vos premiers pas avec Cloud STT dans le langage de votre choix à l'aide d'une bibliothèque cliente Cloud STT.
- Parcourez les exemples d'applications.
- Pour obtenir des conseils, entre autres sur l'optimisation des performances et l'amélioration de la précision, consultez la documentation relative aux bonnes pratiques.