Documentation de référence sur l'API RPC Speech-to-Text

Il s'agit de la documentation de référence de l'API gRPC pour Speech-to-Text. Il s'agit de l'une des API pré-entraînées Vertex AI disponibles sur Google Distributed Cloud air-gapped (GDC).

Utilisez ce guide pour intégrer par programmation les technologies de reconnaissance vocale aux applications en cours de développement. Envoyez des fichiers audio et recevez-en une transcription par le biais de l'API Speech-to-Text de Vertex AI. Par exemple, si vous envoyez un fichier audio en espagnol, vous obtiendrez une transcription textuelle en espagnol.

Méthodes Speech-to-Text

Deux méthodes sont disponibles dans GDC :

  • Recognize : effectue une reconnaissance vocale synchrone. Recognize reçoit les résultats après que toutes les données audio ont été envoyées et traitées.
  • StreamingRecognize : effectue une reconnaissance vocale en continu bidirectionnelle. StreamingRecognize reçoit les résultats tout en envoyant les données audio.