Vous pouvez utiliser la fonctionnalité de streaming étendu pour diffuser du contenu audio vers Dialogflow et diffuser en retour des suggestions d'agents humains. Pour utiliser cette fonctionnalité, vous devez configurer un modèle Speech-to-Text qui accepte une seule expression.
Normalement, vous fermez à moitié ou indiquez à l'API Dialogflow quand mettre fin au flux pour générer la transcription finale et les suggestions d'Agent Assist. Cela se produit lors des tours de conversation, lorsque l'API reçoit le paramètre is_final=true du résultat de la reconnaissance, StreamingAnalyzeContentResponse.recognition_result.
Le streaming étendu réduit le besoin de fermeture à moitié lors des tours de conversation. Il prolonge le délai d'inactivité de la connexion à trois minutes, pendant lesquelles vous pouvez envoyer des flux audio sans fermeture à moitié. L'API Dialogflow renvoie automatiquement les transcriptions finales et les suggestions d'Agent Assist au flux. Vous ne redémarrez le flux que s'il expire.
Principes de base du streaming
La fonctionnalité de streaming étendu d'Agent Assist est semblable au streaming
audio pour la transcription vocale. Votre système diffuse des données audio vers l'API, et Dialogflow diffuse en retour des données StreamingAnalyzeContentResponse. Les données renvoyées incluent des suggestions pour vos agents humains.
Pour utiliser le streaming étendu, appelez la
streamingAnalyzeContent
méthode.
Le streaming étendu n'est compatible qu'avec l'étape Agent Assist. Consultez la section conversation stage. Pour utiliser cette fonctionnalité :
- Appelez la méthode
streamingAnalyzeContentet définissez les champs suivants :StreamingAnalyzeContentRequest.audio_config.audio_encoding:AUDIO_ENCODING_LINEAR_16ouAUDIO_ENCODING_MULAWenable_extended_streaming:true.
- La première requête
streamingAnalyzeContentprépare le flux et définit votre configuration audio. - Dans les requêtes suivantes, vous envoyez des octets audio au flux.
- Tant que vous continuez à envoyer du contenu audio, vous recevrez des suggestions. Vous n'avez pas besoin de fermer manuellement le flux. Il se fermera automatiquement une fois qu'Agent Assist aura détecté que les expressions ont cessé.
- Redémarrez le flux (ce qui inclut le renvoi de la configuration audio initiale) dans les cas suivants :
- Le flux est interrompu (il s'est arrêté alors qu'il n'aurait pas dû).
- Vos données audio approchent le délai d'inactivité automatique de trois minutes.
- Vous avez reçu une erreur récupérable. Vous pouvez réessayer jusqu'à trois fois.