Questa pagina descrive come ottenere le etichette per i diversi oratori nei dati audio trascritti da Cloud Speech-to-Text.
A volte, i dati audio contengono campioni di più persone che parlano. Ad esempio, l'audio di una telefonata di solito include le voci di due o più persone. Una trascrizione della chiamata idealmente include chi parla e in quali momenti.
Diarizzazione degli speaker
Cloud Speech-to-Text è in grado di riconoscere più interlocutori che parlano nello stesso clip audio. Quando invii una richiesta di trascrizione audio a Cloud Speech-to-Text, puoi includere un parametro che indica a Cloud Speech-to-Text di identificare i diversi interlocutori nel campione audio. Questa funzionalità, chiamata diarizzazione degli interlocutori, rileva quando cambiano le persone che parlano e etichetta con un numero le singole voci rilevate nell'audio.
Quando attivi la diarizzazione degli oratori nella richiesta di trascrizione, Cloud Speech-to-Text tenta di distinguere le diverse voci incluse nel campione audio. I tag dei risultati della trascrizione assegnano a ogni parola un numero assegnato ai singoli speaker. Le parole pronunciate dallo stesso oratore hanno lo stesso numero. Un risultato della trascrizione può includere numeri fino al numero di interlocutori che Cloud Speech-to-Text può identificare in modo univoco nel campione audio.
Quando utilizzi la diarizzazione degli oratori, Cloud Speech-to-Text produce un aggregato
in esecuzione di tutti i risultati forniti nella trascrizione. Ogni
risultato include le parole del risultato precedente. Pertanto, l'array words
nel risultato finale fornisce i risultati completi e diarizzati
della trascrizione.
Consulta la pagina delle lingue supportate per verificare se questa funzionalità è disponibile nella tua lingua.
Abilitare la diarizzazione dello speaker in una richiesta
Per abilitare la diarizzazione degli interlocutori, devi impostare il campo
enableSpeakerDiarization su true nei parametri
SpeakerDiarizationConfig
della richiesta. Per migliorare i risultati della trascrizione, devi anche specificare il numero di relatori presenti nel clip audio impostando il campo diarizationSpeakerCount nei parametri SpeakerDiarizationConfig. Cloud Speech-to-Text utilizza un valore predefinito se non fornisci un valore per diarizationSpeakerCount.
Cloud STT supporta la diarizzazione degli oratori per tutti i metodi di riconoscimento vocale:
speech:recognize
speech:longrunningrecognize e streaming.
Utilizzare un file locale
Il seguente snippet di codice mostra come attivare la diarizzazione degli oratori in una richiesta di trascrizione a Cloud Speech-to-Text utilizzando un file locale
Protocollo
Per informazioni dettagliate, consulta l'endpoint API speech:recognize.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST mediante curl. L'esempio utilizza Google Cloud CLI per generare un token di accesso. Per istruzioni sull'installazione di gcloud CLI,
consulta la guida rapida.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "diarizationConfig": { "enableSpeakerDiarization": true, "minSpeakerCount": 2, "maxSpeakerCount": 2 }, "model": "phone_call", }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > speaker-diarization.txt
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK e la risposta in formato JSON, salvata in un file denominato speaker-diarization.txt.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast and I was wondering whether you could help me with that certainly which color would you like we have blue black and red uh let's go with the black one would you like the new Chromecast Ultra model or the regular Chrome Cast regular Chromecast is fine thank you okay sure we like to ship it regular or Express Express please terrific it's on the way thank you thank you very much bye", "confidence": 0.92142606, "words": [ { "startTime": "0s", "endTime": "1.100s", "word": "hi", "speakerTag": 2 }, { "startTime": "1.100s", "endTime": "2s", "word": "I'd", "speakerTag": 2 }, { "startTime": "2s", "endTime": "2s", "word": "like", "speakerTag": 2 }, { "startTime": "2s", "endTime": "2.100s", "word": "to", "speakerTag": 2 }, ... { "startTime": "6.500s", "endTime": "6.900s", "word": "certainly", "speakerTag": 1 }, { "startTime": "6.900s", "endTime": "7.300s", "word": "which", "speakerTag": 1 }, { "startTime": "7.300s", "endTime": "7.500s", "word": "color", "speakerTag": 1 }, ... ] } ], "languageCode": "en-us" } ] }
Go
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Go.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Java.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Node.js.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Python.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Utilizzare un bucket Cloud Storage
Il seguente snippet di codice mostra come attivare la diarizzazione degli oratori in una richiesta di trascrizione a Cloud Speech-to-Text utilizzando un file Cloud Storage
Go
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Go.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Java.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Node.js.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Python.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.