Questo tutorial mostra come trascrivere la traccia audio di un file video utilizzando Cloud Speech-to-Text.
I file audio possono provenire da molte fonti diverse. I dati audio possono provenire da un telefono (ad esempio la segreteria telefonica) o dalla colonna sonora inclusa in un file video.
Cloud STT può utilizzare uno dei diversi modelli di machine learning per trascrivere il file audio in modo da corrispondere al meglio all'origine originale dell'audio. Puoi ottenere risultati migliori dalla trascrizione vocale specificando la sorgente dell'audio originale. In questo modo, Cloud STT può elaborare i tuoi file audio utilizzando un modello di machine learning addestrato per dati simili al tuo file audio.
Obiettivi
- Invia una richiesta di trascrizione audio per un file video a Cloud STT.
Costi
In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:
- Cloud Speech-to-Text
Per generare una stima dei costi in base all'utilizzo previsto,
utilizza il calcolatore prezzi.
Prima di iniziare
Questo tutorial prevede diversi prerequisiti:
- Hai configurato un progetto Cloud Speech-to-Text nella console Google Cloud .
- Hai configurato il tuo ambiente utilizzando le credenziali predefinite dell'applicazione nella console Google Cloud .
- Hai configurato l'ambiente di sviluppo per il linguaggio di programmazione che hai scelto.
- Hai installato la libreria client di Google Cloud per il linguaggio di programmazione scelto.
Preparare i dati audio
Prima di poter trascrivere l'audio di un video, devi estrarre i dati dal file video. Dopo aver estratto i dati audio, devi archiviarli in un bucket Cloud Storage o convertirli in codifica base64.
Estrarre i dati audio
Puoi utilizzare qualsiasi strumento di conversione dei file che gestisce file audio e video, ad esempio FFmpeg.
Utilizza lo snippet di codice riportato di seguito per convertire un file video in un file audio
utilizzando ffmpeg.
ffmpeg -i video-input-file audio-output-file
Memorizzare o convertire i dati audio
Puoi trascrivere un file audio archiviato sulla tua macchina locale o in un bucket Cloud Storage.
Utilizza il seguente comando per caricare il file audio in un bucket Cloud Storage esistente utilizzando Google Cloud CLI.
gcloud storage cp audio-output-file storage-bucket-uri
Se utilizzi un file locale e prevedi di inviare una richiesta utilizzando lo strumento curl dalla riga di comando, devi prima convertire il file audio in dati con codifica base64.
Utilizza il seguente comando per convertire un file audio in un file di testo.
base64 audio-output-file -w 0 > audio-data-text
Invio di una richiesta di trascrizione
Utilizza il seguente codice per inviare una richiesta di trascrizione a Cloud STT.
Richiesta di file locale
Protocollo
Per informazioni dettagliate, consulta l'endpoint API speech:recognize.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST mediante curl. L'esempio utilizza Google Cloud CLI per generare un token di accesso. Per istruzioni sull'installazione di gcloud CLI,
consulta la guida rapida.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v2/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "sampleRateHertz": 16000, "languageCode": "en-US", "model": "video" }, "audio": { "uri": "gs://cloud-samples-tests/speech/Google_Gnome.wav" } }'
Consulta la documentazione di riferimento di RecognitionConfig per saperne di più sulla configurazione del corpo della richiesta.
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK e la risposta in formato JSON:
{
"results": [
{
"alternatives": [
{
"transcript": "OK Google stream stranger things from
Netflix to my TV okay stranger things from
Netflix playing on TV from the people that brought you
Google home comes the next evolution of the smart home
and it's just outside your window me Google know hi
how can I help okay no what's the weather like outside
the weather outside is sunny and 76 degrees he's right
okay no turn on the hose I'm holding sure okay no I'm can
I eat this lemon tree leaf yes what about this Daisy yes
but I wouldn't recommend it but I could eat it okay
Nomad milk to my shopping list I'm sorry that sounds like
an indoor request I keep doing that sorry you do keep
doing that okay no is this compost really we're all
compost if you think about it pretty much everything is
made up of organic matter and will return",
"confidence": 0.9251011
}
]
}
]
}Go
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Go.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Java.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Node.js.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Python.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione di C# nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per Ruby.
Richiesta di file remoto
Go
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Go.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Java.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Node.js.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Python.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione di C# nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per Ruby.
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è eliminare il progetto creato per il tutorial.
Per eliminare il progetto:
- Nella console Google Cloud , vai alla pagina Gestisci risorse.
- Nell'elenco dei progetti, seleziona quello che vuoi eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
Elimina le istanze
Per eliminare un'istanza Compute Engine:
- Nella console Google Cloud , vai alla pagina Istanze VM.
- Seleziona la casella di controllo per l'istanza da eliminare.
- Per eliminare l'istanza, fai clic su Altre azioni, fai clic su Elimina, quindi segui le istruzioni.
Elimina le regole firewall per la rete predefinita
Per eliminare una regola firewall:
- Nella console Google Cloud , vai alla pagina Firewall.
- Seleziona la casella di controllo per la regola firewall da eliminare.
- Per eliminare la regola firewall, fai clic su Elimina.
Passaggi successivi
- Scopri come ottenere i timestamp per l'audio.
- Identificare i diversi speaker in un file audio.
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Cloud STT in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
Prova Cloud STT senza costi