Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Generare sottotitoli codificati WebVTT e SRT

Questa pagina descrive come utilizzare l'API Cloud Speech-to-Text per generare automaticamente sottotitoli da file audio in formato SRT e WebVTT. Questi formati possono archiviare il testo e le informazioni sulla sincronizzazione dell'audio, consentendo di visualizzare i sottotitoli o i sottotitoli codificati sincronizzati con i contenuti multimediali per il sottotitolaggio e il sottotitolaggio codificato.

L'abilitazione degli output dei sottotitoli nella richiesta a Cloud Speech-to-Text è supportata solo nell'API V2. In particolare, puoi utilizzare BatchRecognize solo per trascrivere file audio lunghi. Puoi salvare gli output in un bucket Cloud Storage oppure possono essere restituiti in linea. Nella configurazione di output di Cloud Storage è possibile specificare più formati contemporaneamente, che vengono scritti nel bucket specificato con estensioni di file diverse.

Abilitare gli output dei sottotitoli in una richiesta

Per generare output di sottotitoli SRT o VTT per l'audio utilizzando Cloud Speech-to-Text, segui i passaggi successivi per abilitare gli output dei sottotitoli nella richiesta di trascrizione:

Invia una richiesta al metodo BatchRecognize dell'API Cloud Speech-to-Text con il campo output_format_config compilato. I valori specificati sono:
- srt, per l'output in formato SRT format. - vtt, per l'output in formato WebVTT format.
- native, che è il formato di output predefinito se non viene specificato alcun formato come richiesta BatchRecognizeResults serializzata.
Poiché l'operazione è asincrona, esegui il polling della richiesta finché non viene completata.

Nella configurazione di output di Cloud Storage è possibile specificare più formati contemporaneamente. Vengono scritti nel bucket specificato con estensioni di file diverse (.json, .srt o .vtt).

Se vengono specificati più formati per la configurazione di output in linea, ogni formato sarà disponibile come campo nel messaggio BatchRecognizeFileResult.inline_result.

Il seguente snippet di codice mostra come abilitare gli output dei sottotitoli codificati in una richiesta di trascrizione a Cloud Speech-to-Text utilizzando file locali e remoti:

API

  curl -X POST \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    https://speech.googleapis.com/v2/projects/my-project/locations/global/recognizers/_:batchRecognize \
    --data '{
      "files": [{
        "uri": "gs://my-bucket/jfk_and_the_press.wav"
      }],
      "config": {
        "features": { "enableWordTimeOffsets": true },
        "autoDecodingConfig": {},
        "model": "long",
        "languageCodes": ["en-US"]
      },
      "recognitionOutputConfig": {
        "gcsOutputConfig": { "uri": "gs://my-bucket" },
        "output_format_config": { "srt": {} }
      }
    }'

Passaggi successivi

Scopri come trascrivere file audio lunghi.
Scopri come scegliere il modello di trascrizione migliore.
Trascrivi i file audio utilizzando Chirp.
Per prestazioni, accuratezza e altri suggerimenti ottimali, consulta la documentazione sulle best practice.

Generare sottotitoli codificati WebVTT e SRT Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Abilitare gli output dei sottotitoli in una richiesta

API

Passaggi successivi

Generare sottotitoli codificati WebVTT e SRT