Cloud Speech-to-Text API V2 採用最新的 Google Cloud API 設計,可讓客戶立即可用,滿足企業安全性和法規要求。
這些要求是透過下列方式實現:
資料落地:Cloud STT V2 在Google Cloud區域 (例如比利時或新加坡) 提供現有各種語音轉錄模型。這可讓您透過完全區域化的服務叫用語音轉錄模型。
辨識器資源:辨識器是可重複使用的辨識設定,可包含模型、語言和特徵的組合。
記錄:資源建立和轉錄作業會產生記錄,您可以在 Google Cloud 控制台中查看,以便進行遙測和偵錯。
加密:Cloud Speech-to-Text V2 支援客戶自行管理的加密金鑰,適用於所有資源和批次語音轉錄功能。
自動偵測音訊:Cloud Speech-to-Text V2 可自動偵測音訊檔案的取樣率、聲道數和格式,無須在要求設定中提供這項資訊。
從 V1 遷移至 V2
系統不會自動從 V1 API 遷移至 V2 API。如要使用這組功能,只需進行最少的實作變更。
透過 API 遷移
與 Cloud STT V1 類似,如要轉錄音訊,您需要選取音訊語言和所選的辨識模型,藉此建立 RecognitionConfig:
Python
如有需要,請選取要使用 Cloud Speech-to-Text API 的區域,並檢查該區域的語言和模型可用性:
Python
如果需要在多個轉錄要求中重複使用特定辨識設定,可以選擇建立辨識器資源:
Python
新版 V2 API 的要求和回應也有其他差異。詳情請參閱參考說明文件。
在 UI 中遷移
如要透過 Speech Google Cloud 控制台遷移,請按照下列步驟操作:
前往「轉錄稿」頁面。
按一下「New Transcription」,然後在「Audio configuration」分頁中選取音訊。
在「Transcription options」(語音轉錄選項) 分頁中,選取「V2」。