評估模型

使用 Cloud Speech-to-Text 控制台的基準化功能,評估 Cloud Speech-to-Text V2 API 中使用的任何轉錄模型準確度。

Cloud Speech-to-Text 控制台提供預先訓練和自訂語音轉文字模型的視覺化基準測試。您可以比較多個轉錄模型的字詞錯誤率 (WER) 評估指標,檢查辨識品質,進而決定最適合應用程式的模型。

事前準備

請確認您已註冊 Google Cloud 帳戶、建立專案、訓練自訂語音模型,並透過端點部署模型。

建立基本事實資料集

如要建立自訂基準資料集,請收集能準確反映轉錄模型在正式環境中遇到的流量類型音訊樣本。這些音訊檔案的總長度最好至少 30 分鐘,且不得超過 10 小時。如要組裝資料集,請按照下列步驟操作:

  1. 在所選的 Cloud Storage bucket 中建立目錄,以儲存資料集的音訊和文字檔。
  2. 為資料集中的每個音訊檔案建立合理準確的轉錄稿。請為每個音訊檔案 (例如 example_audio_1.wav) 建立對應的基準真相文字檔案 (example_audio_1.txt)。這項服務會使用 Cloud Storage bucket 中的音訊和文字配對,組建資料集。

將模型基準化

使用自訂 Speech-to-Text 模型和基準資料集評估模型準確度,然後按照評估及提升準確度指南操作。