為提升轉錄和語音辨識的準確度和效能,Cloud Speech-to-Text V1 API 將剩餘的傳統語音模型更新為最先進的Conformer 架構模型,且不會中斷 API 功能。傳統模型是指 V1 API 中,在 command_and_search、default、phone_call 和 video 模型旗標下公開的模型。這些模型以獨立的聲學和語言模型為基礎,並支援特定 Speech-to-Text API 用途。
自 2020 年 Google Brain 推出 Conformer 架構以來,我們已測試解決方案,並逐步取代 Speech-to-Text V1 API 模型。這項做法已在各種用途中,提升網域內準確度、穩健性和效能。本頁面提供相關操作說明,協助您瞭解遷移作業的優點,以及如何視需求選擇提前或延後遷移。
異動內容
遷移期限過後,我們會開始將流量從目前公開的模型移開。由於重新導向是在內部進行,這些模型 ID 仍有效,且會繼續放送流量。
下表顯示遷移生效時的路由。重新導向會發生在已顯示的模型 ID 之間。您不必變更程式碼,但可以自行測試模型行為。
| BCP-47 代碼 | 目前型號 ID | single_utterance | 型號 ID 流量目的地 |
|---|---|---|---|
| en-US | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
telephony |
|
phone_call |
false |
telephony |
|
phone_call(use_enhanced=true) |
true |
telephony_short |
|
video |
false |
telephony |
|
| de-DE、en-AU、en-GB、en-IN、es-ES、es-US、fr-CA、fr-FR、it-IT、ja-JP、nl-NL、pt-BR | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
latest_long |
|
phone_call(use_enhanced=true) |
true |
latest_short |
|
phone_call |
false |
latest_long |
時間軸
您有三種遷移選項,詳情請參閱本頁。2024 年 1 月起,我們將開始逐步將流量從傳統模型轉移至以 Conformer 為基礎的模型,並在遷移前個別通知專案。我們預計在 2024 年 6 月前,將所有流量都轉移至 Conformer 模型。如果有人仍要求使用舊版模型,系統會自動將要求重新導向至對應的 Conformer 模型。
遷移機制
如要提早加入或稍後退出並遷移,請按照下列操作說明進行:
建議:提早加入並遷移
如要主動選擇加入,請將您在 Speech-to-Text V1 API 中使用的模型 ID,變更為上表所示的更新 ID。主動遷移專案可讓您有時間測試模型,並提早享有準確度和穩定性提升的優勢。
選擇退出,稍後再遷移
如果更新後的模型有任何問題,且您想暫時停用遷移作業,請建立 Google Cloud 支援案件。建立支援案件時,請使用「Opt out from Speech-to-Text conformer migration」做為標題,並提供專案 ID 和選擇停用的原因。