最新模型簡介

Speech-to-Text API 中的「最新」模型標記提供兩個新模型標記的存取權,您可以在指定模型欄位時使用這些標記。這些模型可讓您存取 Google 的最新語音技術和機器學習研究成果,與其他可用模型相比,語音辨識準確度更高。不過,其他可用模型支援的部分功能,「最新」模型目前尚不支援。

最新模型採用 Google 的 Conformer 語音模型技術,如要瞭解詳情,請參閱 Google 研究出版品

如要使用最新模型,您必須大致瞭解如何使用 Speech-to-Text API 或使用者介面。如果是第一次使用,請參閱快速入門導覽課程

型號 ID

最新機型有兩種不同版本:

  • latest_short 模型適用於長度幾秒的簡短語音。這項功能適合用於擷取指令或其他單次定向語音用途。建議使用 latest_short,而非 command_and_search 模型。

  • latest_long 模型適用於任何形式的長篇內容,例如媒體、即時語音和對話。建議使用 latest_long 取代 video,特別是目標語言不支援 video 時。您也可以使用 latest_long 取代 default 模型。

模型技術

最新模型旨在直接為 Google Cloud 使用者提供最新的語音技術。我們目前的最新模型是以 Google 的 Conformer 語音模型技術為基礎,但未來可能會有所變更。如要瞭解詳情,請參閱 Google 研究出版品清單。

定價

latest_longlatest_short 模型會以「標準」計費,且與 command_and_searchdefault 模型適用相同的使用量和費用。詳情請參閱「定價」。

模型更新

最新模型採用快速進步的機器學習技術,因此,我們可能會比其他模型更頻繁地更新或重新整理模型。這些更新可能會新增其他功能,或稍微變更準確度或延遲時間。

語言

最新模型支援超過 20 種語言和 50 種以上的變體。 我們會持續新增語言,如需最新清單,請參閱「語言」一文。

功能支援與限制

支援的功能因語言而異。如需支援功能的完整清單,請參閱「語言」一文。

最新機型目前不支援下列功能:

  • 信心分數 - API 會傳回值,但並非真正的信心分數。

服務水準協議範本

最新模型屬於 Speech-to-Text API 的正式發布部分。因此,這些功能支援的作業可透過 v1 API 執行,並享有與正式發布產品和功能相同的服務水準協議和其他保護措施。