使用 gcloud CLI 將語音轉錄為文字

此頁面說明如何使用指令列的 gcloud 工具，將語音辨識要求傳送至 Cloud Speech-to-Text。

Cloud Speech-to-Text 可讓您將 Google 語音辨識技術輕鬆整合至開發人員應用程式。您可以將音訊資料傳送至 Cloud Speech-to-Text API，該 API 接著會傳回音訊檔案的文字轉錄稿。如要進一步瞭解這項服務，請參閱「Cloud STT 基礎知識」。

事前準備

您必須先完成下列動作，才能向 Cloud Speech-to-Text API 傳送要求。詳情請參閱「事前準備」頁面。

在 GCP 專案中啟用 Cloud Speech-to-Text。
1. 確認已啟用 Cloud Speech-to-Text 的計費功能。
安裝 Google Cloud CLI。完成後，執行下列指令來初始化 Google Cloud CLI：
```
gcloud init
```
若您採用的是外部識別資訊提供者 (IdP)，請先使用聯合身分登入 gcloud CLI。
(選用) 建立新的 Google Cloud Storage bucket，以儲存音訊資料。

提出音訊轉錄要求

您現在可以使用 Cloud STT 將音訊檔案轉錄成文字。請使用下列程式碼範例，將 recognize 要求傳送至 Cloud Speech-to-Text API。

請開啟指令列 shell 並執行下列指令。

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

這項指令會要求 Cloud STT 轉錄託管在公開存取位置之 FLAC 中包含的音訊。

如果要求成功，伺服器會以 JSON 格式傳回：

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

恭喜！您已將第一個要求傳送至 Cloud STT。

如果您收到來自 Cloud STT 的錯誤或空白回應，請查看疑難排解和錯誤緩解措施步驟。

清除所用資源

為了避免系統向您的 Google Cloud 帳戶收取本頁面所用資源的費用，請按照下列步驟操作。

使用 Google Cloud console 刪除不需要的專案。

後續步驟

練習轉錄短音訊檔案。
瞭解如何批次處理長音訊檔案以進行語音辨識。
瞭解如何轉錄串流音訊，例如從麥克風轉錄。
使用 Cloud STT 用戶端程式庫，並以您選擇的語言開始使用 Cloud STT。
逐步演練範例應用程式。
如要獲得最佳效能、準確率與其他提示，請參閱最佳做法說明文件。