您可以指定讓語音轉文字針對語音轉錄中的個別字詞,標明準確率或信賴度的值。
字詞層級信賴度
「語音轉文字」對音訊剪輯執行語音轉錄時,也會測量回應的準確度。從語音轉文字功能傳送的回應會以 0.0 至 1.0 的數字,表明整個語音轉錄要求的信賴度。下列程式碼範例示範了語音轉文字傳回的信賴度。
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.96748614
}
]
}
]
}
除了整個語音轉錄的信賴度外,語音轉文字亦可提供語音轉錄中個別字詞的信賴度資訊。回覆隨後會在語音轉錄中加入 WordInfo 詳細資料,指出個別字詞的信賴度,如下列範例所示。
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98360395,
"words": [
{
"startTime": "0s",
"endTime": "0.300s",
"word": "how",
"confidence": SOME NUMBER
},
...
]
}
]
}
]
}
在要求中啟用字詞層級信心值
下列程式碼片段示範如何使用本機和遠端檔案,在語音轉文字的語音轉錄要求中啟用字詞層級的信賴度
使用本機檔案
通訊協定
如要瞭解完整的詳細資訊,請參閱 speech:recognize API 端點。
如要執行同步語音辨識,請提出 POST 要求並提供適當的要求內容。以下為使用 curl 的 POST 要求示例。這個範例使用 Google Cloud CLI 產生存取權杖。如需安裝 gcloud CLI 的操作說明,請參閱快速入門導覽課程。
以下範例說明如何使用 curl 傳送 POST 要求,其中要求主體會啟用字詞層級的信賴度。
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "FLAC", "sampleRateHertz": 16000, "languageCode": "en-US", "enableWordTimeOffsets": true, "enableWordConfidence": true }, "audio": { "uri": "gs://cloud-samples-tests/speech/brooklyn.flac" } }' > word-level-confidence.txt
如果要求成功,伺服器會傳回 200 OK HTTP 狀態碼與 JSON 格式的回應,並另存成名為 word-level-confidence.txt 的檔案。
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98360395,
"words": [
{
"startTime": "0s",
"endTime": "0.300s",
"word": "how",
"confidence": 0.98762906
},
{
"startTime": "0.300s",
"endTime": "0.600s",
"word": "old",
"confidence": 0.96929157
},
{
"startTime": "0.600s",
"endTime": "0.800s",
"word": "is",
"confidence": 0.98271006
},
{
"startTime": "0.800s",
"endTime": "0.900s",
"word": "the",
"confidence": 0.98271006
},
{
"startTime": "0.900s",
"endTime": "1.100s",
"word": "Brooklyn",
"confidence": 0.98762906
},
{
"startTime": "1.100s",
"endTime": "1.500s",
"word": "Bridge",
"confidence": 0.98762906
}
]
}
],
"languageCode": "en-us"
}
]
}
Java
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Java API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Node.js
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Node.js API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Python
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Python API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
使用遠端檔案
Java
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Java API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Node.js
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Node.js API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Python
如要瞭解如何安裝及使用 Speech-to-Text 的用戶端程式庫,請參閱這篇文章。 詳情請參閱 Speech-to-Text Python API 參考說明文件。
如要向語音轉文字服務進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。