Agent Assist משתמש בהתאמה של מודל זיהוי הדיבור כדי לשפר את איכות התמלול על ידי זיהוי של ביטויים מסוימים בתדירות גבוהה יותר מאחרים. בדף הזה מוסבר איך להגדיר התאמה של מודל לתמלול Speech-to-Text.
שימוש במסוף Speech-to-Text
אפשר ליצור רק קבוצות גלובליות של ביטויים באמצעות מסוף Speech-to-Text. צריך ליצור קבוצות אזוריות של ביטויים באמצעות Speech-to-Text API.
- נכנסים לדף Speech-to-Text במסוף Google Cloud . מעבר אל Speech-to-Text
- לוחצים על התאמות של המודל.
- לוחצים על add_boxמשאב חדש.
- בוחרים במשאב Phrase set ובגרסת ה-API V1, ממלאים את הביטויים ואת ערכי ההגברה ומעתיקים את השם של phrase set.
- לוחצים על Save.
- עוברים אל מסוף Agent Assist.
- לוחצים על פרופילים של שיחות ובוחרים את הפרופיל של השיחה שרוצים לערוך.
- עוברים לקטע Phrase sets (קבוצות של ביטויים) ומדביקים את השם של קבוצת הביטויים.
שימוש ב-Speech-to-Text API
- יוצרים סקריפט של קבוצת ביטויים לפי ההוראות לזיהוי דיבור.
מריצים את סקריפט Python הבא כדי לעדכן את פרופיל השיחה:
# Conversation Profile to update PROJECT_ID = "sample-project" LOCATION = "global" CONVERSATION_PROFILE_ID = "sample-conversation-profile" # Speech model adaptation resource names SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]
import google.auth from google.auth.transport.requests import AuthorizedSession
scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)
profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())
קבוצות של ביטויים אזוריים
התאמת מודל של המרת דיבור לטקסט תומכת רק באנגלית (en-US), אבל אפשר להגדיר קבוצות של ביטויים לאזורים עם שפות אחרות באמצעות Speech-to-Text API. האפשרות הזו שימושית במיוחד כשמתמללים שיחות באנגלית שמתקיימות באזורים האלה.
כדי ליצור קבוצות אזוריות של ביטויים באמצעות Speech-to-Text API, משתמשים בפקודה לדוגמה הבאה.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: sample_project" \ -d @sample_phrase_sets.json \ "https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"
קובץ ה-JSON @sample_phrase_sets.json מכיל את התוכן הבא של קבוצות הביטויים:
{
"parent": "projects/sample-project/locations/us",
"phraseSetId": "sample-phrase-sets",
"phraseSet": {
"name": "sample-phrase-sets",
"phrases": [
{
"value": "Some phrase",
"boost": 20
}
]
}
}
| אזור Dialogflow | אזור המרת דיבור לטקסט |
|---|---|
| us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2 |
us |
| eu europe-west1 europe-west2 europe-west3 europe-west4 |
eu |
| australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global |
גלובלי |