אתם יכולים להשתמש בפונקציונליות של השוואת ביצועים במסוף Cloud Speech-to-Text כדי למדוד את רמת הדיוק של כל אחד ממודלי התמלול שמשמשים ב-Cloud Speech-to-Text V2 API.
מסוף Cloud Speech-to-Text מספק השוואה חזותית בין מודלים שעברו אימון מראש לבין מודלים של Custom Speech-to-Text. כדי לבדוק את איכות הזיהוי, אפשר להשוות בין מדדי ההערכה של שיעור שגיאות המילים (WER) בכמה מודלים של תמלול, וכך להחליט איזה מודל מתאים לאפליקציה שלכם.
לפני שמתחילים
מוודאים שנרשמתם לחשבון, יצרתם פרויקט, אימנתם מודל דיבור בהתאמה אישית ופרסתם אותו באמצעות נקודת קצה. Google Cloud
יצירת מערך נתונים של נתוני אמת
כדי ליצור מערך נתונים מותאם אישית להשוואה לשוק, צריך לאסוף דגימות אודיו שמשקפות בצורה מדויקת את סוג התנועה שמודל התמלול ייתקל בה בסביבת ייצור. המשך הכולל של קובצי האודיו האלה צריך להיות לפחות 30 דקות, ולא יותר מ-10 שעות. כדי להרכיב את מערך הנתונים, צריך:
- יוצרים ספרייה בקטגוריה של Cloud Storage לפי בחירתכם כדי לאחסן את קובצי האודיו והטקסט של מערך הנתונים.
- לכל קובץ אודיו במערך הנתונים, צריך ליצור תמלילים מדויקים באופן סביר. לכל קובץ אודיו (למשל
example_audio_1.wav), צריך ליצור קובץ טקסט תואם של נתוני אמת (example_audio_1.txt). השירות הזה משתמש בצמדי אודיו וטקסט האלה בקטגוריה של Cloud Storage כדי ליצור את מערך הנתונים.
השוואה לשוק של המודל
כדי להעריך את רמת הדיוק של המודל, משתמשים במודל מותאם אישית של דיבור לטקסט ובמערך הנתונים של ההשוואה לשוק, ופועלים לפי המדריך למדידה ושיפור של הדיוק.