אימון וניהול של מודלים

באמצעות ה-API, ללא שימוש בקוד, אפשר ליצור ולאמן מודל מותאם אישית של תמלול כדי לשפר את דיוק הזיהוי ממודל קיים של Cloud Speech-to-Text. השירות שמנוהל במלואו מקצה אוטומטית משאבי מחשוב, מריץ את קוד אפליקציית האימון ומוודא שמחיקת משאבי המחשוב מתבצעת אחרי משימת האימון. מקבלים מודל תמלול מכוונן במלואו, שמתאים לכל אפליקציה במורד הזרם.

בדומה למודלים של למידת מכונה, אימון של מודל מותאם אישית של תמלול הוא בדרך כלל תהליך איטרטיבי שכולל בחירה של מודל בסיס כנקודת התחלה, כוונון עדין שלו באמצעות מערכי נתונים של טקסט ואודיו, ולאחר מכן בדיקה של איכות הזיהוי של המודל. אם התוצאות לא תואמות לציפיות שלכם, אתם יכולים לאמן מחדש מודל חדש עם תמהיל נתונים שונה, לבצע בדיקה נוספת או להשתמש בו ישירות לתמלול בדומיין שלכם.

לפני שמתחילים

מוודאים שנרשמתם לחשבון ב- Google Cloud , יצרתם פרויקט ב- Google Cloudוהפעלתם את Cloud Speech-to-Text API: עוברים אל Speech במסוףGoogle Cloud ופותחים את Cloud Speech-to-Text API. פועלים בקטע מודלים בהתאמה אישית בסרגל הניווט שמימין.

יצירת מודל בהתאמה אישית

מתחילים ביצירת מודל מותאם אישית של Speech-to-Text והגדרת הפרמטרים שלו, כמו מודל בסיסי ושפת התמלול:

  1. לוחצים על יצירה כדי ליצור מודל מותאם אישית.
  2. מזינים שם מודל, שיוצג ויהיה אפשר להתייחס אליו בבקשות API ובמסוף Google Cloud Speech.
  3. מזינים תיאור למודל.
  4. בוחרים מודל בסיס שמתאים לתרחיש לדוגמה שלכם.
  5. בוחרים את השפה של התמלול.
  6. בוחרים את האזור שבו יתבצע האימון.
  7. לוחצים על Continue.
צילום מסך של תהליך העבודה ליצירת מודל מותאם אישית של המרת דיבור לטקסט, שבו מוצגים השדות הנדרשים למודל המותאם אישית

כדי להשלים את ההגדרה של מודל מותאם אישית של תמלול ולהתחיל את האימון, צריך להגדיר את מערכי הנתונים של האימון והאימות.

  1. בוחרים מערך נתונים לאימון על ידי הזנת URI תקין של ספרייה ב-Cloud Storage. מוודאים שיש רק קובצי אודיו וטקסט, ושאורך האודיו הכולל עומד בדרישות של מערך נתוני האימון.
    1. בוחרים מערך נתונים לאימות על ידי הזנת URI תקין של ספרייה ב-Cloud Storage. מוודאים שיש רק קובצי אודיו וטקסט, ושהמשך הכולל של האודיו עומד בדרישות של מערך אימות הנתונים.
      1. לוחצים על יצירה כדי להתחיל בתהליך האימון.

אם לא נוספו לאינדקס מספיק שעות אודיו או שהקבצים לא עומדים בהנחיות, משימת האימון תיכשל.

צילום מסך של תהליך העבודה ליצירת מודל מותאם אישית של המרת דיבור לטקסט, שבו מוצגים השדות הנדרשים למערכי הנתונים של האימון והאימות של המודל המותאם אישית

יכול להיות שעבודות אימון יתווספו לתור אחרי עבודות אחרות במערכת שלנו, והאימון של מודל יכול להימשך בין כמה שעות לכמה ימים, בהתאם לגודל של מערך הנתונים. אחרי אימון המודל, הסטטוס שלו יהיה פעיל.

מחיקה של מודל בהתאמה אישית

לפני שמתחילים, חשוב לוודא שאין תנועה שמנותבת למודל המותאם אישית של המרת דיבור לטקסט דרך נקודת קצה כלשהי, כי מחיקת המודל תגרום להפסקת הטיפול בכל הבקשות.

  1. עוברים לכרטיסייה Models (מודלים) בקטע Custom Models (מודלים בהתאמה אישית).
  2. לוחצים כדי להרחיב את האפשרויות ואז לוחצים על מחיקה. תוך כמה רגעים, מודל הדיבור לטקסט המותאם אישית יימחק, יחד עם כל נקודות הקצה שלו, ולא ישרת יותר תנועה.

הצגת רשימה של מודלים בהתאמה אישית

אם בוחרים באפשרות Models (מודלים) בקטע Custom Models (מודלים בהתאמה אישית), אפשר גם לראות רשימה של כל המודלים בהתאמה אישית של Speech-to-Text, כולל אלה שנמצאים בתהליך אימון, פעילים או בתהליך מחיקה.

צילום מסך של תהליך העבודה של רשימת המודלים המותאמים אישית של המרת דיבור לטקסט, שבו מוצגת טבלה עם כל המודלים המותאמים אישית שכבר נוצרו

המאמרים הבאים

כדי להשתמש במודלים מותאמים אישית של דיבור באפליקציה, אפשר להיעזר במקורות המידע הבאים: