גרסה 2 של Cloud Speech-to-Text API מביאה ללקוחות את עיצוב ה-API העדכני ביותר Google Cloud כדי לעמוד בדרישות האבטחה והרגולציה של הארגון כבר מההתחלה.
הדרישות האלה מתבצעות באמצעות הפעולות הבאות:
מיקום הנתונים: Cloud STT V2 מציע את המגוון הרחב של מודלים קיימים לתמלול בGoogle Cloudאזורים כמו בלגיה או סינגפור. כך אפשר להפעיל את מודלי התמלול שלנו באמצעות שירות אזורי מלא.
יכולות הזיהוי של המשאבים: מזהים הם הגדרות זיהוי לשימוש חוזר שיכולות להכיל שילוב של מודל, שפה ותכונות.
רישום ביומן: יצירת משאבים ותמלילים יוצרת יומנים שזמינים במסוף Google Cloud , וכך מאפשרת טלמטריה וניפוי באגים טובים יותר.
הצפנה: Cloud Speech-to-Text V2 תומך במפתחות הצפנה בניהול הלקוח לכל המשאבים, וגם בתמלול באצווה.
Audio auto-detect: Cloud Speech-to-Text V2 יכול לזהות באופן אוטומטי את קצב הדגימה, מספר הערוצים והפורמט של קובצי האודיו, בלי שתצטרכו לספק את המידע הזה בהגדרת הבקשה.
מעבר מגרסה 1 לגרסה 2
המעבר מ-V1 API ל-V2 API לא מתבצע באופן אוטומטי. כדי ליהנות מהתכונות, צריך לבצע שינויים מינימליים בהטמעה.
מיגרציה ב-API
בדומה ל-Cloud STT V1, כדי לתמלל אודיו, צריך ליצור RecognitionConfig על ידי בחירת שפת האודיו ומודל הזיהוי הרצוי:
Python
אם צריך, בוחרים אזור שבו רוצים להשתמש ב-Cloud Speech-to-Text API, ובודקים את הזמינות של השפה והמודל באזור הזה:
Python
אופציונלי: אם רוצים לעשות שימוש חוזר בהגדרת זיהוי ספציפית בהרבה בקשות תמלול, אפשר ליצור משאב לזיהוי:
Python
יש הבדלים נוספים בבקשות ובתגובות בגרסה החדשה של API (V2). פרטים נוספים מופיעים במאמרי העזרה.
העברה בממשק המשתמש
כדי לבצע את ההעברה דרך מסוף Speech Google Cloud , פועלים לפי השלבים הבאים:
עוברים אל מסוף Google Cloud Speech.
עוברים לדף תמלילים.
לוחצים על תמלול חדש ובוחרים את האודיו בכרטיסייה הגדרת אודיו.
בכרטיסייה אפשרויות תמלול, בוחרים באפשרות V2.