תמלול דיבור לטקסט באמצעות ספריות לקוח
בדף הזה מוסבר איך לשלוח בקשה לזיהוי דיבור ל-Cloud Speech-to-Text בשפת התכנות המועדפת באמצעותGoogle Cloud ספריות הלקוח.
Cloud Speech-to-Text מאפשר לכם לשלב בקלות את הטכנולוגיות של Google לזיהוי דיבור באפליקציות של מפתחים. אתם יכולים לשלוח נתוני אודיו אל Cloud Speech-to-Text API, ואז הממשק יחזיר תמלול טקסט של קובץ האודיו הזה. מידע נוסף על השירות זמין במאמר יסודות Cloud STT.
לפני שמתחילים
לפני ששולחים בקשה ל-Cloud Speech-to-Text API, צריך לבצע את הפעולות הבאות. פרטים נוספים מופיעים בדף לפני שמתחילים.
- מפעילים את Cloud Speech-to-Text בפרויקט ב- Google Cloud .
- מוודאים שהחיוב מופעל עבור Cloud Speech-to-Text.
-
התקינו את ה-CLI של Google Cloud. אחר כך, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:
gcloud initאם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- מוודאים שיש את ההרשאות הנדרשות כדי להשלים את ההדרכה. אם משתמשים בפרויקט חדש, לא צריך לוודא כי כבר יש את ההרשאות הנדרשות.
- (אופציונלי) יוצרים קטגוריה של Cloud Storage חדשה כדי לאחסן את נתוני האודיו.
התפקידים הנדרשים
כדי לקבל את ההרשאות שנדרשות להמרת דיבור לטקסט, צריך לבקש מהאדמין להקצות לכם את תפקיד ה-IAM Service Usage Consumer (roles/serviceusage.serviceUsageConsumer) בפרויקט.
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
התקנת ספריית הלקוח
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code or IntelliJ, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
לפני שמתקינים את הספרייה, חשוב לוודא שהכנתם את הסביבה לפיתוח ב-Node.js.
npm install @google-cloud/speech
Python
לפני שמתקינים את הספרייה, צריך לוודא שהכנתם את הסביבה לפיתוח בשפת Python.
pip install --upgrade google-cloud-speech
שליחת בקשה לתמלול אודיו
עכשיו אפשר להשתמש ב-Cloud STT כדי לתמלל קובץ אודיו לטקסט. משתמשים בקוד הבא כדי לשלוח בקשת recognize ל-Cloud Speech-to-Text API.
Go
Java
Node.js
לפני שמריצים את הדוגמה, חשוב לוודא שהכנתם את הסביבה לפיתוח ב-Node.js.
Python
לפני שמריצים את הדוגמה, חשוב לוודא שהכנתם את הסביבה לפיתוח בשפת Python.
כל הכבוד! שלחת את הבקשה הראשונה ל-Cloud STT.
אם מתקבלת שגיאה או תגובה ריקה מ-Cloud STT, כדאי לעיין בשלבים לפתרון בעיות ולצמצום שגיאות.
הסרת המשאבים
כדי לא לצבור חיובים לחשבון Google Cloud על המשאבים שבהם השתמשתם בדף הזה:
- אם אתם לא צריכים את הפרויקט, אתם יכולים להשתמש באפשרות Google Cloud console כדי למחוק אותו.
המאמרים הבאים
- מתרגלים תמלול של קובצי אודיו קצרים.
- איך מעבדים קבוצות של קובצי אודיו ארוכים לזיהוי דיבור
- כך מתמללים אודיו בסטרימינג, למשל ממיקרופון.
- כדי להתחיל להשתמש ב-Cloud STT בשפה הרצויה, אפשר להשתמש בספריית לקוח של Cloud STT.
- עוברים על אפליקציות לדוגמה.
- לקבלת מידע על שיפור הביצועים והדיוק וטיפים נוספים, אפשר לעיין במאמר בנושא שיטות מומלצות.