בדף הזה מוסבר איך מקבלים סימני פיסוק אוטומטיים בתוצאות התמלול מ-Cloud Speech-to-Text. כשמפעילים את התכונה הזו, מערכת Cloud STT מסיקה באופן אוטומטי אם יש נקודות, פסיקים וסימני שאלה בנתוני האודיו, ומוסיפה אותם לתמליל.
כברירת מחדל, Cloud STT לא כולל סימני פיסוק בתוצאות של זיהוי הדיבור. עם זאת, אפשר לבקש מ-Cloud STT לזהות ולהוסיף סימני פיסוק באופן אוטומטי בתוצאות התמלול. כשמפעילים פיסוק אוטומטי, Cloud STT גם משתמש אוטומטית באותיות רישיות לאות הראשונה אחרי כל נקודה וסימן שאלה.
כדי להפעיל פיסוק אוטומטי, מגדירים את השדה enableAutomaticPunctuation לערך true בפרמטרים של RecognitionConfig בבקשה. Cloud Speech-to-Text API תומך בפיסוק אוטומטי לכל שיטות זיהוי הדיבור:
speech:recognize, speech:longrunningrecognize ו-Streaming.
בדוגמאות הקוד הבאות אפשר לראות איך לקבל פרטים על פיסוק אוטומטי בבקשת תמלול.
פרוטוקול
פרטים נוספים זמינים בנקודת קצה ל-API שלspeech:recognize.
כדי לבצע זיהוי דיבור סינכרוני, שולחים בקשת POST ומספקים את גוף הבקשה המתאים. בדוגמה הבאה מוצגת בקשת POST באמצעות curl. בדוגמה נעשה שימוש ב-Google Cloud CLI כדי ליצור אסימון גישה. הוראות להתקנת ה-CLI של gcloud מופיעות במדריך למתחילים.
curl -s -H "Content-Type: application/json" \
-H "Authorization: Bearer "$(gcloud auth print-access-token) \
https://speech.googleapis.com/v1/speech:recognize \
--data '{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 16000,
"languageCode": "en-US",
"enableAutomaticPunctuation": true
},
"audio": {
"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
}
}'
למידע נוסף על הגדרת גוף הבקשה, אפשר לעיין במסמכי התיעוד של RecognitionConfig.
אם הבקשה מצליחה, השרת מחזיר קוד סטטוס 200 OK של HTTP ואת התשובה בפורמט JSON:
{
"results": [
{
"alternatives": [
{
"transcript": "How old is the Brooklyn Bridge?",
"confidence": 0.98360395
}
]
}
]
}
Go
מידע על התקנה ושימוש בספריית הלקוח של Cloud STT מופיע במאמר ספריות הלקוח של Cloud STT. מידע נוסף מופיע במאמרי העזרה של Cloud STT Go API.
כדי לבצע אימות ב-Cloud STT, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנה ושימוש בספריית הלקוח של Cloud STT מופיע במאמר ספריות הלקוח של Cloud STT. מידע נוסף מופיע במאמרי העזרה של Cloud STT Java API.
כדי לבצע אימות ב-Cloud STT, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנה ושימוש בספריית הלקוח של Cloud STT מופיע במאמר ספריות הלקוח של Cloud STT. מידע נוסף מופיע במאמרי העזרה של Cloud STT Node.js API.
כדי לבצע אימות ב-Cloud STT, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנה ושימוש בספריית הלקוח של Cloud STT מופיע במאמר ספריות הלקוח של Cloud STT. מידע נוסף מופיע במאמרי העזרה של Cloud STT Python API.
כדי לבצע אימות ב-Cloud STT, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
שפות נוספות
C#: צריך לפעול לפי הוראות ההגדרה של C# בדף של ספריות הלקוח ואז לעבור אל מאמרי העזרה של Cloud STT ל- .NET.
PHP: צריך לפעול לפי הוראות ההגדרה של PHP בדף של ספריות הלקוח ואז לעבור אל מאמרי העזרה של Cloud STT ל-PHP.
Ruby: פועלים לפי הוראות ההגדרה של Ruby בדף של ספריות הלקוח, ואז עוברים אל מאמרי העזרה של Cloud STT ל-Ruby.
המאמרים הבאים
איך שולחים בקשות תמלול סנכרוניות