זיהוי טקסט מבצע זיהוי תווים אופטי (OCR), שמזהה טקסט בסרטון קלט ומחלץ אותו.
זיהוי טקסט זמין בכל השפות שנתמכות על ידי Cloud Vision API.
שליחת בקשה לזיהוי טקסט בסרטון ב-Cloud Storage
בדוגמאות הבאות מוסבר איך לזהות טקסט בקובץ שנמצא ב-Cloud Storage.
REST
שליחת בקשה להוספת הערה לסרטון
בדוגמה הבאה אפשר לראות איך לשלוח בקשת POST למתודה videos:annotate. בדוגמה נעשה שימוש ב-Google Cloud CLI כדי ליצור אסימון גישה. הוראות להתקנת ה-CLI של gcloud מופיעות במאמר מדריך למתחילים בנושא Video Intelligence API.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- INPUT_URI: קטגוריה של Cloud Storage שמכילה את הקובץ שרוצים להוסיף לו הערות, כולל שם הקובץ. חייב להתחיל ב-
gs://.
לדוגמה:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4", - LANGUAGE_CODE: [אופציונלי] לדוגמה, 'en-US'
- PROJECT_NUMBER: המזהה המספרי של Google Cloud הפרויקט
ה-method של ה-HTTP וכתובת ה-URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
תוכן בקשת JSON:
{
"inputUri": "INPUT_URI",
"features": ["TEXT_DETECTION"],
"videoContext": {
"textDetectionConfig": {
"languageHints": ["LANGUAGE_CODE"]
}
}
}
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
אתם אמורים לקבל תגובת JSON שדומה לזו:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID"
}
אם התגובה מצליחה, Video Intelligence API מחזיר את name עבור הפעולה שלכם. בדוגמה שלמעלה מוצגת תגובה כזו, כאשר:
project-number הוא מספר הפרויקט ו-operation-id הוא המזהה של הפעולה ארוכת הטווח שנוצרה עבור הבקשה.
- PROJECT_NUMBER: מספר הפרויקט
- LOCATION_ID: האזור ב-Cloud שבו צריך להוסיף את ההערה. האזורים הנתמכים בענן הם:
us-east1, us-west1,europe-west1, asia-east1. אם לא מציינים אזור, המערכת תקבע אזור על סמך המיקום של קובץ הסרטון. - OPERATION_ID: המזהה של הפעולה הממושכת שנוצרה עבור הבקשה ומופיע בתגובה כשמתחילים את הפעולה, לדוגמה
12345...
קבלת תוצאות של אנוטציות
כדי לאחזר את תוצאת הפעולה, שולחים בקשת GET באמצעות שם הפעולה שמוחזר מהקריאה אל videos:annotate, כמו בדוגמה הבאה.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- OPERATION_NAME: השם של הפעולה כפי שמוחזר על ידי Video Intelligence API. שם הפעולה הוא בפורמט
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID - PROJECT_NUMBER: המזהה המספרי של Google Cloud הפרויקט
ה-method של ה-HTTP וכתובת ה-URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
אתם אמורים לקבל תגובת JSON שדומה לזו:
הערות לגבי זיהוי טקסט מוחזרות כרשימהtextAnnotations.
הערה: השדה done מוחזר רק כשהערך שלו הוא True.
הוא לא נכלל בתשובות שהפעולה שלהן לא הושלמה.
הורדת תוצאות ההערות
מעתיקים את ההערה מהמקור לדלי היעד: (ראו העתקת קבצים ואובייקטים)
gcloud storage cp gcs_uri gs://my-bucket
הערה: אם המשתמש מספק את ה-URI של GCS בפלט, ההערה מאוחסנת ב-URI הזה.
Go
Java
כדי לבצע אימות ב-Video Intelligence, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
כדי לבצע אימות ב-Video Intelligence, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Video Intelligence, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
שפות נוספות
C#: צריך לפעול לפי הוראות ההגדרה של C# בדף של ספריות הלקוח ואז לעבור אל מאמרי העזרה של Video Intelligence בנושא .NET.
PHP: Please follow the PHP setup instructions on the client libraries page and then visit the Video Intelligence מאמרי עזרה for PHP.
Ruby: צריך לפעול לפי הוראות ההגדרה של Ruby בדף של ספריות הלקוח ואז לעבור אל מסמך העזר של Video Intelligence ל-Ruby.
בקשה לזיהוי טקסט בסרטון מקובץ מקומי
בדוגמאות הבאות מוסבר איך לזהות טקסט בקובץ שמאוחסן באופן מקומי.
REST
שליחת בקשה להוספת הערה לסרטון
כדי להוסיף הערות לקובץ וידאו מקומי, צריך לקודד ב-Base64 את התוכן של קובץ הווידאו.
כוללים את התוכן בקידוד base64 בשדה inputContent של הבקשה.
מידע על קידוד Base64 של תוכן קובץ וידאו זמין במאמר בנושא קידוד Base64.
בדוגמה הבאה אפשר לראות איך לשלוח בקשת POST למתודה videos:annotate.
בדוגמה נעשה שימוש ב-Google Cloud CLI כדי ליצור אסימון גישה.
הוראות להתקנת Google Cloud CLI מופיעות במאמר מדריך למתחילים בנושא Video Intelligence API
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- "inputContent": BASE64_ENCODED_CONTENT
לדוגמה:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [אופציונלי] לדוגמה, 'en-US'
- PROJECT_NUMBER: המזהה המספרי של Google Cloud הפרויקט
ה-method של ה-HTTP וכתובת ה-URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
תוכן בקשת JSON:
{
"inputContent": "BASE64_ENCODED_CONTENT",
"features": ["TEXT_DETECTION"],
"videoContext": {
"textDetectionConfig": {
"languageHints": ["LANGUAGE_CODE"]
}
}
}
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
אתם אמורים לקבל תגובת JSON שדומה לזו:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID"
}
אם התשובה חיובית, Video Intelligence API מחזיר את name של הפעולה. בדוגמה שלמעלה מוצגת תגובה כזו, כאשר project-number הוא שם הפרויקט ו-operation-id הוא המזהה של הפעולה ארוכת הטווח שנוצרה עבור הבקשה.
- OPERATION_ID: הערך שמופיע בתשובה כשמתחילים את הפעולה, לדוגמה
12345...
קבלת תוצאות של אנוטציות
כדי לאחזר את תוצאת הפעולה, שולחים בקשת GET באמצעות שם הפעולה שמוחזר מהקריאה אל videos:annotate, כמו בדוגמה הבאה.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_NUMBER: המזהה המספרי של Google Cloud הפרויקט
ה-method של ה-HTTP וכתובת ה-URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
אתם אמורים לקבל תגובת JSON שדומה לזו:
ההערות של זיהוי הטקסט מוחזרות כרשימה של textAnnotations.
הערה: השדה done מוחזר רק כשהערך שלו הוא True.
הוא לא נכלל בתשובות שהפעולה שלהן לא הושלמה.
Go
Java
Node.js
כדי לבצע אימות ב-Video Intelligence, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
שפות נוספות
C#: צריך לפעול לפי הוראות ההגדרה של C# בדף של ספריות הלקוח ואז לעבור אל מאמרי העזרה של Video Intelligence בנושא .NET.
PHP: Please follow the PHP setup instructions on the client libraries page and then visit the Video Intelligence מאמרי עזרה for PHP.
Ruby: צריך לפעול לפי הוראות ההגדרה של Ruby בדף של ספריות הלקוח ואז לעבור אל מסמך העזר של Video Intelligence ל-Ruby.