רשימת התכונות

נכון לעכשיו, Vision API מאפשר לכם להשתמש בתכונות הבאות:

כל סוגי התכונות

זיהוי טקסט

תמונה של תמרור
  • זיהוי תווים אופטי (OCR) של תמונה; זיהוי טקסט והמרה לטקסט מקודד למכונה. מזהה ומחלץ טקסט בפורמט UTF-8 בתמונה.
  • תמונות: אופטימיזציה לאזורים דלילים של טקסט בתוך תמונה גדולה יותר.
  • תשובה: מחזירה גם רשימה של מילים שזוהו עם טקסט, תיבות תוחמות ו-textAnnotations, וגם את ההיררכיה המבנית של הטקסט שזוהה באמצעות OCR ‏ (fullTextAnnotation).
    • היררכיה של מבנה הטקסט שחולץ:
      • TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol.
      • לכל רכיב מבני מהדף יכולות להיות תכונות משלו, כמו שפות שזוהו, מעברים וכו'.
  • השפות הנתמכות: פועל עם השפות הנתמכות, הממופות והניסיוניות.
  • ערך ה-enum של התכונה: TEXT_DETECTION.

זיהוי טקסט במסמך (טקסט צפוף / כתב יד)

תמונה צפופה עם הערות
תמונה של כתב יד
  • זיהוי תווים אופטי (OCR) של קובץ (PDF/TIFF) או של תמונה עם טקסט צפוף; זיהוי טקסט צפוף והמרה לטקסט בקידוד מכונה.
  • קבצים: אופטימיזציה לקובצי מסמכים (PDF/TIFF).
  • תמונות: אופטימיזציה לאזורים צפופים של טקסט בתמונה (תמונות שהן מסמכים) ולתמונות שמכילות כתב יד.
  • תשובה: מחזירה את ההיררכיה המבנית של הטקסט שזוהה על ידי ה-OCR (fullTextAnnotation).
    • היררכיה של מבנה הטקסט שחולץ:
      • TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol.
      • לכל רכיב מבני מהדף יכולות להיות תכונות משלו, כמו שפות שזוהו, מעברים וכו'.
  • השפות הנתמכות: פועל עם השפות הנתמכות, הממופות והניסיוניות.
  • ערך ה-enum של התכונה: DOCUMENT_TEXT_DETECTION.
    • מקבל עדיפות כשמבקשים גם את DOCUMENT_TEXT_DETECTION וגם את TEXT_DETECTION.

זיהוי ציוני דרך 1

תמונה של קתדרלת וסילי הקדוש
  • הפונקציה מחזירה את שם ציון הדרך, ציון מהימנות ותיבת תוחמת בתמונה של ציון הדרך.
  • הפונקציה מחזירה את הקואורדינטות של הישות שאותרה.

זיהוי לוגו 2

לוגו עם הערות
  • התג מספק תיאור טקסטואלי של הישות שזוהתה, ציון רמת סמך ומצולע חוסם של הלוגו בקובץ.

זיהוי תוויות 3

תמונה של רחוב בשנגחאי
  • מספק תוויות כלליות לתמונה.
  • לכל תווית מוחזר תיאור טקסטואלי, ציון מהימנות ודירוג רלוונטיות לנושא.

מאפייני תמונה 4

תמונה של באלי עם מאפיינים
  • הפונקציה מחזירה את הצבעים הדומיננטיים בתמונה.
  • כל צבע מיוצג במרחב הצבעים RGBA, יש לו ציון מהימנות, והוא מציג את החלק היחסי של הפיקסלים שתפוסים על ידי הצבע [0, 1].

לוקליזציה של אובייקטים 5

תמונה עם תיבות תוחמות
  • השירות מספק תוויות כלליות והערות של תיבות תוחמות לכמה אובייקטים שזוהו בתמונה אחת.
  • לכל אובייקט שזוהה מוחזרים הרכיבים הבאים: תיאור טקסטואלי, ציון מובהקות וקודקודים מנורמלים [0,1] של הפוליגון התוחם סביב האובייקט.

זיהוי הצעות חיתוך 6

תמונה עם גרסה חתוכה
  • לכל בקשה מוחזר פוליגון תיחום של התמונה החתוכה, ציון מהימנות ושבר חשיבות של האזור הבולט הזה ביחס לתמונה המקורית.
  • אפשר לציין עד 16 ערכים של יחסי תמונה (רוחב:גובה) עבור תמונה אחת.

דפי אינטרנט וישויות באינטרנט 7

תמונה עם טבלת ישויות באינטרנט
  • מספק סדרה של תכנים קשורים באינטרנט לתמונה.
  • הפונקציה מחזירה את המידע הבא:
    • ישויות באינטרנט: ישויות (תוויות או תיאורים) שמוסקות מתמונות דומות באינטרנט.
    • תמונות עם התאמה מלאה: רשימה של כתובות URL של תמונות עם התאמה מלאה בכל גודל באינטרנט.
    • תמונות עם התאמה חלקית: רשימה של כתובות URL של תמונות שיש להן מאפיינים משותפים של נקודות מרכזיות, כמו גרסה חתוכה של התמונה המקורית.
    • דפים עם תמונות תואמות: רשימה של דפי אינטרנט (שמזוהים לפי כתובת ה-URL של הדף, כותרת הדף וכתובת ה-URL של התמונה התואמת) עם תמונה שעומדת בתנאים שמתוארים למעלה.
    • תמונות דומות מבחינה ויזואלית: רשימה של כתובות URL של תמונות שיש להן כמה מאפיינים משותפים עם התמונה המקורית.
    • תווית עם הניחוש הטוב ביותר: ניחוש מושכל לגבי הנושא של התמונה המבוקשת, שמוסק מתמונות דומות באינטרנט.

זיהוי תוכן בוטה (חיפוש בטוח)

  • השדה הזה מספק דירוגי סבירות לקטגוריות הבאות של תוכן בוטה: adult,‏ spoof,‏ medical,‏ violence ו-racy.
  • דירוגי הסבירות מופיעים ב-6 ערכים שונים: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY או VERY_LIKELY.

זיהוי פנים

תמונה לדוגמה עם זיהוי פנים
  • התכונה מאתרת פנים באמצעות מצולעים תוחמים, ומזהה 'נקודות ציון' ספציפיות בפנים כמו עיניים, אוזניים, אף, פה וכו', יחד עם ערכי המהימנות התואמים.
  • דירוגים של סבירות לפי רגש (שמחה, עצב, כעס, הפתעה) ומאפיינים כלליים של התמונה (בתת-חשיפה, טשטוש, נוכחות של כיסוי ראש).
  • דירוגי הסבירות מופיעים ב-6 ערכים שונים: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY או VERY_LIKELY.
  • זיהוי של אדם ספציפי באמצעות זיהוי פנים לא נתמך.

1. קרדיט על התמונה: Nikolay Vorobyev ב-Unsplash (הערות נוספו).

2. קרדיט על התמונה: Robert Scoble (CC BY 2.0, נוספה הערה).

3. Image credit: Alex Knight on Unsplash.

4. Image credit: Jeremy Bishop on Unsplash.

5. קרדיט לתמונה: Bogdan Dada ב-Unsplash (הערות נוספו).

6. קרדיט על התמונה: Yasmin Dangor ב-Unsplash (התמונה המקורית והתמונה החתוכה מוצגות).

7. קרדיט על התמונה: Quinten de Graaf ב-Unsplash.