Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

רשימת התכונות

נכון לעכשיו, Vision API מאפשר לכם להשתמש בתכונות הבאות:

כל סוגי התכונות
זיהוי טקסט	זיהוי תווים אופטי (OCR) של תמונה; זיהוי טקסט והמרה לטקסט מקודד למכונה. מזהה ומחלץ טקסט בפורמט UTF-8 בתמונה. תמונות: אופטימיזציה לאזורים דלילים של טקסט בתוך תמונה גדולה יותר. תשובה: מחזירה גם רשימה של מילים שזוהו עם טקסט, תיבות תוחמות ו-`textAnnotations`, וגם את ההיררכיה המבנית של הטקסט שזוהה באמצעות OCR ‏ (`fullTextAnnotation`). היררכיה של מבנה הטקסט שחולץ: TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol. לכל רכיב מבני מהדף יכולות להיות תכונות משלו, כמו שפות שזוהו, מעברים וכו'. השפות הנתמכות: פועל עם השפות הנתמכות, הממופות והניסיוניות. ערך ה-enum של התכונה: `TEXT_DETECTION`.
זיהוי טקסט במסמך (טקסט צפוף / כתב יד)	זיהוי תווים אופטי (OCR) של קובץ (PDF/TIFF) או של תמונה עם טקסט צפוף; זיהוי טקסט צפוף והמרה לטקסט בקידוד מכונה. קבצים: אופטימיזציה לקובצי מסמכים (PDF/TIFF). תמונות: אופטימיזציה לאזורים *צפופים* של טקסט בתמונה (תמונות שהן מסמכים) ולתמונות שמכילות כתב יד. תשובה: מחזירה את ההיררכיה המבנית של הטקסט שזוהה על ידי ה-OCR (`fullTextAnnotation`). היררכיה של מבנה הטקסט שחולץ: TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol. לכל רכיב מבני מהדף יכולות להיות תכונות משלו, כמו שפות שזוהו, מעברים וכו'. השפות הנתמכות: פועל עם השפות הנתמכות, הממופות והניסיוניות. ערך ה-enum של התכונה: `DOCUMENT_TEXT_DETECTION`. מקבל עדיפות כשמבקשים גם את `DOCUMENT_TEXT_DETECTION` וגם את `TEXT_DETECTION`. אם אתם מנסים לזהות טקסט במסמכים סרוקים, כדאי לנסות את Document AI כדי לבצע זיהוי תווים אופטי, ניתוח של טפסים מובְנים וחילוץ ישויות. אפשר להשתמש בארגז הכלים של Document AI כדי להמיר פלט מפורמט Document AI לפורמט Cloud Vision.
זיהוי ציוני דרך ¹	הפונקציה מחזירה את שם ציון הדרך, ציון מהימנות ותיבת תוחמת בתמונה של ציון הדרך. הפונקציה מחזירה את הקואורדינטות של הישות שאותרה.
זיהוי לוגו ²	התג מספק תיאור טקסטואלי של הישות שזוהתה, ציון רמת סמך ומצולע חוסם של הלוגו בקובץ.
זיהוי תוויות ³	מספק תוויות כלליות לתמונה. לכל תווית מוחזר תיאור טקסטואלי, ציון מהימנות ודירוג רלוונטיות לנושא.
מאפייני תמונה ⁴	הפונקציה מחזירה את הצבעים הדומיננטיים בתמונה. כל צבע מיוצג במרחב הצבעים RGBA, יש לו ציון מהימנות, והוא מציג את החלק היחסי של הפיקסלים שתפוסים על ידי הצבע [0, 1].
לוקליזציה של אובייקטים ⁵	השירות מספק תוויות כלליות והערות של תיבות תוחמות לכמה אובייקטים שזוהו בתמונה אחת. לכל אובייקט שזוהה מוחזרים הרכיבים הבאים: תיאור טקסטואלי, ציון מובהקות וקודקודים מנורמלים [0,1] של הפוליגון התוחם סביב האובייקט. צריכים זיהוי אובייקטים בהתאמה אישית? באמצעות AutoML Vision Object Detection, אתם יכולים ליצור מודל מותאם אישית של למידת מכונה לתרחיש השימוש הספציפי שלכם לזיהוי אובייקטים בתמונות.
זיהוי הצעות חיתוך ⁶	לכל בקשה מוחזר פוליגון תיחום של התמונה החתוכה, ציון מהימנות ושבר חשיבות של האזור הבולט הזה ביחס לתמונה המקורית. אפשר לציין עד 16 ערכים של יחסי תמונה (רוחב:גובה) עבור תמונה אחת.
דפי אינטרנט וישויות באינטרנט ⁷	מספק סדרה של תכנים קשורים באינטרנט לתמונה. הפונקציה מחזירה את המידע הבא: ישויות באינטרנט: ישויות (תוויות או תיאורים) שמוסקות מתמונות דומות באינטרנט. תמונות עם התאמה מלאה: רשימה של כתובות URL של תמונות עם התאמה מלאה בכל גודל באינטרנט. תמונות עם התאמה חלקית: רשימה של כתובות URL של תמונות שיש להן מאפיינים משותפים של נקודות מרכזיות, כמו גרסה חתוכה של התמונה המקורית. דפים עם תמונות תואמות: רשימה של דפי אינטרנט (שמזוהים לפי כתובת ה-URL של הדף, כותרת הדף וכתובת ה-URL של התמונה התואמת) עם תמונה שעומדת בתנאים שמתוארים למעלה. תמונות דומות מבחינה ויזואלית: רשימה של כתובות URL של תמונות שיש להן כמה מאפיינים משותפים עם התמונה המקורית. תווית עם הניחוש הטוב ביותר: ניחוש מושכל לגבי הנושא של התמונה המבוקשת, שמוסק מתמונות דומות באינטרנט.
זיהוי תוכן בוטה (חיפוש בטוח)	השדה הזה מספק דירוגי סבירות לקטגוריות הבאות של תוכן בוטה: `adult`,‏ `spoof`,‏ `medical`,‏ `violence` ו-`racy`. דירוגי הסבירות מופיעים ב-6 ערכים שונים: `UNKNOWN`, `VERY_UNLIKELY`, `UNLIKELY`, `POSSIBLE`, `LIKELY` או `VERY_LIKELY`.
זיהוי פנים	התכונה מאתרת פנים באמצעות מצולעים תוחמים, ומזהה 'נקודות ציון' ספציפיות בפנים כמו עיניים, אוזניים, אף, פה וכו', יחד עם ערכי המהימנות התואמים. דירוגים של סבירות לפי רגש (שמחה, עצב, כעס, הפתעה) ומאפיינים כלליים של התמונה (בתת-חשיפה, טשטוש, נוכחות של כיסוי ראש). דירוגי הסבירות מופיעים ב-6 ערכים שונים: `UNKNOWN`, `VERY_UNLIKELY`, `UNLIKELY`, `POSSIBLE`, `LIKELY` או `VERY_LIKELY`. זיהוי של אדם ספציפי באמצעות זיהוי פנים לא נתמך.

^{1.
קרדיט על התמונה:
Nikolay Vorobyev ב-Unsplash (הערות נוספו).
↩}

^{2.
קרדיט על התמונה:
Robert Scoble
(CC BY 2.0, נוספה הערה).
↩}

^{3.
Image credit:
Alex Knight on Unsplash.
↩}

^{4.
Image credit:
Jeremy Bishop on Unsplash.
↩}

^{5.
קרדיט לתמונה:
Bogdan Dada ב-Unsplash
(הערות נוספו).
↩}

^{6.
קרדיט על התמונה:

Yasmin Dangor ב-Unsplash (התמונה המקורית והתמונה החתוכה מוצגות).
↩}

^{7.
קרדיט על התמונה:
Quinten de Graaf ב-Unsplash.
↩}

רשימת התכונות קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

רשימת התכונות