ImageContext

הקשר של התמונה או פרמטרים ספציפיים לתכונה.

ייצוג ב-JSON
{
  "latLongRect": {
    object(LatLongRect)
  },
  "languageHints": [
    string
  ],
  "cropHintsParams": {
    object(CropHintsParams)
  },
  "productSearchParams": {
    object(ProductSearchParams)
  },
  "webDetectionParams": {
    object(WebDetectionParams)
  },
  "textDetectionParams": {
    object(TextDetectionParams)
  },
  "qualityOptimizationParams": {
    object(QualityOptimizationParams)
  },
  "documentParsingParams": {
    object(DocumentParsingParams)
  }
}
שדות
latLongRect

object(LatLongRect)

לא בשימוש.

languageHints[]

string

רשימת השפות לשימוש ב-TEXT_DETECTION. ברוב המקרים, ערך ריק מניב את התוצאות הטובות ביותר כי הוא מאפשר זיהוי שפה אוטומטי. בשפות שמבוססות על האלפבית הלטיני, אין צורך להגדיר את languageHints. במקרים נדירים, כששפת הטקסט בתמונה ידועה, הגדרת רמז תעזור להשיג תוצאות טובות יותר (אבל אם הרמז שגוי, הוא יפריע מאוד). זיהוי הטקסט מחזיר שגיאה אם אחת או יותר מהשפות שצוינו לא נכללות בשפות הנתמכות.

cropHintsParams

object(CropHintsParams)

פרמטרים לבקשת הערות לגבי הצעות לחיתוך.

productSearchParams

object(ProductSearchParams)

פרמטרים לחיפוש מוצרים.

webDetectionParams

object(WebDetectionParams)

פרמטרים לזיהוי באינטרנט.

textDetectionParams

object(TextDetectionParams)

פרמטרים לזיהוי טקסט במסמך.

qualityOptimizationParams

object(QualityOptimizationParams)

פרמטרים לאופטימיזציה של איכות התמונה.

documentParsingParams

object(DocumentParsingParams)

פרמטרים לניתוח מסמכים.

LatLongRect

מלבן שנקבע על ידי זוגות של ערכים מינימליים ומקסימליים LatLng.

ייצוג ב-JSON
{
  "minLatLng": {
    object(LatLng)
  },
  "maxLatLng": {
    object(LatLng)
  }
}
שדות
minLatLng

object(LatLng)

זוג קווי הרוחב והאורך המינימליים.

maxLatLng

object(LatLng)

זוג קווי אורך ורוחב מקסימליים.

CropHintsParams

פרמטרים לבקשת הערות לגבי הצעות לחיתוך.

ייצוג ב-JSON
{
  "aspectRatios": [
    number
  ]
}
שדות
aspectRatios[]

number

יחסי גובה-רוחב במספרים עשרוניים, שמייצגים את היחס בין הרוחב לגובה של התמונה. לדוגמה, אם יחס הגובה-רוחב הרצוי הוא 4/3, הערך המתאים של הנקודה הצפה צריך להיות 1.33333. אם לא מציינים ערך, המערכת מחזירה את החיתוך הטוב ביותר האפשרי. מספר יחסי הגובה-רוחב שסופקו מוגבל ל-16 לכל היותר. המערכת מתעלמת מיחסי גובה-רוחב שסופקו אחרי ה-16.

ProductSearchParams

פרמטרים של בקשה לחיפוש מוצרים.

ייצוג ב-JSON
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "productSet": string,
  "productCategories": [
    string
  ],
  "filter": string
}
שדות
boundingPoly

object(BoundingPoly)

פוליגון התוחם את האזור שמעניין בתמונה. זה שינוי אופציונלי. אם לא מציינים את המדיניות, המערכת תחיל את שיקול הדעת שלה.

productSet

string

שם המשאב של ProductSet שרוצים לחפש תמונות דומות לו.

הפורמט הוא: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID.

productCategories[]

string

רשימת קטגוריות המוצרים שבהן יתבצע החיפוש. בשלב הזה, אנחנו מתייחסים רק לקטגוריה הראשונה, וצריך לציין את הערך homegoods,‏ apparel או toys.

filter

string

ביטוי הסינון. אפשר להשתמש בזה כדי להגביל את תוצאות החיפוש על סמך תוויות מוצרים. בשלב הזה אנחנו תומכים בביטויים של מפתח/ערך עם AND או OR, כאשר לכל ביטוי בתוך OR חייב להיות אותו מפתח.

לדוגמה, המחרוזת ‎"(color = red OR color = blue) AND brand = Google"‎ היא קבילה, אבל המחרוזות ‎ "(color = red OR brand = Google)"‎ או ‎ "color: red"‎ לא קבילות.

WebDetectionParams

פרמטרים של בקשה לזיהוי באינטרנט.

ייצוג ב-JSON
{
  "includeGeoResults": boolean
}
שדות
includeGeoResults

boolean

האם לכלול תוצאות שנגזרות מהמידע הגיאוגרפי בתמונה.

TextDetectionParams

פרמטרים לזיהוי טקסט. הפרמטר הזה משמש לשליטה בתכונות TEXT_DETECTION ו-DOCUMENT_TEXT_DETECTION.

ייצוג ב-JSON
{
  "disableOrientationDetection": boolean,
  "disableTextAnnotations": boolean,
  "pageFilter": string,
  "blockFilter": string,
  "paragraphFilter": string,
  "wordFilter": string,
  "symbolFilter": string
}
שדות
disableOrientationDetection

boolean

ההגדרה הזו משביתה את זיהוי הכיוון, כך שלא יזוהה טקסט מסובב. האפשרות הזו נתמכת רק ב-DOCUMENT_TEXT_DETECTION.

disableTextAnnotations

boolean

השבתה של השדה הישן textAnnotations. יוחזרו רק הערות מסוג full_text_annotations.

pageFilter

string (FieldMask format)

ההגדרה הזו קובעת אילו נתונים יוחזרו ברמת הדף ב-fullTextAnnotation. ברירת מחדל אם לא מוגדר: כל השדות נכללים

רשימה מופרדת בפסיקים של שמות שמוגדרים במלואם של שדות. דוגמה: "user.displayName,photo"

blockFilter

string (FieldMask format)

קובעת אילו נתונים יוחזרו ברמת הבלוק ב-fullTextAnnotation. ברירת מחדל אם לא מוגדר: כל השדות נכללים חוץ מmergedText.

רשימה מופרדת בפסיקים של שמות שמוגדרים במלואם של שדות. דוגמה: "user.displayName,photo"

paragraphFilter

string (FieldMask format)

קובע אילו נתונים יוחזרו ברמת הפסקה ב-fullTextAnnotation. ברירת המחדל אם לא מוגדר: כל השדות נכללים מלבד mergedText

רשימה מופרדת בפסיקים של שמות שמוגדרים במלואם של שדות. דוגמה: "user.displayName,photo"

wordFilter

string (FieldMask format)

קובע אילו נתונים יוחזרו ברמת המילה ב-fullTextAnnotation. ברירת המחדל אם לא מוגדר: כל השדות נכללים מלבד mergedText

רשימה מופרדת בפסיקים של שמות שמוגדרים במלואם של שדות. דוגמה: "user.displayName,photo"

symbolFilter

string (FieldMask format)

קובעת אילו נתונים יוחזרו ברמת הסמל ב-fullTextAnnotation. ברירת המחדל אם לא מוגדר: כל השדות נכללים מלבד boundingBox

רשימה מופרדת בפסיקים של שמות שמוגדרים במלואם של שדות. דוגמה: "user.displayName,photo"

QualityOptimizationParams

פרמטרים לאופטימיזציה של איכות התמונה.

ייצוג ב-JSON
{
  "type": enum(Type),
  "compressionConfig": {
    object(CompressionConfig)
  },
  "enhancementConfig": {
    object(EnhancementConfig)
  },
  "qualityScoreConfig": {
    object(QualityScoreConfig)
  }
}
שדות
type

enum(Type)

בוחרים סוג אופטימיזציה.

compressionConfig

object(CompressionConfig)

מציינים את הגדרות הדחיסה.

enhancementConfig

object(EnhancementConfig)

מציינים את הגדרת השיפור האוטומטי.

qualityScoreConfig

object(QualityScoreConfig)

מציינים את ההגדרה של ציון האיכות.

CompressionConfig

הגדרות של COMPRESSION.

ייצוג ב-JSON
{
  "targetQuality": number
}
שדות
targetQuality

number

בטווח [0, 1]. איכות היעד אחרי הדחיסה. ‫1 מייצג איכות ללא אובדן נתונים בהשוואה לתמונת הקלט, ו-0 מייצג איכות ללא דרישת איכות מינימלית.

EnhancementConfig

הגדרה אישית ל-ENHANCMENT. אם לא מציינים את enhancementConfig, המערכת תשתמש בערכי ברירת המחדל: sharpeningLevel שווה ל-0.5, ‏ autoHdrLevel שווה ל-0.5 ו-upscaleRatio שווה ל-1. אם רוצים להתאים אישית אחד משלושת הפרמטרים, צריך לציין את כל EnhancementConfig. לדוגמה, אם רוצים להשתמש בערך גבוה יותר של autoHdrLevel, שבדרך כלל יגרום לתמונה להיות בהירה יותר, ולשמור על אותם ערכים של רמת החידוד ויחס הגדלת הרזולוציה כמו ברירת המחדל, אפשר להגדיר את ההגדרה באופן הבא: enhancementConfig { sharpeningLevel: 0.5 autoHdrLevel: 1.0 upscaleRatio: 1 }

ייצוג ב-JSON
{
  "sharpeningLevel": number,
  "autoHdrLevel": number,
  "upscaleRatio": number
}
שדות
sharpeningLevel

number

בטווח [0,1]. רמת החידוד, 0 פירושו ללא חידוד, 1 פירושו החידוד הגדול ביותר. ברירת המחדל היא 0.5.

autoHdrLevel

number

בטווח [0,1]. רמת ה-HDR האוטומטי, 0 פירושו ללא HDR אוטומטי, 1 פירושו HDR אוטומטי מקסימלי. ברירת המחדל היא 0.5.

upscaleRatio

number

בטווח [1, 2]. האם לבצע הגדלה של התמונה. ערך ברירת המחדל הוא 1, כלומר לא תתבצע הגדלה. אם מציינים את הפרמטר הזה, הגובה והרוחב של הפלט יהיו שווים לגובה ולרוחב המקוריים כפול upscaleRatio.

QualityScoreConfig

ההגדרה של QUALITY_SCORE.

ייצוג ב-JSON
{
  "qualityModel": string
}
שדות
qualityModel

string

מציינים באיזה מודל להשתמש. ערך ברירת המחדל הוא מחרוזת ריקה, והפונקציה תחזיר את ציון האסתטיקה. מודל איכות נתמך נוסף הוא builtin/technical-score, שמחזיר את האיכות הטכנית של התמונה.

DocumentParsingParams

פרמטרים של התכונה DOCUMENT_PARSING.

ייצוג ב-JSON
{
  "disableOrientationDetection": boolean,
  "tableDetectionOptions": {
    object(TableDetectionOptions)
  },
  "documentType": string
}
שדות
disableOrientationDetection

boolean

ההגדרה הזו משביתה את זיהוי הכיוון, כך שלא יזוהה טקסט מסובב.

tableDetectionOptions

object(TableDetectionOptions)

שליטה בהתנהגות של זיהוי טבלאות. אם השדה הזה לא מוגדר, זיהוי הטבלה מושבת.

documentType

string

מציינים סוג מסמך מוכר כדי לזהות את המבנה בצורה מעמיקה יותר. הערכים החוקיים הם כרגע invoice או general.

TableDetectionOptions

אפשרויות לזיהוי טבלאות.

ייצוג ב-JSON
{
  "tableBoundHints": [
    {
      object(TableBoundHint)
    }
  ]
}
שדות
tableBoundHints[]

object(TableBoundHint)

רמזים אופציונליים לגבי תיבת התוחמת של הטבלה, שאפשר לספק במקרים מורכבים שבהם האלגוריתם שלנו לא מצליח לאתר את הטבלאות.

TableBoundHint

רמז לתיבת תוחמת של טבלה בדף לניתוח טבלאות.

ייצוג ב-JSON
{
  "pageNumber": number,
  "boundingBox": {
    object(BoundingPoly)
  }
}
שדות
pageNumber

number

מספר העמוד האופציונלי שעליו חלה ההערה הזו בקלט של כמה עמודים. אם לא תציינו דף, הרמז הזה יחול על כל הדפים כברירת מחדל. הערך הזה מבוסס על אינדקס שמתחיל מ-1.

boundingBox

object(BoundingPoly)

רמז לתיבת תוחמת לטבלה בדף הזה. הקואורדינטות צריכות להיות מנורמלות לערכים שבין 0 ל-1,ותיבת התוחמת צריכה להיות מלבן שמוגדר על ידי צירים.