ImageContext

图片上下文和/或特征专用参数。

JSON 表示法
{
  "latLongRect": {
    object(LatLongRect)
  },
  "languageHints": [
    string
  ],
  "cropHintsParams": {
    object(CropHintsParams)
  },
  "productSearchParams": {
    object(ProductSearchParams)
  },
  "webDetectionParams": {
    object(WebDetectionParams)
  },
  "textDetectionParams": {
    object(TextDetectionParams)
  },
  "qualityOptimizationParams": {
    object(QualityOptimizationParams)
  },
  "documentParsingParams": {
    object(DocumentParsingParams)
  }
}
字段
latLongRect

object(LatLongRect)

未使用。

languageHints[]

string

用于 TEXT_DETECTION 的语言列表。在大多数情况下,使用空值时效果最佳,因为这支持自动检测语言。对于基于拉丁字母的语言,无需设置 languageHints。在极少数情况下,如果图片中文本的语言已知,设置提示将有助于获得更好的效果(尽管提示错误会造成很大的阻碍)。如果已指定语言中有一种或多种不在支持的语言范围内,文本检测将返回错误。

cropHintsParams

object(CropHintsParams)

剪裁提示注释请求的参数。

productSearchParams

object(ProductSearchParams)

用于商品搜索的参数。

webDetectionParams

object(WebDetectionParams)

用于 Web 检测的参数。

textDetectionParams

object(TextDetectionParams)

用于文档文本检测的参数。

qualityOptimizationParams

object(QualityOptimizationParams)

用于优化图片质量的参数。

documentParsingParams

object(DocumentParsingParams)

用于文档解析的参数。

LatLongRect

由最小和最大 LatLng 对确定的矩形。

JSON 表示法
{
  "minLatLng": {
    object(LatLng)
  },
  "maxLatLng": {
    object(LatLng)
  }
}
字段
minLatLng

object(LatLng)

最小纬度/经度对。

maxLatLng

object(LatLng)

最大纬度/经度对。

CropHintsParams

剪裁提示注释请求的参数。

JSON 表示法
{
  "aspectRatios": [
    number
  ]
}
字段
aspectRatios[]

number

以浮点数表示的宽高比,表示图片宽度与高度的比率。例如,如果所需的宽高比是 4/3,则相应的浮点值应为 1.33333。如果未指定,则返回可能最佳的剪裁区域。提供的宽高比上限为 16,16 之后提供的任何宽高比都将予以忽略。

ProductSearchParams

商品搜索请求的参数。

JSON 表示法
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "productSet": string,
  "productCategories": [
    string
  ],
  "filter": string
}
字段
boundingPoly

object(BoundingPoly)

图片中感兴趣的区域的边界多边形。可选。如果未指定,则应用系统自行决定的设置。

productSet

string

要搜索类似图片的一项 ProductSet 资源名称。

格式为:projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

productCategories[]

string

要在其中执行搜索的商品类别列表。目前我们只考虑第一个类别,应指定“homegoods”、“apparel”或“toys”。

filter

string

过滤表达式。这可用于根据商品标签限制搜索结果。目前,我们支持对键值对表达式的多个“逻辑或”运算再执行“逻辑与”运算,前提是“逻辑或”运算中涉及到的每个表达式都必须具有相同的键。

例如,可以使用“(color = red OR color = blue) AND brand = Google”,但请勿使用“(color = red OR brand = Google)”或“color: red”。

WebDetectionParams

Web 检测请求的参数。

JSON 表示法
{
  "includeGeoResults": boolean
}
字段
includeGeoResults

boolean

是否包含来自图片的地理信息的结果。

TextDetectionParams

用于文本检测的参数。其用于控制 TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 功能。

JSON 表示法
{
  "disableOrientationDetection": boolean,
  "disableTextAnnotations": boolean,
  "pageFilter": string,
  "blockFilter": string,
  "paragraphFilter": string,
  "wordFilter": string,
  "symbolFilter": string
}
字段
disableOrientationDetection

boolean

停用方向检测,以便系统不检测旋转的文本。只有 DOCUMENT_TEXT_DETECTION 支持此功能。

disableTextAnnotations

boolean

停用旧的 textAnnotations 字段。仅返回 full_text_annotations。

pageFilter

string (FieldMask format)

控制在页面级别的 fullTextAnnotation 中返回的数据。未设置时使用默认值:包含所有字段

以逗号分隔的完全限定字段名称列表。示例:"user.displayName,photo"

blockFilter

string (FieldMask format)

控制在块级别的 fullTextAnnotation 中返回的数据。未设置时使用默认值:包括除 mergedText 之外的所有字段。

以逗号分隔的完全限定字段名称列表。示例:"user.displayName,photo"

paragraphFilter

string (FieldMask format)

控制在段落级别的 fullTextAnnotation 中返回的数据。未设置时使用默认值:包括除 mergedText 之外的所有字段

以逗号分隔的完全限定字段名称列表。示例:"user.displayName,photo"

wordFilter

string (FieldMask format)

控制在字词级别的 fullTextAnnotation 中返回的数据。未设置时使用默认值:包括除 mergedText 之外的所有字段

以逗号分隔的完全限定字段名称列表。示例:"user.displayName,photo"

symbolFilter

string (FieldMask format)

控制在符号级别的 fullTextAnnotation 中返回的数据。未设置时使用默认值:包括除 boundingBox 之外的所有字段

以逗号分隔的完全限定字段名称列表。示例:"user.displayName,photo"

QualityOptimizationParams

用于优化图片质量的参数。

JSON 表示法
{
  "type": enum(Type),
  "compressionConfig": {
    object(CompressionConfig)
  },
  "enhancementConfig": {
    object(EnhancementConfig)
  },
  "qualityScoreConfig": {
    object(QualityScoreConfig)
  }
}
字段
type

enum(Type)

选择一种优化类型。

compressionConfig

object(CompressionConfig)

指定压缩配置。

enhancementConfig

object(EnhancementConfig)

指定自动增强配置。

qualityScoreConfig

object(QualityScoreConfig)

指定质量得分配置。

CompressionConfig

COMPRESSION 的配置。

JSON 表示法
{
  "targetQuality": number
}
字段
targetQuality

number

在 [0, 1] 范围内。压缩后的目标质量。1 表示与输入图片相比无损,0 表示无最低质量要求。

EnhancementConfig

ENHANCMENT 的配置。如果未指定 enhancementConfig,则会使用以下默认值:sharpeningLevel 等于 0.5,autoHdrLevel 等于 0.5,而 upscaleRatio 等于 1。如果您希望自定义这三个参数中的任何一个,则需要指定整个 EnhancementConfig。例如,如果您要使用较高的 autoHdrLevel,通常这样做可以提亮图片,同时将锐化等级和纵向扩充比例保持与默认值相同,则可以将配置设置为:enhancementConfig { sharpeningLevel: 0.5 autoHdrLevel: 1.0 upscaleRatio: 1 }

JSON 表示法
{
  "sharpeningLevel": number,
  "autoHdrLevel": number,
  "upscaleRatio": number
}
字段
sharpeningLevel

number

在 [0,1] 范围内锐化等级,0 表示无锐化,1 表示最高限度的锐化。默认值为 0.5。

autoHdrLevel

number

在 [0,1] 范围内Auto HDR 等级,0 表示无 Auto HDR,1 表示最高限度的 AutoHDR。默认值为 0.5。

upscaleRatio

number

在 [1, 2] 范围内是否进行纵向扩充,默认值为 1,表示不进行纵向扩充。如果指定此字段,则输出高度和宽度将等于原始高度和宽度乘以 upscaleRatio。

QualityScoreConfig

QUALITY_SCORE 的配置。

JSON 表示法
{
  "qualityModel": string
}
字段
qualityModel

string

指定要使用的模型。默认值为空字符串,并且会返回美感得分。另一种受支持的质量模型是“builtin/technology-score”,它将返回图片技术质量。

DocumentParsingParams

DOCUMENT_PARSING 特征的参数。

JSON 表示法
{
  "disableOrientationDetection": boolean,
  "tableDetectionOptions": {
    object(TableDetectionOptions)
  },
  "documentType": string
}
字段
disableOrientationDetection

boolean

停用方向检测,以便系统不检测旋转的文本。

tableDetectionOptions

object(TableDetectionOptions)

控制表检测行为。如果未设置此字段,则停用表检测。

documentType

string

为更深层的结构检测指定已知文档类型。有效值目前为“账单”或“常规”。

TableDetectionOptions

用于表检测的选项。

JSON 表示法
{
  "tableBoundHints": [
    {
      object(TableBoundHint)
    }
  ]
}
字段
tableBoundHints[]

object(TableBoundHint)

可选的表边界框提示,可在算法找不到表的复杂场景中提供提示。

TableBoundHint

页面上用于解析表的表边界框的提示。

JSON 表示法
{
  "pageNumber": number,
  "boundingBox": {
    object(BoundingPoly)
  }
}
字段
pageNumber

number

此提示适用的多页输入的可选页码。如果未提供此字段,则此提示默认会应用于所有页面。此值从 1 开始计数。

boundingBox

object(BoundingPoly)

此页面上表的边界框提示。坐标必须归一化为 [0,1],并且边界框必须是与轴对齐的矩形。