索引
ImageAnnotator(接口)ProductSearch(接口)AddProductToProductSetRequest(消息)AnnotateFileResponse(消息)AnnotateImageRequest(消息)AnnotateImageResponse(消息)AsyncAnnotateFileRequest(消息)AsyncAnnotateFileResponse(消息)AsyncBatchAnnotateFilesRequest(消息)AsyncBatchAnnotateFilesResponse(消息)BatchAnnotateImagesRequest(消息)BatchAnnotateImagesResponse(消息)BatchOperationMetadata(消息)BatchOperationMetadata.State(枚举)Block(消息)Block.BlockType(枚举)BoundingPoly(消息)ColorInfo(消息)CreateProductRequest(消息)CreateProductSetRequest(消息)CreateReferenceImageRequest(消息)CropHint(消息)CropHintsAnnotation(消息)CropHintsParams(消息)DeleteProductRequest(消息)DeleteProductSetRequest(消息)DeleteReferenceImageRequest(消息)DominantColorsAnnotation(消息)EntityAnnotation(消息)FaceAnnotation(消息)FaceAnnotation.Landmark(消息)FaceAnnotation.Landmark.Type(枚举)Feature(消息)Feature.Type(枚举)GcsDestination(消息)GcsSource(消息)GetProductRequest(消息)GetProductSetRequest(消息)GetReferenceImageRequest(消息)Image(消息)ImageAnnotationContext(消息)ImageContext(消息)ImageProperties(消息)ImageSource(消息)ImportProductSetsGcsSource(消息)ImportProductSetsInputConfig(消息)ImportProductSetsRequest(消息)ImportProductSetsResponse(消息)InputConfig(消息)LatLongRect(消息)Likelihood(枚举)ListProductSetsRequest(消息)ListProductSetsResponse(消息)ListProductsInProductSetRequest(消息)ListProductsInProductSetResponse(消息)ListProductsRequest(消息)ListProductsResponse(消息)ListReferenceImagesRequest(消息)ListReferenceImagesResponse(消息)LocalizedObjectAnnotation(消息)LocationInfo(消息)NormalizedVertex(消息)OperationMetadata(消息)OperationMetadata.State(枚举)OutputConfig(消息)Page(消息)Paragraph(消息)Position(消息)Product(消息)Product.KeyValue(消息)ProductSearchParams(消息)ProductSearchResults(消息)ProductSearchResults.GroupedResult(消息)ProductSearchResults.Result(消息)ProductSet(消息)Property(消息)ReferenceImage(消息)RemoveProductFromProductSetRequest(消息)SafeSearchAnnotation(消息)Symbol(消息)TextAnnotation(消息)TextAnnotation.DetectedBreak(消息)TextAnnotation.DetectedBreak.BreakType(枚举)TextAnnotation.DetectedLanguage(消息)TextAnnotation.TextProperty(消息)UpdateProductRequest(消息)UpdateProductSetRequest(消息)Vertex(消息)WebDetection(消息)WebDetection.WebEntity(消息)WebDetection.WebImage(消息)WebDetection.WebLabel(消息)WebDetection.WebPage(消息)WebDetectionParams(消息)Word(消息)
ImageAnnotator
用于对客户端图片执行 Google Cloud Vision API 检测任务的服务,可执行人脸、标志、徽标、标签和文本等内容的检测。ImageAnnotator 服务返回从图片中检测到的实体。
| AsyncBatchAnnotateFiles | |
|---|---|
|
对常规文件(例如可能包含多页、每页可能包含多张图片的 PDF 文件)列表运行异步图片检测和注释。您可以通过
|
|
| BatchAnnotateImages | |
|---|---|
|
对一批图片运行图片检测和注释。
|
|
ProductSearch
管理要在 Product Search 中使用的参考图片的 Product 和 ProductSet。它使用以下资源模型:
- 该 API 有一个名为
projects/*/locations/*/productSets/*的ProductSet资源集合,它是一种将不同商品放入组中,以限制识别的方式。
此外它还使用如下资源:
该 API 有一个名为
projects/*/locations/*/products/*的Product资源集合每个
Product都有一组名为projects/*/locations/*/products/*/referenceImages/*的ReferenceImage资源
| AddProductToProductSet | |
|---|---|
|
将 Product 添加到指定的 ProductSet。如果该 Product 已存在,则不会进行任何更改。 1 个 Product 最多只能添加到 100 个 ProductSet 中。 可能出现的错误:
|
|
| CreateProduct | |
|---|---|
|
创建并返回新的商品资源。 可能出现的错误:
|
|
| CreateProductSet | |
|---|---|
|
创建并返回新的 ProductSet 资源。 可能出现的错误:
|
|
| CreateReferenceImage | |
|---|---|
|
创建并返回新的 ReferenceImage 资源。
请注意,如果图片分辨率过大(超过 5 千万像素),无法处理,则流水线会调整图片大小。 可能出现的错误:
|
|
| DeleteProduct | |
|---|---|
|
永久删除一种商品及其参考图片。 系统会立即删除商品及其图片的所有元数据,但对包含该商品的 ProductSet 的搜索查询仍可能有效,直到刷新所有相关的缓存为止。 可能出现的错误:
|
|
| DeleteProductSet | |
|---|---|
|
永久删除一个 ProductSet。ProductSet 中的 Product 和 ReferenceImage 不会被删除。 实际图片文件不会从 Google Cloud Storage 中删除。 可能出现的错误:
|
|
| DeleteReferenceImage | |
|---|---|
|
永久删除一张参考图片。 系统会立即删除图片元数据,但对包含该图片的 ProductSet 的搜索查询仍可能有效,直到刷新所有相关的缓存为止。 实际图片文件不会从 Google Cloud Storage 中删除。 可能出现的错误:
|
|
| GetProduct | |
|---|---|
|
获取与 Product 关联的信息。 可能出现的错误:
|
|
| GetProductSet | |
|---|---|
|
获取与 ProductSet 关联的信息。 可能出现的错误:
|
|
| GetReferenceImage | |
|---|---|
|
获取与 ReferenceImage 关联的信息。 可能出现的错误:
|
|
| ImportProductSets | |
|---|---|
|
此异步 API 可根据图片信息列表将参考图片列表导入指定的商品集中。
此方法的输入来源是 Google Cloud Storage 上的一个 csv 文件。如需了解 CSV 文件格式,请参阅
|
|
| ListProductSets | |
|---|---|
|
以未指定的顺序列出 ProductSet。 可能出现的错误:
|
|
| ListProducts | |
|---|---|
|
以未指定的顺序列出商品。 可能出现的错误:
|
|
| ListProductsInProductSet | |
|---|---|
|
按未指定的顺序列出 ProductSet 中的 Product。如果 ProductSet 不存在,则响应中的商品字段留空。 可能出现的错误:
|
|
| ListReferenceImages | |
|---|---|
|
列出参考图片。 可能出现的错误:
|
|
| RemoveProductFromProductSet | |
|---|---|
|
从指定的 ProductSet 中移除 Product。 可能出现的错误:
|
|
| UpdateProduct | |
|---|---|
|
对一项 Product 资源执行更改。目前只能更新 如果更新了标签,则更改要到下一次索引时,才会体现在查询中。 可能出现的错误:
|
|
| UpdateProductSet | |
|---|---|
|
对一项 ProductSet 资源进行更改。目前只能更新 display_name。 可能出现的错误:
|
|
AddProductToProductSetRequest
对 AddProductToProductSet 方法的请求消息。
| 字段 | |
|---|---|
name |
要修改的 ProductSet 的资源名称。 格式为: |
product |
要添加到此 ProductSet 中的 Product 的资源名称。 格式为: |
AnnotateFileResponse
对单个文件注释请求的响应。一个文件中可以包含一张或多张图片,每张图片都分别有各自的响应。
| 字段 | |
|---|---|
input_config |
为其生成此响应的文件的相关信息。 |
responses[] |
对文件中找到的图片进行单独响应。 |
AnnotateImageRequest
请求对用户提供的图片执行 Google Cloud Vision API 任务,并提供用户请求的特征。
| 字段 | |
|---|---|
image |
要处理的图片。 |
features[] |
请求的功能。 |
image_context |
图片可能随附的相关信息。 |
AnnotateImageResponse
对一个图片注释请求的响应。
| 字段 | |
|---|---|
face_annotations[] |
如果存在,则人脸检测已成功完成。 |
landmark_annotations[] |
如果存在,则地标检测已成功完成。 |
logo_annotations[] |
如果存在,则徽标检测已成功完成。 |
label_annotations[] |
如果存在,则标签检测已成功完成。 |
localized_object_annotations[] |
如果存在,则本地化对象检测已成功完成。此值会按置信度分数降序排序。 |
text_annotations[] |
如果存在,则文本 (OCR) 检测已成功完成。 |
full_text_annotation |
如果存在,则文本 (OCR) 检测或文档 (OCR) 文本检测已成功完成。此注释提供 OCR 检测到的文本的结构性层次结构。 |
safe_search_annotation |
如果存在,则安全搜索注释已成功完成。 |
image_properties_annotation |
如果存在,则已成功提取图片属性。 |
crop_hints_annotation |
如果存在,则剪裁提示已成功完成。 |
web_detection |
如果存在,则 Web 检测已成功完成。 |
product_search_results |
如果存在,则 Google 商品搜索已成功完成。 |
error |
如果设置,则表示操作的错误消息。请注意,即便设置了 |
context |
只要存在上下文信息,即可了解此图片的来源。 |
AsyncAnnotateFileRequest
离线文件注释请求。
| 字段 | |
|---|---|
input_config |
必需。输入文件的相关信息。 |
features[] |
必需。请求的功能。 |
image_context |
文件中图片可能随附的其他上下文。 |
output_config |
必需。所需的输出位置和元数据(例如格式)。 |
AsyncAnnotateFileResponse
对单个离线文件注释请求的响应。
| 字段 | |
|---|---|
output_config |
AsyncAnnotateFileRequest 的输出位置和元数据。 |
AsyncBatchAnnotateFilesRequest
多个异步文件注释请求会分批次,通过单个服务调用进行处理。
| 字段 | |
|---|---|
requests[] |
此批次的各个异步文件注释请求。 |
AsyncBatchAnnotateFilesResponse
对一个异步批量文件注释请求的响应。
| 字段 | |
|---|---|
responses[] |
文件注释响应列表,每个请求对应一个 AsyncBatchAnnotateFilesRequest。 |
BatchAnnotateImagesRequest
多个图片注释请求会分批次,通过单个服务调用进行处理。
| 字段 | |
|---|---|
requests[] |
此批次的各个图片注释请求。 |
BatchAnnotateImagesResponse
对一个批量图片注释请求的响应。
| 字段 | |
|---|---|
responses[] |
对批处理中图片注释请求的各个响应。 |
BatchOperationMetadata
批处理操作的元数据,例如当前状态。
这会包含在 google::longrunning::Operations 服务的 GetOperation 调用返回的 Operation 的 metadata 字段中。
| 字段 | |
|---|---|
state |
批处理操作的当前状态。 |
submit_time |
向服务器提交批量请求的时间。 |
end_time |
批量请求完成且 |
状态
枚举批量请求可能存在的各种状态。
| 枚举 | |
|---|---|
STATE_UNSPECIFIED |
无效。 |
PROCESSING |
正在处理请求。 |
SUCCESSFUL |
请求已完成,并且至少有一项已成功处理。 |
FAILED |
该请求已完成,未成功处理任何项。 |
CANCELLED |
该请求在用户调用 longrunning.Operations.CancelOperation 后完成。在 cancel 命令之前处理的任何记录都将按照请求中指定的方式输出。 |
区块
页面上的逻辑元素。
| 字段 | |
|---|---|
property |
针对块检测到的其他信息。 |
bounding_box |
块的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:
且顶点顺序仍为 (0, 1, 2, 3)。 |
paragraphs[] |
此区块中的段落列表(如果此块为文本类型)。 |
block_type |
此块中检测到的块类型(文字、图片等)。 |
confidence |
此块上 OCR 结果的置信度。介于 [0, 1] 范围内。 |
BlockType
OCR 所标识的块类型(文字、图片等)。
| 枚举 | |
|---|---|
UNKNOWN |
未知的块类型。 |
TEXT |
普通文本块。 |
TABLE |
表格块。 |
PICTURE |
图片块。 |
RULER |
水平/垂直线框。 |
BARCODE |
条形码块。 |
BoundingPoly
检测到的图片注释的边界多边形。
| 字段 | |
|---|---|
vertices[] |
外接多边形的顶点。 |
normalized_vertices[] |
外接多边形的规范化顶点。 |
ColorInfo
颜色信息,其中包含 RGB 通道、分数以及颜色在图片中所占的比例。
| 字段 | |
|---|---|
color |
颜色的 RGB 分量。 |
score |
此颜色的图片特定分数。 值介于 [0, 1] 范围内。 |
pixel_fraction |
颜色在图片中占据的像素比例。 值介于 [0, 1] 范围内。 |
CreateProductRequest
对 CreateProduct 方法的请求消息。
| 字段 | |
|---|---|
parent |
应在其中创建 Product 的项目。 格式为 |
product |
要创建的商品。 |
product_id |
由用户为此 Product 提供的资源 ID。如果设置,则服务器会尝试将此值用作资源 ID。如果其已被使用,则系统会返回错误,并返回代码 ALREADY_EXISTS。长度不得超过 128 个字符。不能包含 |
CreateProductSetRequest
对 CreateProductSet 方法的请求消息。
| 字段 | |
|---|---|
parent |
应在其中创建 ProductSet 的项目。 格式为 |
product_set |
要创建的 ProductSet。 |
product_set_id |
由用户为此 ProductSet 提供的资源 ID。如果设置,则服务器会尝试将此值用作资源 ID。如果其已被使用,则系统会返回错误,并返回代码 ALREADY_EXISTS。长度不得超过 128 个字符。不能包含 |
CreateReferenceImageRequest
对 CreateReferenceImage 方法的请求消息。
| 字段 | |
|---|---|
parent |
要在其中创建参考图片的商品的资源名称。 格式为 |
reference_image |
要创建的参考图片。如果已指定图片 ID,则予以忽略。 |
reference_image_id |
由用户为要添加的 ReferenceImage 提供的资源 ID。如果设置,则服务器会尝试将此值用作资源 ID。如果其已被使用,则系统会返回错误,并返回代码 ALREADY_EXISTS。长度不得超过 128 个字符。不能包含 |
CropHint
单一剪裁提示,在传送图片时用于生成新的剪裁。
| 字段 | |
|---|---|
bounding_poly |
剪裁区域的边界多边形。边界框的坐标采用原始图片的比例,如 |
confidence |
成为重要区域的置信度。介于 [0, 1] 范围内。 |
importance_fraction |
此重要区域相对于原始图片的重要性比例。 |
CropHintsAnnotation
一组剪裁提示,在传送图片时用于生成新的剪裁。
| 字段 | |
|---|---|
crop_hints[] |
剪裁提示结果。 |
CropHintsParams
剪裁提示注释请求的参数。
| 字段 | |
|---|---|
aspect_ratios[] |
以浮点数表示的宽高比,表示图片宽度与高度的比率。例如,如果所需的宽高比是 4/3,则相应的浮点值应为 1.33333。如果未指定,则返回可能最佳的剪裁区域。提供的宽高比上限为 16,16 之后提供的任何宽高比都将予以忽略。 |
DeleteProductRequest
对 DeleteProduct 方法的请求消息。
| 字段 | |
|---|---|
name |
要删除的商品的资源名称。 格式为: |
DeleteProductSetRequest
对 DeleteProductSet 方法的请求消息。
| 字段 | |
|---|---|
name |
要删除的 ProductSet 的资源名称。 格式为: |
DeleteReferenceImageRequest
对 DeleteReferenceImage 方法的请求消息。
| 字段 | |
|---|---|
name |
要删除的参考图片的资源名称。 格式为:
|
DominantColorsAnnotation
一组主色及其对应的分数。
| 字段 | |
|---|---|
colors[] |
RGB 颜色值及其得分和像素分数。 |
EntityAnnotation
所检测到的实体特征集。
| 字段 | |
|---|---|
mid |
不透明实体 ID。一些 ID 可以在 Google Knowledge Graph Search API 中找到。 |
locale |
表示实体文本 |
description |
实体文本说明,以 |
score |
结果的总分。介于 [0, 1] 范围内。 |
confidence |
已弃用。请改用 |
topicality |
ICA(图片内容注释)标签与图片的相关性。例如,即使每个图片中都存在塔的置信度相同,“tower”与包含检测到的“Eiffel Tower”的图片的相关性也可能比包含检测到的遥远高层建筑图片的相关性更高。介于 [0, 1] 范围内。 |
bounding_poly |
此实体所属的图片区域。不针对 |
locations[] |
检测到的实体的位置信息。有可能存在多个 |
properties[] |
某些实体可能具有用户提供的可选 |
FaceAnnotation
包含人脸检测结果的人脸检测对象。
| 字段 | |
|---|---|
bounding_poly |
脸部周围的边界多边形。边界框的坐标采用原始图片的比例,如 |
fd_bounding_poly |
(人脸检测)前缀。 |
landmarks[] |
检测到的面部地标。 |
roll_angle |
滚动角,表示人脸相对于垂直于脸部的轴的图片垂直面的顺时针/逆时针旋转量。介于 [-180,180] 范围内。 |
pan_angle |
偏转角,表示人脸相对于垂直于该图片的垂直平面向左/向右偏转的角度。介于 [-180,180] 范围内。 |
tilt_angle |
俯仰角,表示人脸相对于图片的水平面向上/向下倾斜的角度。介于 [-180,180] 范围内。 |
detection_confidence |
检测可靠度。 介于 [0, 1] 范围内。 |
landmarking_confidence |
脸部标志可靠度。 介于 [0, 1] 范围内。 |
joy_likelihood |
喜乐可能性。 |
sorrow_likelihood |
悲伤可能性。 |
anger_likelihood |
愤怒可能性。 |
surprise_likelihood |
惊喜可能性。 |
under_exposed_likelihood |
曝光不足的可能性。 |
blurred_likelihood |
模糊可能性。 |
headwear_likelihood |
头饰可能性。 |
地标
脸部特定的标志(例如,脸部特征)。
| 字段 | |
|---|---|
type |
脸部标志类型。 |
position |
脸部标志位置。 |
类型
面部标志(特征)类型。左和右是根据图片观看者所在的位置定义的,而不考虑照片特有的镜像投影。因此,LEFT_EYE 通常是人的右眼。
| 枚举 | |
|---|---|
UNKNOWN_LANDMARK |
检测到的未知脸部标志。 不应填写。 |
LEFT_EYE |
左眼。 |
RIGHT_EYE |
右眼。 |
LEFT_OF_LEFT_EYEBROW |
左眉毛左侧。 |
RIGHT_OF_LEFT_EYEBROW |
左眉毛右侧。 |
LEFT_OF_RIGHT_EYEBROW |
右眉毛左侧。 |
RIGHT_OF_RIGHT_EYEBROW |
右眉毛右侧。 |
MIDPOINT_BETWEEN_EYES |
两只眼睛的中点。 |
NOSE_TIP |
鼻尖。 |
UPPER_LIP |
上唇。 |
LOWER_LIP |
下唇。 |
MOUTH_LEFT |
嘴巴左侧。 |
MOUTH_RIGHT |
嘴巴右侧。 |
MOUTH_CENTER |
嘴巴中心。 |
NOSE_BOTTOM_RIGHT |
鼻子右下角。 |
NOSE_BOTTOM_LEFT |
鼻子,左下角。 |
NOSE_BOTTOM_CENTER |
鼻子,底部中心。 |
LEFT_EYE_TOP_BOUNDARY |
左眼,顶部边界。 |
LEFT_EYE_RIGHT_CORNER |
左眼,右角。 |
LEFT_EYE_BOTTOM_BOUNDARY |
左眼,底部边界。 |
LEFT_EYE_LEFT_CORNER |
左眼,左角。 |
RIGHT_EYE_TOP_BOUNDARY |
右眼,顶部边界。 |
RIGHT_EYE_RIGHT_CORNER |
右眼,右角。 |
RIGHT_EYE_BOTTOM_BOUNDARY |
右眼,底部边界。 |
RIGHT_EYE_LEFT_CORNER |
右眼,左角。 |
LEFT_EYEBROW_UPPER_MIDPOINT |
左眉毛,中部上方。 |
RIGHT_EYEBROW_UPPER_MIDPOINT |
右眉毛,中部上方。 |
LEFT_EAR_TRAGION |
左耳屏点。 |
RIGHT_EAR_TRAGION |
右耳屏点。 |
LEFT_EYE_PUPIL |
左眼瞳孔。 |
RIGHT_EYE_PUPIL |
右眼瞳孔。 |
FOREHEAD_GLABELLA |
前额眉间。 |
CHIN_GNATHION |
下巴颔下点。 |
CHIN_LEFT_GONION |
下巴左下颌点。 |
CHIN_RIGHT_GONION |
下巴右下颌点。 |
功能
要执行的 Google Cloud Vision API 检测的类型,以及针对该检测类型返回的结果数上限。可以在 features 列表中指定多个 Feature 对象。
| 字段 | |
|---|---|
type |
特征类型。 |
max_results |
设置此类型结果的数量上限。不适用于 |
model |
用于该特征的模型。支持的值:“builtin/stable”(如果未设置,则为默认值)和“builtin/latest”。 |
类型
要提取的 Google Cloud Vision API 特征的类型。
| 枚举 | |
|---|---|
TYPE_UNSPECIFIED |
未指定的特征类型。 |
FACE_DETECTION |
运行人脸检测。 |
LANDMARK_DETECTION |
运行标志检测。 |
LOGO_DETECTION |
运行徽标检测。 |
LABEL_DETECTION |
运行标签检测。 |
TEXT_DETECTION |
运行文本检测/光学字符识别 (OCR)。文本检测针对较大的图片中的文本区域进行了优化;如果图片是文档,请改用 DOCUMENT_TEXT_DETECTION。 |
DOCUMENT_TEXT_DETECTION |
运行密集文本文档 OCR。如果同时存在 DOCUMENT_TEXT_DETECTION 和 TEXT_DETECTION,则优先考虑。 |
SAFE_SEARCH_DETECTION |
运行安全搜索可检测可能不安全的内容或不良内容。 |
IMAGE_PROPERTIES |
计算一组图片属性,例如图片的主色。 |
CROP_HINTS |
运行剪裁提示。 |
WEB_DETECTION |
运行 Web 检测。 |
PRODUCT_SEARCH |
运行 Product Search。 |
OBJECT_LOCALIZATION |
针对对象检测运行定位器。 |
GcsDestination
将在其中写入输出内容的 Google Cloud Storage 位置。
| 字段 | |
|---|---|
uri |
用于存储结果的 Google Cloud Storage URI。结果将采用 JSON 格式,且前面带有对应的输入 URI。此字段可以表示单个文件,也可以表示多个输出的前缀。前缀必须以 示例: 如果有多个输出,则每个响应仍为 AnnotateFileResponse,每个响应都包含完整 AnnotateImageResponse 列表的一部分。例如,如果输出 JSON 太大并且溢出到多个分片文件中,则可能会发生多个输出。 |
GcsSource
将从中读取输入的 Google Cloud Storage 位置。
| 字段 | |
|---|---|
uri |
输入文件的 Google Cloud Storage URI。此参数只能是 Google Cloud Storage 对象。目前不支持使用通配符。 |
GetProductRequest
对 GetProduct 方法的请求消息。
| 字段 | |
|---|---|
name |
要获取的 Product 的资源名称。 格式为: |
GetProductSetRequest
对 GetProductSet 方法的请求消息。
| 字段 | |
|---|---|
name |
要获取的 ProductSet 的资源名称。 格式为: |
GetReferenceImageRequest
对 GetReferenceImage 方法的请求消息。
| 字段 | |
|---|---|
name |
要获取的 ReferenceImage 的资源名称。 格式为:
|
图片
用于执行 Google Cloud Vision API 任务的客户端图片。
| 字段 | |
|---|---|
content |
图片内容,由字节流表示。注意:与所有 |
source |
Google Cloud Storage 图片位置或可公开访问的图片网址。如果为图片提供了 |
ImageAnnotationContext
如果图片是通过文件(例如 PDF)生成的,则此消息将提供有关该图片来源的信息。
| 字段 | |
|---|---|
uri |
用于生成图片的文件的 URI。 |
page_number |
如果文件是 PDF 或 TIFF,则此字段给出了用于生成图片的文件中的页码。 |
ImageContext
图片上下文和/或特征专用参数。
| 字段 | |
|---|---|
lat_long_rect |
未使用。 |
language_hints[] |
用于 TEXT_DETECTION 的语言列表。在大多数情况下,使用空值时效果最佳,因为这支持自动检测语言。对于基于拉丁字母的语言,无需设置 |
crop_hints_params |
剪裁提示注释请求的参数。 |
product_search_params |
用于商品搜索的参数。 |
web_detection_params |
用于 Web 检测的参数。 |
ImageProperties
存储图片属性,例如主色。
| 字段 | |
|---|---|
dominant_colors |
如果有,主色已成功完成。 |
ImageSource
外来图片来源(Google Cloud Storage 或网址图片位置)。
| 字段 | |
|---|---|
gcs_image_uri |
请改用 格式为 |
image_uri |
源图片的 URI。这可以是以下任意一项:
如果同时指定了 |
ImportProductSetsGcsSource
一个 csv 文件的 Google Cloud Storage 位置,其中每行保留一个 ImportProductSetRequests 列表。
| 字段 | |
|---|---|
csv_file_uri |
输入 csv 文件的 Google Cloud Storage URI。 URI 必须以 输入 CSV 文件的格式应该是每行一张图片。每行中有 8 列。
您必须提供 如果
如果具有指定
每行最多有一个
如果图片分辨率过大(超过 2000 万像素),导致系统无法处理图片,则系统将调整图片大小。 |
ImportProductSetsInputConfig
ImportProductSets 方法的输入内容。
| 字段 | |
|---|---|
gcs_source |
一个 csv 文件的 Google Cloud Storage 位置,其中每行保留一个 ImportProductSetRequests 列表。 |
ImportProductSetsRequest
对 ImportProductSets 方法的请求消息。
| 字段 | |
|---|---|
parent |
应在其中导入 ProductSet 的项目。 格式为 |
input_config |
请求列表的输入内容。 |
ImportProductSetsResponse
ImportProductSets 方法的响应消息。
此消息由 google.longrunning.Operations.GetOperation 方法在所返回的 google.longrunning.Operation.response 字段中返回。
| 字段 | |
|---|---|
reference_images[] |
成功导入的 reference_images 列表。 |
statuses[] |
每个 ImportProductSet 请求的 rpc 状态,包括成功和错误。 此处的状态数量与 csv 文件中的行数一致,statuses[i] 存储处理 csv 的第 i 行的成功或失败状态(从第 0 行开始)。 |
InputConfig
所需的输入位置和元数据。
| 字段 | |
|---|---|
gcs_source |
要从中读取输入的 Google Cloud Storage 位置。 |
mime_type |
文件的类型。目前仅支持“application/pdf”和“image/tiff”。不支持通配符。 |
LatLongRect
由最小和最大 LatLng 对确定的矩形。
| 字段 | |
|---|---|
min_lat_lng |
最小纬度/经度对。 |
max_lat_lng |
最大纬度/经度对。 |
可能性
可能性的范围表示,旨在让客户在模型升级时获得高度稳定的结果。
| 枚举 | |
|---|---|
UNKNOWN |
未知可能性。 |
VERY_UNLIKELY |
图片属于指定类别的可能性极小。 |
UNLIKELY |
图片属于指定类别的可能性较小。 |
POSSIBLE |
图片可能属于指定类别。 |
LIKELY |
图片属于指定类别的可能性较大。 |
VERY_LIKELY |
图片属于指定类别的可能性很大。 |
ListProductSetsRequest
对 ListProductSets 方法的请求消息。
| 字段 | |
|---|---|
parent |
应列出的 ProductSet 所属的项目。 格式为 |
page_size |
需要返回的最大项数。 默认值为 10,最大值为 100。 |
page_token |
从上一个 List 请求返回的 next_page_token(如果有)。 |
ListProductSetsResponse
ListProductSets 方法的响应消息。
| 字段 | |
|---|---|
product_sets[] |
ProductSet 的列表。 |
next_page_token |
用于检索下一页结果的令牌。如果列表中没有更多结果,则为空。 |
ListProductsInProductSetRequest
对 ListProductsInProductSet 方法的请求消息。
| 字段 | |
|---|---|
name |
要为其检索商品的 ProductSet 资源。 格式为: |
page_size |
需要返回的最大项数。 默认值为 10,最大值为 100。 |
page_token |
从上一个 List 请求返回的 next_page_token(如果有)。 |
ListProductsInProductSetResponse
ListProductsInProductSet 方法的响应消息。
| 字段 | |
|---|---|
products[] |
Product 列表。 |
next_page_token |
用于检索下一页结果的令牌。如果列表中没有更多结果,则为空。 |
ListProductsRequest
对 ListProducts 方法的请求消息。
| 字段 | |
|---|---|
parent |
应列出其 Product 的项目或 ProductSet。 格式: |
page_size |
需要返回的最大项数。 默认值为 10,最大值为 100。 |
page_token |
从上一个 List 请求返回的 next_page_token(如果有)。 |
ListProductsResponse
ListProducts 方法的响应消息。
| 字段 | |
|---|---|
products[] |
商品列表。 |
next_page_token |
用于检索下一页结果的令牌。如果列表中没有更多结果,则为空。 |
ListReferenceImagesRequest
对 ListReferenceImages 方法的请求消息。
| 字段 | |
|---|---|
parent |
包含参考图片的商品的资源名称。 格式为 |
page_size |
需要返回的最大项数。 默认值为 10,最大值为 100。 |
page_token |
标识要返回的结果页面的令牌。 这是在之前某个的参考图片列出请求中返回的 如果未指定,则默认为第 1 页。 |
ListReferenceImagesResponse
ListReferenceImages 方法的响应消息。
| 字段 | |
|---|---|
reference_images[] |
参考图片列表。 |
page_size |
需要返回的最大项数。 默认值为 10,最大值为 100。 |
next_page_token |
从上一个 List 请求返回的 next_page_token(如果有)。 |
LocalizedObjectAnnotation
在边界框内检测到的一组对象。
| 字段 | |
|---|---|
mid |
应与 EntityAnnotation mid 保持一致的对象 ID。 |
language_code |
BCP-47 语言代码,例如“en-US”或“sr-Latn”。如需了解详情,请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。 |
name |
对象名称,以 |
score |
结果的分数。介于 [0, 1] 范围内。 |
bounding_poly |
此对象所属的图片区域。必须填充此字段。 |
LocationInfo
检测到的实体位置信息。
| 字段 | |
|---|---|
lat_lng |
纬度/经度位置坐标。 |
NormalizedVertex
顶点表示图片中的 2D 点。注意:标准化顶点坐标相对于原始图片,范围介于 0 和 1 之间。
| 字段 | |
|---|---|
x |
x 坐标。 |
y |
y 坐标。 |
OperationMetadata
包含 BatchAnnotateImages 操作的元数据。
| 字段 | |
|---|---|
state |
批处理操作的当前状态。 |
create_time |
收到批处理请求的时间。 |
update_time |
上次更新操作结果的时间。 |
状态
批量操作的状态。
| 枚举 | |
|---|---|
STATE_UNSPECIFIED |
无效。 |
CREATED |
已收到请求。 |
RUNNING |
正在处理请求。 |
DONE |
批处理已完成。 |
CANCELLED |
批处理已取消。 |
OutputConfig
所需的输出位置和元数据。
| 字段 | |
|---|---|
gcs_destination |
要将输出内容写入的 Google Cloud Storage 位置。 |
batch_size |
可向 Google Cloud Storage 中存储的每个输出 JSON 文件添加的响应 proto 的最大数量。有效范围为 [1, 100]。如果未指定,默认值为 20。 例如,对于一个包含 100 页的 PDF 文件,将生成 100 个响应 proto。如果 目前,batch_size 仅适用于 GcsDestination,将来可能会支持其他输出配置。 |
页面
通过 OCR 检测到的页面。
| 字段 | |
|---|---|
property |
在页面上检测到的其他信息。 |
width |
页面宽度。对于 PDF,其单位是点。对于图片(包括 TIFF),其单位是像素。 |
height |
页面高度。对于 PDF,其单位是点。对于图片(包括 TIFF),其单位是像素。 |
blocks[] |
此页面上的文本块、图片等列表。 |
confidence |
页面上 OCR 结果的置信度。介于 [0, 1] 范围内。 |
段落
按一定顺序展示多个字词的结构化文本单元。
| 字段 | |
|---|---|
property |
为段落检测到的其他信息。 |
bounding_box |
段落的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:* 文字在水平方向时可能如下所示: 0----1 | | 3----2 * 围绕左上角旋转 180 度时,就会变为: 2----3 | | 1----0 且顶点顺序仍为 (0, 1, 2, 3)。 |
words[] |
此段落中的字词列表。 |
confidence |
段落的 OCR 结果置信度。介于 [0, 1] 范围内。 |
位置
图片中的一个 3D 位置,主要用于人脸检测标志。一个有效的 Position 必须同时具有 x 坐标和 y 坐标。位置的坐标与原始图片采用相同的刻度。
| 字段 | |
|---|---|
x |
x 坐标。 |
y |
y 坐标。 |
z |
z 坐标(或深度)。 |
产品
Product 包含 ReferenceImages。
| 字段 | |
|---|---|
name |
商品的资源名称。 格式为: 创建 Product 时,此字段会予以忽略。 |
display_name |
此 Product 的用户提供名称。不得为空。长度不得超过 4096 个字符。 |
description |
与此商品一起存储的用户提供元数据。长度不得超过 4096 个字符。 |
product_category |
由参考图片标识的商品类别。此值应为“homegoods”、“apparel”或“toys”。 该字段不可更改。 |
product_labels[] |
可以附加到一个商品的的键值对。查询时,可以根据 product_label 指定限制条件。 请注意,整数值可以使用字符串的形式提供,例如“1199”。只有带有整数值的字符串可以匹配基于范围的限制(将在不久之后推出对这种限制的支持)。 对于同一个键,可以分配多个值。一件商品最多可包含 100 个 product_label。 |
KeyValue
以键值对表示的商品标签。
| 字段 | |
|---|---|
key |
附加到商品的标签键。不能为空,也不能超过 128 个字节。 |
value |
附加到商品的标签值。不能为空,也不能超过 128 个字节。 |
ProductSearchParams
商品搜索请求的参数。
| 字段 | |
|---|---|
bounding_poly |
图片中感兴趣的区域的边界多边形。可选。如果未指定,则应用系统自行决定的设置。 |
product_set |
要搜索类似图片的一项 格式为: |
product_categories[] |
要在其中执行搜索的商品类别列表。目前我们只考虑第一个类别,应指定“homegoods”、“apparel”或“toys”。 |
filter |
过滤表达式。这可用于根据商品标签限制搜索结果。目前,我们支持对键值对表达式的多个“逻辑或”运算再执行“逻辑与”运算,前提是“逻辑或”运算中涉及到的每个表达式都必须具有相同的键。 例如,可以使用“(color = red OR color = blue) AND brand = Google”,但请勿使用“(color = red OR brand = Google)”或“color: red”。 |
ProductSearchResults
商品搜索请求的结果。
| 字段 | |
|---|---|
index_time |
提供这些结果的索引的时间戳。在此时间之后所做的更改不会反映在当前结果中。 |
results[] |
结果列表,每个结果对应每个商品匹配项。 |
product_grouped_results[] |
在查询图片中检测到的依商品分组的结果列表。每个条目均对应于查询图片中的一个边界多边形,并包含特定于该区域的匹配商品。在每种商品的所有结果联合中,可能存在重复的商品匹配项。 |
GroupedResult
与查询图片中的单件商品类似的商品相关信息。
| 字段 | |
|---|---|
bounding_poly |
在查询图片中检测到的商品的边界多边形。 |
results[] |
结果列表,每个结果对应每个商品匹配项。 |
结果
商品相关信息。
| 字段 | |
|---|---|
product |
商品。 |
score |
匹配项的置信度,范围从 0(零置信度)到 1(最高置信度)。 |
image |
与查询最匹配的商品中的图片的资源名称。 |
ProductSet
一个 ProductSet 包含多个 Product。一个 ProductSet 最多可包含 100 万张参考图片。如果超出该限制,则定期索引编制操作将会失败。
| 字段 | |
|---|---|
name |
ProductSet 的资源名称。 格式为: 创建 ProductSet 时,此字段会予以忽略。 |
display_name |
此 ProductSet 的用户提供名称。不得为空。长度不得超过 4096 个字符。 |
index_time |
仅限输出。此 ProductSet 上次编入索引的时间。查询结果将反映此时间之前的所有更新。如果此 ProductSet 从未被编入索引,则此时间戳为默认值“1970-01-01T00:00:00Z”。 创建 ProductSet 时,此字段会予以忽略。 |
index_error |
仅限输出。如果将商品集编入索引时出错,则系统会填充此字段。 创建 ProductSet 时,此字段会予以忽略。 |
属性
一个 Property 包含由用户提供的一个名称/值对。
| 字段 | |
|---|---|
name |
属性的名称。 |
value |
属性的值。 |
uint64_value |
数值属性的值。 |
ReferenceImage
ReferenceImage 表示商品图片及其关联的元数据,例如边界框。
| 字段 | |
|---|---|
name |
参考图片的资源名称。 格式为:
创建参考图片时,系统会忽略此字段。 |
uri |
参考图片的 Google Cloud Storage URI。 URI 必须以 必填。 |
bounding_polys[] |
参考图片内感兴趣的区域周围的边界多边形。可选。如果此字段为空,系统将尝试检测感兴趣的区域。最多可使用 10 个边界多边形。 所提供的形状将转换为非旋转式矩形。转换完毕后,矩形的短边必须大于或等于 300 像素。宽高比不得超过 1:4(即 1:3 可接受,1:5 则不可接受)。 |
RemoveProductFromProductSetRequest
对 RemoveProductFromProductSet 方法的请求消息。
| 字段 | |
|---|---|
name |
要修改的 ProductSet 的资源名称。 格式为: |
product |
要从此 ProductSet 中移除的 Product 的资源名称。 格式为: |
SafeSearchAnnotation
计算机视觉方法基于安全搜索类别(例如成人、欺骗、医疗、暴力)计算出的与图片有关的一组特征。
| 字段 | |
|---|---|
adult |
表示图片包含成人内容的概率。成人内容可能包含裸露、色情图片或漫画或性活动等元素。 |
spoof |
包含欺骗性内容的概率。对图片的标准版本进行修改以使其变得有趣或令人反感的概率。 |
medical |
此图片为医学影像的概率。 |
violence |
此图片包含暴力内容的概率。 |
racy |
请求的图片包含少儿不宜内容的概率。少儿不宜内容可能包括(但不限于)单薄或透明的服装、用策略手段遮住的裸体、猥亵或挑逗姿势,或者敏感身体部位的特写镜头。 |
符号
单个符号表示。
| 字段 | |
|---|---|
property |
为符号检测到的其他信息。 |
bounding_box |
符号的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:* 文字在水平方向时可能如下所示: 0----1 | | 3----2 * 围绕左上角旋转 180 度时,就会变为: 2----3 | | 1----0 且顶点顺序仍为 (0, 1, 2, 3)。 |
text |
获取符号的实际 UTF-8 表示形式。 |
confidence |
符号的 OCR 结果置信度。介于 [0, 1] 范围内。 |
TextAnnotation
TextAnnotation 包含 OCR 提取的文本的结构化表示。OCR 提取的文本结构的层次结构如下:TextAnnotation -> 页面 -> 块 -> 段落 -> 字词 -> 符号。从“页面”开始,各结构组件均可进一步拥有其自己的属性。属性描述了所检测到的语言、中断符等。如需了解详情,请参阅下面的 TextAnnotation.TextProperty 消息定义。
| 字段 | |
|---|---|
pages[] |
OCR 检测到的页面列表。 |
text |
页面上检测到 UTF-8 文本。 |
DetectedBreak
检测到的结构化组件的开头或结尾。
| 字段 | |
|---|---|
type |
检测到的换行符类型。 |
is_prefix |
如果换行符附加在元素前面,则为 true。 |
BreakType
指示所发现的中断符类型的枚举。包括换行符、空格等。
| 枚举 | |
|---|---|
UNKNOWN |
未知的换行符标签类型。 |
SPACE |
普通空格。 |
SURE_SPACE |
确定空间(非常宽)。 |
EOL_SURE_SPACE |
换行符。 |
HYPHEN |
文本中不存在的结束连字符;无法与 SPACE、LEADER_SPACE 或 LINE_BREAK 共存。 |
LINE_BREAK |
用于终止段落的中断符。 |
DetectedLanguage
检测到的结构化组件的语言。
| 字段 | |
|---|---|
language_code |
BCP-47 语言代码,例如“en-US”或“sr-Latn”。如需了解详情,请参阅 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier。 |
confidence |
所检测到的语言的置信度。介于 [0, 1] 范围内。 |
TextProperty
在此结构化组件上检测到的其他信息。
| 字段 | |
|---|---|
detected_languages[] |
检测到的语言及对应置信度的列表。 |
detected_break |
检测到的一个文本句段的开头或结尾。 |
UpdateProductRequest
对 UpdateProduct 方法的请求消息。
| 字段 | |
|---|---|
product |
Product 资源,用于替换服务器上的资源。product.name 不可变。 |
update_mask |
用于指定要更新的字段的 |
UpdateProductSetRequest
对 UpdateProductSet 方法的请求消息。
| 字段 | |
|---|---|
product_set |
ProductSet 资源,用于替换服务器上的资源。 |
update_mask |
用于指定要更新的字段的 |
Vertex
顶点表示图片中的 2D 点。注意:顶点坐标与原始图片的比例相同。
| 字段 | |
|---|---|
x |
x 坐标。 |
y |
y 坐标。 |
WebDetection
互联网图片的相关信息。
| 字段 | |
|---|---|
web_entities[] |
从相似的互联网图片中推导出的实体。 |
full_matching_images[] |
与互联网完全匹配的图片。可包括查询图片的调整大小后的副本。 |
partial_matching_images[] |
与互联网局部匹配的图片。这些图片的相似度足够高,有一些与查询图片相同的关键特征。例如,原始图片与剪裁图片可能会部分匹配。 |
pages_with_matching_images[] |
包含匹配的互联网图片的网页。 |
visually_similar_images[] |
外观类似的图片结果。 |
best_guess_labels[] |
该服务关于请求图片主题的最佳猜测。根据开放式 Web 上的类似图片推断得出。 |
WebEntity
从相似的互联网图片中推导出的实体。
| 字段 | |
|---|---|
entity_id |
不透明实体 ID。 |
score |
实体的总体相关度得分。不同图片查询之间的分数并非归一化分数,也不具有可比性。 |
description |
实体的标准说明(采用英文)。 |
WebImage
在线图片的元数据。
| 字段 | |
|---|---|
url |
结果图片网址。 |
score |
(已弃用)图片的整体相关性分数。 |
WebLabel
为网络检测提供额外元数据的标签。
| 字段 | |
|---|---|
label |
用于附加元数据的标签。 |
language_code |
|
WebPage
网页的元数据。
| 字段 | |
|---|---|
url |
结果网页的网址。 |
score |
(已弃用)网页的整体相关性得分。 |
page_title |
网页的标题,可能包含 HTML 标记。 |
full_matching_images[] |
与网页上的图片完全匹配。可包括查询图片的调整大小后的副本。 |
partial_matching_images[] |
与网页上的图片部分匹配。这些图片的相似度足够高,有一些与查询图片相同的关键特征。例如,原始图片与剪裁图片可能会部分匹配。 |
WebDetectionParams
Web 检测请求的参数。
| 字段 | |
|---|---|
include_geo_results |
是否包含来自图片的地理信息的结果。 |
Word
字词表示。
| 字段 | |
|---|---|
property |
为字词检测到的其他信息。 |
bounding_box |
字词的边界框。顶点的顺序是左上角、右上角、右下角和左下角。检测到边界框发生旋转时,旋转的表示方式就是沿着左上角旋转,就像以“自然”的方向阅读文字时那样。例如:* 文字在水平方向时可能如下所示: 0----1 | | 3----2 * 围绕左上角旋转 180 度时,就会变为: 2----3 | | 1----0 且顶点顺序仍为 (0, 1, 2, 3)。 |
symbols[] |
列出字词中的符号。符号的顺序与自然阅读顺序相同。 |
confidence |
字词的 OCR 结果置信度。介于 [0, 1] 范围内。 |