Índice
ImageAnnotator(interfaz)ProductSearch(interfaz)AddProductToProductSetRequest(mensaje)AnnotateFileRequest(mensaje)AnnotateFileResponse(mensaje)AnnotateImageRequest(mensaje)AnnotateImageResponse(mensaje)AsyncAnnotateFileRequest(mensaje)AsyncAnnotateFileResponse(mensaje)AsyncBatchAnnotateFilesRequest(mensaje)AsyncBatchAnnotateFilesResponse(mensaje)AsyncBatchAnnotateImagesRequest(mensaje)AsyncBatchAnnotateImagesResponse(mensaje)BatchAnnotateFilesRequest(mensaje)BatchAnnotateFilesResponse(mensaje)BatchAnnotateImagesRequest(mensaje)BatchAnnotateImagesResponse(mensaje)BatchOperationMetadata(mensaje)BatchOperationMetadata.State(enum)Block(mensaje)Block.BlockType(enum)BoundingPoly(mensaje)ColorInfo(mensaje)CreateProductRequest(mensaje)CreateProductSetRequest(mensaje)CreateReferenceImageRequest(mensaje)CropHint(mensaje)CropHintsAnnotation(mensaje)CropHintsParams(mensaje)CustomEntityAnnotation(mensaje)DeleteProductRequest(mensaje)DeleteProductSetRequest(mensaje)DeleteReferenceImageRequest(mensaje)DocumentParsingParams(mensaje)DominantColorsAnnotation(mensaje)EntityAnnotation(mensaje)FaceAnnotation(mensaje)FaceAnnotation.Landmark(mensaje)FaceAnnotation.Landmark.Type(enum)Feature(mensaje)Feature.Type(enum)GcsDestination(mensaje)GcsSource(mensaje)GetProductRequest(mensaje)GetProductSetRequest(mensaje)GetReferenceImageRequest(mensaje)Image(mensaje)ImageAnnotationContext(mensaje)ImageContext(mensaje)ImageProperties(mensaje)ImageQuality(mensaje)ImageSource(mensaje)ImportProductSetsGcsSource(mensaje)ImportProductSetsInputConfig(mensaje)ImportProductSetsRequest(mensaje)ImportProductSetsResponse(mensaje)InputConfig(mensaje)KeyValuePair(mensaje)LatLongRect(mensaje)Likelihood(enum)ListProductSetsRequest(mensaje)ListProductSetsResponse(mensaje)ListProductsInProductSetRequest(mensaje)ListProductsInProductSetResponse(mensaje)ListProductsRequest(mensaje)ListProductsResponse(mensaje)ListReferenceImagesRequest(mensaje)ListReferenceImagesResponse(mensaje)LocalizedBarcodeAnnotation(mensaje)LocalizedObjectAnnotation(mensaje)LocationInfo(mensaje)NormalizedVertex(mensaje)OperationMetadata(mensaje)OperationMetadata.State(enum)OutputConfig(mensaje)Page(mensaje)Paragraph(mensaje)Position(mensaje)Product(mensaje)Product.KeyValue(mensaje)ProductSearchParams(mensaje)ProductSearchResults(mensaje)ProductSearchResults.GroupedResult(mensaje)ProductSearchResults.ObjectAnnotation(mensaje)ProductSearchResults.Result(mensaje)ProductSet(mensaje)Property(mensaje)QualityOptimizationParams(mensaje)QualityOptimizationParams.CompressionConfig(mensaje)QualityOptimizationParams.EnhancementConfig(mensaje)QualityOptimizationParams.QualityScoreConfig(mensaje)QualityOptimizationParams.Type(enum)QualityOptimizationResult(mensaje)ReferenceImage(mensaje)RemoveProductFromProductSetRequest(mensaje)SafeSearchAnnotation(mensaje)Symbol(mensaje)Table(mensaje)Table.TableCell(mensaje)Table.TableRow(mensaje)TableBoundHint(mensaje)TableDetectionOptions(mensaje)TextAnnotation(mensaje)TextAnnotation.DetectedBreak(mensaje)TextAnnotation.DetectedBreak.BreakType(enum)TextAnnotation.DetectedLanguage(mensaje)TextAnnotation.TextProperty(mensaje)TextDetectionParams(mensaje)UpdateProductRequest(mensaje)UpdateProductSetRequest(mensaje)Vertex(mensaje)WebDetection(mensaje)WebDetection.WebEntity(mensaje)WebDetection.WebImage(mensaje)WebDetection.WebLabel(mensaje)WebDetection.WebPage(mensaje)WebDetectionParams(mensaje)Word(mensaje)
ImageAnnotator
Servicio que realiza tareas de detección de la API de Google Cloud Vision a través de imágenes de clientes, como detección de rostros, puntos de referencia, logotipos, etiquetas y texto. El servicio ImageAnnotator muestra entidades detectadas a partir de las imágenes.
| AsyncBatchAnnotateFiles | |
|---|---|
|
Ejecuta la detección y anotación asíncrona de imágenes para obtener una lista de archivos genéricos, como archivos PDF, que pueden contener varias páginas y varias imágenes por página. El progreso y los resultados se pueden recuperar mediante la interfaz
|
|
| AsyncBatchAnnotateImages | |
|---|---|
|
Ejecuta la detección y anotación de imágenes asíncronas para una lista de imágenes. El progreso y los resultados se pueden recuperar mediante la interfaz Este servicio escribirá resultados de anotaciones de imágenes en archivos JSON en el bucket de Google Cloud Storage del cliente. Cada archivo json contiene el proto BatchAnnotateImagesResponse.
|
|
| BatchAnnotateFiles | |
|---|---|
|
Servicio que realiza la detección y anotación de imágenes para un lote de archivos. Ahora solo se admiten "application/pdf", "image/tiff". Este servicio extraerá como máximo los primeros 10 marcos (gif) o páginas (pdf o tiff) de cada archivo proporcionado y realizará la detección y anotación para cada imagen extraída.
|
|
| BatchAnnotateImages | |
|---|---|
|
Ejecuta la detección y anotación de imágenes para un lote de imágenes.
|
|
ProductSearch
Administra Products y ProductSets de imágenes de referencia para usar en la búsqueda de productos. Usa el siguiente modelo de recursos:
- La API tiene una colección de recursos
ProductSet, llamadaprojects/*/locations/*/productSets/*, que actúa como una forma de agrupar productos diferentes en grupos para limitar la identificación.
Al mismo tiempo,
La API tiene una colección de recursos
Product, llamadaprojects/*/locations/*/products/*.Cada
Producttiene una colección de recursosReferenceImage, llamadaprojects/*/locations/*/products/*/referenceImages/*
| AddProductToProductSet | |
|---|---|
|
Agrega un Product al ProductSet especificado. Si el Product ya está presente, no se realizará ningún cambio. Se puede agregar un Producto a 100 ProductSets como máximo. A continuación, se indican los posibles errores:
|
|
| CreateProduct | |
|---|---|
|
Crea y muestra un recurso de producto nuevo. A continuación, se indican los posibles errores:
|
|
| CreateProductSet | |
|---|---|
|
Crea y muestra un recurso ProductSet nuevo. A continuación, se indican los posibles errores:
|
|
| CreateReferenceImage | |
|---|---|
|
Crea y muestra un recurso ReferenceImage nuevo. El campo Tenga en cuenta que la canalización cambiará el tamaño de la imagen si la resolución de la imagen es demasiado grande para procesarse (más de 50 MP). A continuación, se indican los posibles errores:
|
|
| DeleteProduct | |
|---|---|
|
Borra de manera permanente un producto y sus imágenes de referencia. Se borrarán inmediatamente los metadatos del producto y todas sus imágenes, pero las búsquedas en los ProductSets que contengan el producto aún funcionarán hasta que se actualicen todas las memorias caché relacionadas. A continuación, se indican los posibles errores:
|
|
| DeleteProductSet | |
|---|---|
|
Borra de manera permanente un ProductSet Los Products y los ReferenceImages del ProductSet no se borran. Los archivos de imagen reales no se borran de Google Cloud Storage. A continuación, se indican los posibles errores:
|
|
| DeleteReferenceImage | |
|---|---|
|
Borra de forma permanente una imagen de referencia Los metadatos de la imagen se borrarán de inmediato, pero las búsquedas en los ProductSets que contengan la imagen podrían funcionar hasta que se actualicen todas las cachés relacionadas. Los archivos de imagen reales no se borran de Google Cloud Storage. A continuación, se indican los posibles errores:
|
|
| GetProduct | |
|---|---|
|
Obtiene información asociada con un Product. A continuación, se indican los posibles errores:
|
|
| GetProductSet | |
|---|---|
|
Obtiene información asociada con un ProductSet. A continuación, se indican los posibles errores:
|
|
| GetReferenceImage | |
|---|---|
|
Obtiene información asociada a ReferenceImage. A continuación, se indican los posibles errores:
|
|
| ImportProductSets | |
|---|---|
|
API asíncrona que importa una lista de imágenes de referencia a conjuntos de productos específicos según una lista de información de las imágenes. La API La fuente de entrada de este método es un archivo CSV en Google Cloud Storage. Para obtener más información sobre el formato de archivo CSV, consulta
|
|
| ListProductSets | |
|---|---|
|
Muestra los ProductSets en un orden no especificado. A continuación, se indican los posibles errores:
|
|
| ListProducts | |
|---|---|
|
Muestra una lista de productos en un orden no especificado. A continuación, se indican los posibles errores:
|
|
| ListProductsInProductSet | |
|---|---|
|
Enumera los Products en un ProductSet, en un orden no especificado. Si el ProductSet no existe, el campo de productos de la respuesta estará vacío. A continuación, se indican los posibles errores:
|
|
| ListReferenceImages | |
|---|---|
|
Enumera imágenes de referencia. A continuación, se indican los posibles errores:
|
|
| RemoveProductFromProductSet | |
|---|---|
|
Quita un Product del ProductSet especificado. A continuación, se indican los posibles errores:
|
|
| UpdateProduct | |
|---|---|
|
Realiza cambios en un recurso del Product. Solo los campos Si se actualizan las etiquetas, el cambio no se reflejará en las consultas hasta la próxima indexación. A continuación, se indican los posibles errores:
|
|
| UpdateProductSet | |
|---|---|
|
Realiza cambios en un recurso ProductSet. Solo se puede actualizar display_name actualmente. A continuación, se indican los posibles errores:
|
|
AddProductToProductSetRequest
Mensaje de la solicitud para el método AddProductToProductSet.
| Campos | |
|---|---|
name |
Es el nombre del recurso que se debe modificar para el ProductSet. Formato: |
product |
Es el nombre del Product que se agregará al ProductSet. Formato: |
AnnotateFileRequest
Una solicitud para anotar un solo archivo (p. ej., un archivo PDF, TIFF o GIF).
| Campos | |
|---|---|
input_config |
Obligatorio. Información sobre el archivo de entrada. |
features[] |
Obligatorio. Funciones solicitadas. |
image_context |
Contexto adicional, que puede acompañar a las imágenes en el archivo. |
pages[] |
Páginas del archivo en las que se realizarán las anotaciones de imagen. Las páginas comienzan desde 1, supongamos que la primera página del archivo es la página 1. Se admiten como máximo 5 páginas por solicitud. Las páginas pueden ser negativas. La página 1 significa la primera página. La página 2 significa la segunda página. Page -1 significa la última página. Page -2 significa la segunda página. Si el archivo es GIF en lugar de PDF o TIFF, la página hace referencia a los marcos del GIF. Si este campo está vacío, de forma predeterminada, el servicio realiza anotaciones de imagen para las primeras 5 páginas del archivo. |
AnnotateFileResponse
Respuesta a una solicitud de anotación de archivo único. Un archivo puede contener una o más imágenes, que tienen sus propias respuestas individuales.
| Campos | |
|---|---|
input_config |
Información sobre el archivo para el que se genera esta respuesta. |
responses[] |
Respuestas individuales a las imágenes que se encuentran en el archivo. |
AnnotateImageRequest
Solicitud para realizar tareas de la API de Google Cloud Vision con una imagen proporcionada por el usuario, con funciones solicitadas por el usuario y con información del contexto.
| Campos | |
|---|---|
image |
La imagen que se procesará. |
features[] |
Funciones solicitadas. |
image_context |
Contexto adicional, que puede acompañar a la imagen. |
custom_label_detection_models[] |
Cuando se realiza una solicitud con un valor |
AnnotateImageResponse
Respuesta a una solicitud de anotación de imagen.
| Campos | |
|---|---|
face_annotations[] |
Si está presente, la detección de rostro se completó correctamente. |
landmark_annotations[] |
Si está presente, la detección de punto de referencia se completó correctamente. |
logo_annotations[] |
Si está presente, la detección de logotipo se completó correctamente. |
label_annotations[] |
Si está presente, la detección de etiquetas se completó correctamente. |
localized_object_annotations[] |
Si está presente, la detección de objetos localizados se completó correctamente. Esto se ordenará de forma descendente por puntuación de confianza. |
custom_label_annotations[] |
Si está presente, la anotación personalizada se completó correctamente. |
text_annotations[] |
Si está presente, la detección de texto (OCR) se completó correctamente. |
full_text_annotation |
Si está presente, la detección de texto (OCR) o la detección de texto (OCR) se completó correctamente. Esta anotación proporciona la jerarquía estructural del texto detectado de OCR. |
safe_search_annotation |
Si está presente, la anotación de búsqueda segura se completó correctamente. |
image_properties_annotation |
Si está presente, se extrajeron las propiedades de imagen correctamente. |
crop_hints_annotation |
Si está presente, las sugerencias de recorte se completaron correctamente. |
web_detection |
Si está presente, la detección de web se completó correctamente. |
product_search_results |
Si está presente, la búsqueda de productos se completó correctamente. |
error |
Si se configura, representa el mensaje de error de la operación. Ten en cuenta que se garantiza que las anotaciones de imagen completadas sean correctas, incluso cuando se establece |
context |
Si está presente, se necesita información contextual para comprender de dónde proviene esta imagen. |
image_quality_annotation |
Si está presente, el cálculo de la calidad de la imagen se completó correctamente. |
object_attribute_annotations[] |
Si está presente, el cálculo de los atributos de objetos se completó correctamente. El valor de los atributos se completará en EntityAnnotation.properties. Ejemplo: object_attribute_annotations { properties { name: "color" value: "blue" confidence: 0.1 } properties { name: "color" value: "white" confidence: 0.2 } properties { name: "material" value: "silk" confidence: 0.3 } } |
quality_optimization_result |
Si está presente, la optimización de la calidad de la imagen se completó correctamente. |
localized_barcode_annotations[] |
Si está presente, la detección de códigos de barras localizada se completó correctamente. |
AsyncAnnotateFileRequest
Una solicitud de anotación de archivos sin conexión.
| Campos | |
|---|---|
input_config |
Obligatorio. Información sobre el archivo de entrada. |
features[] |
Obligatorio. Funciones solicitadas. |
image_context |
Contexto adicional, que puede acompañar a las imágenes en el archivo. |
output_config |
Obligatorio. La ubicación de salida y los metadatos deseados (p. ej., el formato). |
AsyncAnnotateFileResponse
La respuesta para una única solicitud de anotación de archivos sin conexión.
| Campos | |
|---|---|
output_config |
La ubicación de salida y los metadatos de AsyncAnnotateFileRequest. |
AsyncBatchAnnotateFilesRequest
Las distintas solicitudes de anotación de archivos asíncronos se agrupan en una sola llamada de servicio.
| Campos | |
|---|---|
requests[] |
Solicitudes de anotaciones de archivos asíncronos individuales para este lote. |
AsyncBatchAnnotateFilesResponse
Respuesta a una solicitud de anotación de archivos por lotes asíncrona.
| Campos | |
|---|---|
responses[] |
La lista de respuestas de anotación de archivos, una para cada solicitud en AsyncBatchAnnotateFilesRequest. |
AsyncBatchAnnotateImagesRequest
Solicitud de anotación de imagen asíncrona para una lista de imágenes.
| Campos | |
|---|---|
requests[] |
Solicitudes de anotación de imágenes individuales para este lote. |
output_config |
Obligatorio. La ubicación de salida y los metadatos deseados (p. ej., el formato). |
AsyncBatchAnnotateImagesResponse
Respuesta a una solicitud de anotación de imágenes por lotes asíncrona.
| Campos | |
|---|---|
output_config |
La ubicación de salida y los metadatos de AsyncBatchAnnotateImagesRequest. |
BatchAnnotateFilesRequest
Una lista de solicitudes para anotar archivos mediante la API de BatchAnnotateFiles.
| Campos | |
|---|---|
requests[] |
La lista de solicitudes de anotación de archivos. En este momento, solo se admite una AnnotateFileRequest en BatchAnnotateFilesRequest. |
BatchAnnotateFilesResponse
Una lista de respuestas de anotación de archivos.
| Campos | |
|---|---|
responses[] |
La lista de respuestas de anotación de archivos, cada respuesta corresponde a cada AnnotateFileRequest en BatchAnnotateFilesRequest. |
BatchAnnotateImagesRequest
Las solicitudes de anotaciones de imágenes se agrupan en una sola llamada de servicio.
| Campos | |
|---|---|
requests[] |
Solicitudes de anotación de imágenes individuales para este lote. |
BatchAnnotateImagesResponse
Respuesta a una solicitud de anotación de imágenes por lotes.
| Campos | |
|---|---|
responses[] |
Respuestas individuales a las solicitudes de anotación de imágenes dentro del lote. |
BatchOperationMetadata
Metadatos de las operaciones por lotes, como el estado actual.
Esto se incluye en el campo metadata de la Operation que muestra la llamada GetOperation del servicio google::longrunning::Operations.
| Campos | |
|---|---|
state |
El estado actual de la operación por lotes. |
submit_time |
La hora a la que se envió la solicitud por lotes al servidor. |
end_time |
La hora a la que finaliza la solicitud por lotes y |
Estado
Enumera los estados posibles en los que se puede encontrar la solicitud por lotes.
| Enums | |
|---|---|
STATE_UNSPECIFIED |
No válido. |
PROCESSING |
La solicitud se está procesando de forma activa. |
SUCCESSFUL |
La solicitud está lista y al menos un elemento se procesó de manera correcta. |
FAILED |
La solicitud se completó y no se procesó ningún elemento. |
CANCELLED |
La solicitud se completó después de que el usuario llamó a longrunning.Operations.CancelOperation. Cualquier registro que se procesó antes del comando de cancelación se muestra como se especifica en la solicitud. |
Bloquear
Elemento lógico en la página.
| Campos | |
|---|---|
property |
Se detectó información adicional para el bloque. |
bounding_box |
El cuadro de límite del bloque. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo:
y el orden de vértices se mantendrá como (0, 1, 2, 3). |
paragraphs[] |
Lista de párrafos en este bloque (si este bloque es de tipo de texto). |
block_type |
Se detectó un tipo de bloque (texto, imagen, etc.) para este bloque. |
confidence |
La confianza de los resultados de OCR en el bloque. Rango [0, 1]. |
table |
Tabla detectada para block_type TABLE. Este campo no se muestra de forma predeterminada, a menos que esté habilitado a través de TextDetectionParams.table_detection_options. El |
key_value_pair |
Se detectó un par para el block_type KEY_VALUE_PAIR. Este campo no se muestra de forma predeterminada, a menos que se especifique DocumentType. |
merged_text |
Todo el texto UTF-8 detectado en este bloque. Este campo no se muestra de forma predeterminada, a menos que se especifique en TextDetectionParams.block_filter. |
BlockType
Tipo de bloque (texto, imagen, etc.) que identifica el OCR.
| Enums | |
|---|---|
UNKNOWN |
Tipo de bloqueo desconocido. |
TEXT |
Bloque de texto común. |
TABLE |
Bloque de tabla. |
PICTURE |
Bloque de imagen. |
RULER |
Cuadro de línea horizontal/vertical. |
BARCODE |
Bloque de código de barras. |
KEY_VALUE_PAIR |
Un bloque de par clave-valor. |
BoundingPoly
Un polígono de límite para la anotación de imagen detectada.
| Campos | |
|---|---|
vertices[] |
Vértices del polígono de límite. |
normalized_vertices[] |
Vértices normalizados del polígono de límite. |
ColorInfo
La información de color está compuesta por los canales RGB, la puntuación y la fracción de la imagen que el color ocupa en la imagen.
| Campos | |
|---|---|
color |
Componentes RGB del color. |
score |
Puntuación específica de la imagen para este color. Valor en el rango [0, 1]. |
pixel_fraction |
La fracción de píxeles que ocupa el color en la imagen. Valor en el rango [0, 1]. |
CreateProductRequest
Mensaje de la solicitud para el método CreateProduct.
| Campos | |
|---|---|
parent |
El proyecto en el que se debe crear el Product. El formato es |
product |
El producto que se creará. |
product_id |
Un ID de recurso proporcionado por el usuario para este producto. Si se configura, el servidor intentará usar este valor como el ID del recurso. Si ya está en uso, se muestra un error con el código ALREADY_EXISTS. Debe tener como máximo 128 caracteres. No puede contener el carácter |
CreateProductSetRequest
Mensaje de la solicitud para el método CreateProductSet.
| Campos | |
|---|---|
parent |
El proyecto en el que se debe crear el ProductSet. El formato es |
product_set |
El ProductSet que se creará. |
product_set_id |
Es un ID de recurso proporcionado por el usuario para este ProductSet. Si se configura, el servidor intentará usar este valor como el ID del recurso. Si ya está en uso, se muestra un error con el código ALREADY_EXISTS. Debe tener como máximo 128 caracteres. No puede contener el carácter |
CreateReferenceImageRequest
Mensaje de la solicitud para el método CreateReferenceImage.
| Campos | |
|---|---|
parent |
Nombre del recurso en el que se creará la imagen de referencia. El formato es |
reference_image |
La imagen de referencia que se creará. Si se especifica un ID de imagen, se ignora. |
reference_image_id |
Un ID de recurso proporcionado por el usuario para que se agregue la ReferenceImage. Si se configura, el servidor intentará usar este valor como el ID del recurso. Si ya está en uso, se muestra un error con el código ALREADY_EXISTS. Debe tener como máximo 128 caracteres. No puede contener el carácter |
CropHint
Sugerencia de recorte única que se utiliza para generar un nuevo recorte cuando se entrega una imagen.
| Campos | |
|---|---|
bounding_poly |
El polígono de límite para la región de recorte. Las coordenadas del cuadro de límite están en la escala de la imagen original. |
confidence |
La confianza de que esto sea una región destacada. Rango [0, 1]. |
importance_fraction |
Fracción de la importancia de esta región destacada con respecto a la imagen original. |
CropHintsAnnotation
Conjunto de sugerencias de recorte que se usan para generar nuevos recortes cuando se entregan imágenes.
| Campos | |
|---|---|
crop_hints[] |
Resultados de la sugerencia de recorte. |
CropHintsParams
Parámetros para la solicitud de anotación de sugerencias de recorte.
| Campos | |
|---|---|
aspect_ratios[] |
Las relaciones de aspecto en números de punto flotante, que representan la proporción del ancho y la altura de la imagen. Por ejemplo, si la relación de aspecto deseada es 4/3, el valor flotante correspondiente debe ser 1.33333. Si no se especifica, se muestra el mejor recorte posible. La cantidad de relaciones de aspecto proporcionadas se limita a un máximo de 16. Se ignoran todas las relaciones de aspecto proporcionadas después de la decimosexta. |
CustomEntityAnnotation
Un CustomEntityAnnotation contiene anotaciones que se predijeron con los modelos personalizados de Vision.
| Campos | |
|---|---|
model |
Identifica el modelo personalizado que se usa para crear esta anotación. El formato del nombre del modelo es la URL del recurso del modo personalizado que se consulta: |
label |
La etiqueta que predijo el modelo personalizado. |
score |
La puntuación de confianza de la etiqueta según el modelo personalizado. |
DeleteProductRequest
Mensaje de la solicitud para el método DeleteProduct.
| Campos | |
|---|---|
name |
Nombre del recurso que se borrará. Formato: |
DeleteProductSetRequest
Mensaje de la solicitud para el método DeleteProductSet.
| Campos | |
|---|---|
name |
Nombre del ProductSet que se borrará. Formato: |
DeleteReferenceImageRequest
Mensaje de la solicitud para el método DeleteReferenceImage.
| Campos | |
|---|---|
name |
El nombre del recurso de la imagen de referencia que se borrará. Formato:
|
DocumentParsingParams
Parámetros para la función DOCUMENT_PARSING.
| Campos | |
|---|---|
disable_orientation_detection |
Inhabilita la detección de orientación para que no se detecte el texto rotado. |
table_detection_options |
Controla el comportamiento de detección de tablas. La detección de tablas está inhabilitada si no se configura este campo. |
document_type |
Especifica un tipo de documento conocido para detectar la estructura de forma más profunda. Actualmente, los valores válidos son “factura” o “general”. |
DominantColorsAnnotation
Conjunto de colores dominantes y sus puntuaciones correspondientes.
| Campos | |
|---|---|
colors[] |
Valores RGB de color con su puntuación y fracción de píxeles. |
EntityAnnotation
Conjunto de atributos de la entidad detectada.
| Campos | |
|---|---|
mid |
ID de entidad opaca. Es posible que algunos ID estén disponibles en la API de búsqueda en el Gráfico de conocimiento de Google. |
locale |
El código de idioma de la configuración regional en la que se expresa la |
description |
Descripción textual de la entidad, expresada en su idioma de |
score |
Puntuación general del resultado. Rango [0, 1]. |
confidence |
Obsoleto. Utiliza |
topicality |
La relevancia de la etiqueta ICA (Anotación del contenido de la imagen) de la imagen. Por ejemplo, la relevancia de "torre" probablemente sea más alta para una imagen que contiene la "Torre Eiffel", que para una imagen que contiene un edificio alto alejado detectado, aunque la confianza en que exista una torre en cada imagen puede ser la misma. Rango [0, 1]. |
bounding_poly |
Región de la imagen a la que pertenece esta entidad. No se produjo para características |
locations[] |
La información de ubicación para la entidad detectada. Es posible tener varios elementos |
properties[] |
Algunas entidades pueden tener campos |
FaceAnnotation
Un objeto de anotación de rostros contiene los resultados de la detección de rostro.
| Campos | |
|---|---|
bounding_poly |
El polígono de límite en torno al rostro. Las coordenadas del cuadro de límite están en la escala de la imagen original. El cuadro de límite se calcula para “enmarcar” el rostro de acuerdo con las expectativas humanas. Se basa en los resultados del punto de referencia. Ten en cuenta que es posible que una o más coordenadas Y o X no se generen en |
fd_bounding_poly |
El polígono de límite
prefijo (detección de rostro). |
landmarks[] |
Puntos de referencia del rostro detectados. |
roll_angle |
El ángulo de alabeo, que indica la rotación en sentido horario/antihorario del rostro en relación con el eje vertical de la imagen perpendicular al rostro. Rango [-180,180]. |
pan_angle |
El ángulo de guiñada, que indica el ángulo hacia la izquierda/derecha al que el rostro apunta en relación con el plano vertical perpendicular de la imagen. Rango [-180,180]. |
tilt_angle |
El ángulo de cabeceo, que indica el ángulo hacia arriba/abajo al que el rostro apunta en relación con el plano horizontal de la imagen. Rango [-180,180]. |
detection_confidence |
Confianza en la detección. Rango [0, 1]. |
landmarking_confidence |
Confianza en la asignación de puntos de referencia del rostro. Rango [0, 1]. |
joy_likelihood |
Probabilidad de alegría. |
sorrow_likelihood |
Probabilidad de tristeza. |
anger_likelihood |
Probabilidad de enojo. |
surprise_likelihood |
Probabilidad de sorpresa. |
under_exposed_likelihood |
Probabilidad de exposición. |
blurred_likelihood |
Probabilidad de desenfoque. |
headwear_likelihood |
Probabilidad de sombreros. |
Punto de referencia
Un punto de referencia específico del rostro (por ejemplo, un rasgo facial).
| Campos | |
|---|---|
type |
Tipo de punto de referencia facial. |
position |
Posición del punto de referencia facial. |
Tipo
Tipo de punto de referencia facial (función). Izquierda y derecha se definen desde el punto de vista del usuario que mira la imagen sin considerar las proyecciones de espejo típicas de las fotos. Por lo tanto, LEFT_EYE, por lo general, es el ojo derecho de la persona.
| Enums | |
|---|---|
UNKNOWN_LANDMARK |
Punto de referencia desconocido detectado en el rostro. No debe completarse. |
LEFT_EYE |
Ojo izquierdo. |
RIGHT_EYE |
Ojo derecho. |
LEFT_OF_LEFT_EYEBROW |
Izquierda de la ceja izquierda. |
RIGHT_OF_LEFT_EYEBROW |
Derecha de la ceja izquierda. |
LEFT_OF_RIGHT_EYEBROW |
Izquierda de la ceja derecha. |
RIGHT_OF_RIGHT_EYEBROW |
Derecha de la ceja derecha. |
MIDPOINT_BETWEEN_EYES |
Punto medio entre los ojos. |
NOSE_TIP |
Punta de la nariz. |
UPPER_LIP |
Labio superior. |
LOWER_LIP |
Labio inferior. |
MOUTH_LEFT |
Izquierda de la boca. |
MOUTH_RIGHT |
Derecha de la boca. |
MOUTH_CENTER |
Centro de la boca. |
NOSE_BOTTOM_RIGHT |
Nariz, parte inferior derecha. |
NOSE_BOTTOM_LEFT |
Nariz, parte inferior izquierda. |
NOSE_BOTTOM_CENTER |
Nariz, parte inferior central. |
LEFT_EYE_TOP_BOUNDARY |
Ojo izquierdo, límite superior. |
LEFT_EYE_RIGHT_CORNER |
Ojo izquierdo, esquina derecha. |
LEFT_EYE_BOTTOM_BOUNDARY |
Ojo izquierdo, límite inferior. |
LEFT_EYE_LEFT_CORNER |
Ojo izquierdo, esquina izquierda. |
RIGHT_EYE_TOP_BOUNDARY |
Ojo derecho, límite superior. |
RIGHT_EYE_RIGHT_CORNER |
Ojo derecho, esquina derecha. |
RIGHT_EYE_BOTTOM_BOUNDARY |
Ojo derecho, límite inferior. |
RIGHT_EYE_LEFT_CORNER |
Ojo derecho, esquina izquierda. |
LEFT_EYEBROW_UPPER_MIDPOINT |
Ceja izquierda, punto medio superior. |
RIGHT_EYEBROW_UPPER_MIDPOINT |
Ceja derecha, punto medio superior. |
LEFT_EAR_TRAGION |
Tragión de la oreja izquierda. |
RIGHT_EAR_TRAGION |
Tragión de la oreja derecha. |
LEFT_EYE_PUPIL |
Pupila del ojo izquierdo. |
RIGHT_EYE_PUPIL |
Pupila del ojo derecho. |
FOREHEAD_GLABELLA |
Glabela de la frente. |
CHIN_GNATHION |
Gnation del mentón. |
CHIN_LEFT_GONION |
Gonion izquierdo del mentón. |
CHIN_RIGHT_GONION |
Gonion derecho del mentón. |
Función
El tipo de detección de la API de Google Cloud Vision que se debe realizar y la cantidad máxima de resultados que se mostrarán para ese tipo. Se pueden especificar varios objetos Feature en la lista features.
| Campos | |
|---|---|
type |
El tipo de característica. |
max_results |
Configura la cantidad máxima de resultados de este tipo. No se aplica a |
model |
Modelo que se usará para la función. Valores admitidos: "integrado/estable" (predeterminado si no se configura) y "integrado/más reciente". |
Tipo
Tipo de característica de la API de Google Cloud Vision que se extraerá.
| Enums | |
|---|---|
TYPE_UNSPECIFIED |
Tipo de característica no especificada. |
FACE_DETECTION |
Ejecuta la detección de rostros. |
LANDMARK_DETECTION |
Ejecutar la detección de puntos de referencia |
LOGO_DETECTION |
Ejecutar la detección de logotipos. |
LABEL_DETECTION |
Ejecutar la detección de etiquetas. |
TEXT_DETECTION |
Ejecutar detección de texto / reconocimiento óptico de caracteres (OCR). La detección de texto está optimizada para áreas de texto dentro de una imagen más grande. Si la imagen es un documento, usa DOCUMENT_TEXT_DETECTION en su lugar. |
DOCUMENT_TEXT_DETECTION |
Ejecuta el OCR de documentos de texto denso. Tiene prioridad cuando están presentes DOCUMENT_TEXT_DETECTION y TEXT_DETECTION. |
SAFE_SEARCH_DETECTION |
Ejecuta Safe Search para detectar contenido inseguro o no deseado. |
IMAGE_PROPERTIES |
Procesa un conjunto de propiedades de la imagen, como sus colores predominantes. |
CROP_HINTS |
Ejecuta sugerencias de recorte. |
WEB_DETECTION |
Ejecuta la detección web. |
PRODUCT_SEARCH |
Ejecuta Product Search. |
CUSTOM_LABEL_DETECTION |
Ejecuta la detección de etiquetas personalizadas. |
OBJECT_LOCALIZATION |
Ejecuta el localizador para detectar objetos. |
IMAGE_QUALITY |
Ejecuta el marcador de calidad. |
OBJECT_ATTRIBUTES |
Calcula los atributos de los objetos detectados en la imagen. Se admiten cuatro dominios de objetos. Selecciona a través de feature.model (obligatorio): “instruido/apparel”, “integrado/automóvil”, “integrado/comida” o “integrado/vida”. |
QUALITY_OPTIMIZATION |
Ejecuta algoritmos de optimización de calidad. Existen tres tipos de operaciones: COMPRESSION, ENHANCEMENT y QUALITY_SCORE. Los parámetros COMPRESSION y ENHANCEMENT, y la elección de modelo QUALITY_SCORE se pueden especificar en image_context.quality_optimization_params. |
BARCODE_DETECTION |
Ejecuta reconocimiento y detección de códigos de barras. |
DOCUMENT_PARSING |
Ejecuta algoritmos de análisis de documentos para extraer datos estructurados, como tablas y formularios. Los resultados se encuentran en full_text_annotation -> page -> block con el tipo TABLE para tablas o KEY_VALUE_PAIR para pares clave-valor en formularios. |
GcsDestination
La ubicación de Google Cloud Storage en la que se escribe el resultado.
| Campos | |
|---|---|
uri |
URI de Google Cloud Storage donde se almacenarán los resultados. Los resultados estarán en formato JSON y precedidos por el URI de entrada correspondiente Este campo puede representar un solo archivo o un prefijo para varias salidas Los prefijos deben terminar en Ejemplos:
Si hay varios resultados, cada respuesta sigue siendo AnnotateFileResponse, cada una de las cuales contiene algún subconjunto de la lista completa de AnnotateImageResponse. Es posible que se produzcan varios resultados si, por ejemplo, el resultado de JSON es demasiado grande y se desborda en varios archivos fragmentados. |
GcsSource
La ubicación de Google Cloud Storage desde la que se leerá la entrada.
| Campos | |
|---|---|
uri |
URI de Google Cloud Storage para el archivo de entrada. Este solo debe ser un objeto de Google Cloud Storage. Por el momento, no se admiten los comodines. |
GetProductRequest
Mensaje de la solicitud para el método GetProduct.
| Campos | |
|---|---|
name |
Nombre del recurso del Product que se obtendrá. Formato: |
GetProductSetRequest
Mensaje de la solicitud para el método GetProductSet.
| Campos | |
|---|---|
name |
Nombre del ProductSet que se debe obtener. Formato: |
GetReferenceImageRequest
Mensaje de la solicitud para el método GetReferenceImage.
| Campos | |
|---|---|
name |
El nombre del recurso de ReferenceImage que se debe obtener. Formato:
|
Imagen
Imagen de cliente en la que se realizarán tareas de la API de Google Cloud Vision.
| Campos | |
|---|---|
content |
Contenido de imagen, representado como un flujo de bytes. Nota: Al igual que con todos los campos de |
source |
Ubicación de la imagen de Google Cloud Storage o URL de imagen de acceso público. Si se proporcionan |
ImageAnnotationContext
Si se produjo una imagen a partir de un archivo (p. ej., un PDF), este mensaje contiene información sobre la fuente de la imagen.
| Campos | |
|---|---|
uri |
El URI del archivo que se usa para producir la imagen. |
page_number |
Si el archivo era PDF o TIFF, este campo indica el número de página dentro del archivo que se usó para producir la imagen. |
ImageContext
Contexto de imagen o parámetros específicos de las características.
| Campos | |
|---|---|
lat_long_rect |
No se usa. |
language_hints[] |
Lista de idiomas que se usan en TEXT_DETECTION. En la mayoría de los casos, un valor vacío genera mejores resultados, ya que permite la detección automática del idioma. Para los idiomas que se basan en el alfabeto latino, no es necesario configurar |
crop_hints_params |
Parámetros para la solicitud de anotación de sugerencias de recorte. |
product_search_params |
Parámetros para la búsqueda de productos. |
web_detection_params |
Parámetros para la detección web. |
text_detection_params |
Parámetros para la detección de texto en documentos. |
quality_optimization_params |
Parámetros para las optimizaciones de calidad de la imagen. |
document_parsing_params |
Parámetros para el análisis de documentos. |
ImageProperties
Almacena propiedades de imagen, como los colores predominantes.
| Campos | |
|---|---|
dominant_colors |
Si están presente, los colores predominantes se completaron correctamente. |
ImageQuality
Almacena puntuaciones de calidad de imagen, pueden ser de calidad estética o técnica.
| Campos | |
|---|---|
quality_score |
Una puntuación que representa la calidad estética o técnica de la imagen. La puntuación está en el rango [0, 1]. Un valor más alto corresponde a fotos más profesionales. 0 significa que la imagen se ve muy mal; 1 significa que la imagen es de alta calidad. |
ImageSource
Fuente de imagen externa (Google Cloud Storage o ubicación de la imagen de URL web)
| Campos | |
|---|---|
gcs_image_uri |
En su lugar, usa El URI de Google Cloud Storage con el formato |
image_uri |
El URI de la imagen de origen. Puede ser una de estas opciones:
Cuando se especifican |
ImportProductSetsGcsSource
La ubicación de Google Cloud Storage para un archivo CSV que conserva una lista de ImportProductSetRequests en cada línea.
| Campos | |
|---|---|
csv_file_uri |
El URI de Google Cloud Storage del archivo CSV de entrada. El URI debe comenzar con El formato del archivo csv de entrada debe ser una imagen por línea. En cada línea, hay 8 columnas.
Las columnas Si los valores La columna La columna Si ya existe un La columna La columna Se permite como máximo una columna La columna El sistema cambiará el tamaño de la imagen si la resolución de la imagen es demasiado grande para procesarse (más de 20 MP). |
ImportProductSetsInputConfig
El contenido de entrada para el método ImportProductSets.
| Campos | |
|---|---|
gcs_source |
La ubicación de Google Cloud Storage para un archivo CSV que conserva una lista de ImportProductSetRequests en cada línea. |
ImportProductSetsRequest
Mensaje de la solicitud para el método ImportProductSets.
| Campos | |
|---|---|
parent |
El proyecto en el que se deben importar los ProductSets. El formato es |
input_config |
El contenido de entrada para la lista de solicitudes. |
ImportProductSetsResponse
Mensaje de respuesta para el método ImportProductSets.
El método google.longrunning.Operations.GetOperation muestra este mensaje en el campo google.longrunning.Operation.response que se muestra.
| Campos | |
|---|---|
reference_images[] |
La lista de referencias_images se importan con éxito. |
statuses[] |
El estado de la rpc para cada solicitud de ImportProductSet, incluidos los éxitos y los errores. En este caso, la cantidad de estados coincide con la cantidad de líneas del archivo csv, y los estados [i] almacenan el estado de éxito o de falla del procesamiento de la línea i-th del csv, a partir de la línea 0. |
InputConfig
La ubicación y los metadatos de entrada deseados.
| Campos | |
|---|---|
gcs_source |
La ubicación de Google Cloud Storage desde la que se lee la entrada. |
content |
Contenido de archivos, representado como un flujo de bytes. Nota: Al igual que con todos los campos de Actualmente, este campo solo funciona para solicitudes BatchAnnotateFiles. No funciona para solicitudes AsyncBatchAnnotateFiles. |
mime_type |
El tipo de archivo. Actualmente, solo se admiten "application/pdf" e "image/tiff". Los comodines no son compatibles. |
KeyValuePair
Proto para un par clave-valor.
| Campos | |
|---|---|
key |
El valor de la string de clave. |
key_block |
Bloque de claves del par que contiene el cuadro de límite normalizado y el texto de la clave. |
value_block |
Bloque de valor del par que contiene el cuadro de límite normalizado y el texto del valor, incluidas las estructuras potencialmente más profundas dentro del texto del valor. |
value_type |
Tipo del valor. Las strings válidas son las siguientes: "generic": Para texto genérico que se asigna a un valor. "número": para tipos numéricos "id": para identificadores genéricos. "currency": para los valores de moneda. "date": para las fechas. "time": para valores de tiempo y duración. “date_range”: para períodos. "address": para los valores de dirección (puede ser largo). "persona": para los nombres de las personas y otros identificadores personales. "phone": para números de teléfono. |
normalized_key |
(Opcional) El texto de clave normalizado si el texto es común y está clasificado. Por ejemplo, “TOTAL DUE” se normalizará a “Importe total”. |
LatLongRect
Rectángulo determinado por pares de LatLng mínimos y máximos.
| Campos | |
|---|---|
min_lat_lng |
Par mínima latitud/longitud. |
max_lat_lng |
Par máxima latitud/longitud. |
Likelihood
Se trata de una representación en buckets de la probabilidad, que tiene el objetivo de ofrecer a los clientes resultados muy estables en las actualizaciones de modelos.
| Enums | |
|---|---|
UNKNOWN |
Probabilidad desconocida. |
VERY_UNLIKELY |
Es muy poco probable que la imagen pertenezca a la vertical especificada. |
UNLIKELY |
Es poco probable que la imagen pertenezca a la vertical especificada. |
POSSIBLE |
Es posible que la imagen pertenezca a la vertical especificada. |
LIKELY |
Es probable que la imagen pertenezca a la vertical especificada. |
VERY_LIKELY |
Es muy probable que la imagen pertenezca a la vertical especificada. |
ListProductSetsRequest
Mensaje de la solicitud para el método ListProductSets.
| Campos | |
|---|---|
parent |
El proyecto del que se deben mostrar los ProductSets. El formato es |
page_size |
La cantidad máxima de elementos que se mostrarán. 10 es el valor predeterminado, 100 el máximo. |
page_token |
El next_page_token que se muestra de una solicitud de lista anterior, si existe. |
ListProductSetsResponse
Mensaje de respuesta para el método ListProductSets.
| Campos | |
|---|---|
product_sets[] |
Lista de ProductSets. |
next_page_token |
Token para recuperar la página siguiente de resultados o vaciar si no hay más resultados en la lista. |
ListProductsInProductSetRequest
Mensaje de la solicitud para el método ListProductsInProductSet.
| Campos | |
|---|---|
name |
El recurso ProductSet para el que se deben recuperar los Products. Formato: |
page_size |
La cantidad máxima de elementos que se mostrarán. 10 es el valor predeterminado, 100 el máximo. |
page_token |
El next_page_token que se muestra de una solicitud de lista anterior, si existe. |
ListProductsInProductSetResponse
Mensaje de respuesta para el método ListProductsInProductSet.
| Campos | |
|---|---|
products[] |
Es la lista de Products. |
next_page_token |
Token para recuperar la página siguiente de resultados o vaciar si no hay más resultados en la lista. |
ListProductsRequest
Mensaje de la solicitud para el método ListProducts.
| Campos | |
|---|---|
parent |
El proyecto o el ProductSet para el que se deben enumerar los Products. Formato: |
page_size |
La cantidad máxima de elementos que se mostrarán. 10 es el valor predeterminado, 100 el máximo. |
page_token |
El next_page_token que se muestra de una solicitud de lista anterior, si existe. |
ListProductsResponse
Mensaje de respuesta para el método ListProducts.
| Campos | |
|---|---|
products[] |
Lista de productos. |
next_page_token |
Token para recuperar la página siguiente de resultados o vaciar si no hay más resultados en la lista. |
ListReferenceImagesRequest
Mensaje de la solicitud para el método ListReferenceImages.
| Campos | |
|---|---|
parent |
El nombre del recurso del producto que contiene las imágenes de referencia. El formato es |
page_size |
La cantidad máxima de elementos que se mostrarán. 10 es el valor predeterminado, 100 el máximo. |
page_token |
Un token que identifica una página de resultados que se mostrarán. Este es el valor de Se configura de forma predeterminada como la primera página si no se especifica. |
ListReferenceImagesResponse
Mensaje de respuesta para el método ListReferenceImages.
| Campos | |
|---|---|
reference_images[] |
La lista de imágenes de referencia. |
page_size |
La cantidad máxima de elementos que se mostrarán. 10 es el valor predeterminado, 100 el máximo. |
next_page_token |
El next_page_token que se muestra de una solicitud de lista anterior, si existe. |
LocalizedBarcodeAnnotation
Conjunto de códigos de barras detectados con cuadros de límite.
| Campos | |
|---|---|
format |
El formato de código de barras describe el formato de un código de barras. Los formatos admitidos son CODE_128: tipo de código 128. CODE_39: Tipo de código 39 CODE_93: Tipo de código 93 CODABAR: Tipo de Codabar. DATA_MATRIX: Tipo de matriz de datos 2D. ITF: tipo de ITF. EAN_13: tipo EAN-13. EAN_8: tipo EAN-8. QR_CODE: tipo de código 2D QR. UPC_A: tipo UPC-A. UPC_E: Tipo UPC-E. PDF417: Tipo PDF417. AZTEC: Tipo de código 2D Aztec. DATABAR: Tipo de código GS1 DataBar. |
value_format |
El formato de valor de código de barras describe el formato del valor que codifica un código de barras. Los formatos de valor admitidos son CONTACT_INFO: Información de contacto. EMAIL: Dirección de correo electrónico. ISBN: Identificador de ISBN PHONE: Número de teléfono. PRODUCT: Producto. SMS: mensaje SMS. TEXT: String de texto. URL: Dirección URL. WIFI: información sobre Wi-Fi. GEO: Ubicación geográfica (longitud y latitud). CALENDAR_EVENT: Evento de calendario. DRIVER_LICENSE: Licencia de conducir. |
value |
Valor de código de barras que es el valor ASCII capturado en el código de barras. Los códigos de barras pueden codificar valores estructurados, por ejemplo, “MEBKM:TITLE:Google;URL:https://www.google.com;;'. |
confidence |
Valor de confianza del resultado. Rango [0, 1]. |
bounding_poly |
Región de la imagen a la que pertenece este código de barras. Esto debe propagarse. |
LocalizedObjectAnnotation
Conjunto de objetos detectados con cuadros de límite.
| Campos | |
|---|---|
mid |
ID de objeto que debe alinearse con el mid de EntityAnnotation. |
language_code |
El código de idioma BCP-47, como "en-US" o "sr-Latn". Para obtener más información, consulta http://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
name |
Nombre del objeto, expresado en su lenguaje de |
score |
Puntuación del resultado. Rango [0, 1]. |
bounding_poly |
Región de la imagen a la que pertenece este objeto. Esto debe propagarse. |
LocationInfo
Información de ubicación de la entidad detectada.
| Campos | |
|---|---|
lat_lng |
Coordenadas de ubicación de latitud/longitud. |
NormalizedVertex
Un vértice representa un punto 2D en la imagen. NOTA: Las coordenadas de vértices normalizadas están relacionadas con la imagen original y varían de 0 a 1.
| Campos | |
|---|---|
x |
Coordenada de X. |
y |
Coordenada de Y. |
OperationMetadata
Contiene metadatos para la operación BatchAnnotateImages.
| Campos | |
|---|---|
state |
Estado actual de la operación por lotes. |
create_time |
La hora a la que se recibió la solicitud por lotes. |
update_time |
La hora a la que se actualizó el resultado de la operación por última vez. |
Estado
Estados de la operación por lotes.
| Enums | |
|---|---|
STATE_UNSPECIFIED |
No válido. |
CREATED |
Se recibió la solicitud. |
RUNNING |
La solicitud se está procesando de forma activa. |
DONE |
El procesamiento por lotes está completo. |
CANCELLED |
El procesamiento por lotes se canceló. |
OutputConfig
La ubicación de salida y los metadatos deseados.
| Campos | |
|---|---|
gcs_destination |
La ubicación de Google Cloud Storage en la que se escriben los resultados. |
batch_size |
La cantidad máxima de protos de respuesta que se deben colocar en cada archivo JSON de salida en Google Cloud Storage. El rango válido es [1, 100]. Si no se especifica, el valor predeterminado es 20. Por ejemplo, en un archivo PDF con 100 páginas, se generarán 100 archivos .proto de respuesta. Si Actualmente, batchSize solo se aplica a GcsDestination, y es posible que se admita otra configuración de salida en el futuro. |
Página
Página detectada de OCR.
| Campos | |
|---|---|
property |
Información adicional detectada en la página. |
width |
Ancho de página. Para los archivos PDF, la unidad es puntos. Para las imágenes (incluidos los TIFF), la unidad es de píxeles. |
height |
Altura de la página. Para los archivos PDF, la unidad es puntos. Para las imágenes (incluidos los TIFF), la unidad es de píxeles. |
blocks[] |
Lista de bloques de texto, imágenes, etc. en esta página. |
confidence |
La confianza de los resultados de OCR en la página Rango [0, 1]. |
merged_text |
Todo el texto UTF-8 detectado en esta página. Este campo no se muestra de forma predeterminada, a menos que se especifique en TextDetectionParams.page_filter. |
Párrafo
Unidad estructural de texto que representa un número de palabras en cierto orden.
| Campos | |
|---|---|
property |
Se detectó información adicional para el párrafo. |
bounding_box |
El cuadro de límite del párrafo. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo: * cuando el texto es horizontal, puede verse así: 0----1 | | 3----2 * cuando se rota 180 grados alrededor de la esquina superior izquierda se convierte en: 2----3 | | 1----0 y el orden de vértices se mantendrá como (0, 1, 2, 3). |
words[] |
Lista de palabras de este párrafo. |
confidence |
La confianza de los resultados de OCR del párrafo. Rango [0, 1]. |
merged_text |
Todo el texto UTF-8 detectado en este párrafo. Este campo no se muestra de forma predeterminada, a menos que se especifique en TextDetectionParams.párrafo_filter. |
Posición
Una posición 3D en la imagen, que se usa principalmente para los puntos de referencia de detección de rostros. Un punto válido debe tener las coordenadas tanto de la posición "x" como de la posición "y". Las coordenadas de posición tienen la misma escala que la imagen original.
| Campos | |
|---|---|
x |
Coordenada de X. |
y |
Coordenada de Y. |
z |
Coordenada de Z (o profundidad). |
Producto
Un Product contiene ReferenceImages.
| Campos | |
|---|---|
name |
Es el nombre del recurso del producto. Formato: Este campo se ignora cuando se crea un producto. |
display_name |
Es el nombre proporcionado por el usuario para este Product. No debe estar vacío. Debe tener como máximo 4,096 caracteres. |
description |
Los metadatos proporcionados por el usuario para almacenar en este producto. Debe tener como máximo 4,096 caracteres. |
product_category |
La categoría del producto identificada por la imagen de referencia. Debe ser “homegoods”, “apparel” o “toys”. Este campo es inmutable. |
product_labels[] |
Pares clave-valor que se pueden adjuntar a un producto. En el momento de la consulta, las restricciones se pueden especificar en función de las product_labels. Ten en cuenta que los valores de número entero se pueden proporcionar como strings, p. ej., “1199”. Solo las strings con valores de números enteros pueden coincidir con una restricción basada en rangos, que pronto será compatible. Se pueden asignar varios valores a la misma clave. Un producto puede tener hasta 100 product_labels. |
KeyValue
Una etiqueta de producto representada como un par clave-valor.
| Campos | |
|---|---|
key |
La clave de la etiqueta adjunta al producto. No puede estar vacío ni superar los 128 bytes. |
value |
El valor de la etiqueta adjunta al producto. No puede estar vacío ni superar los 128 bytes. |
ProductSearchParams
Parámetros para una solicitud de búsqueda de productos.
| Campos | |
|---|---|
bounding_poly |
El polígono que delimita el área de interés en la imagen. Opcional. Si no se especifica, se aplicará la discreción del sistema. |
product_set |
El nombre de recurso de un Formato: |
product_categories[] |
La lista de categorías de productos en las que se debe buscar. En este momento, solo consideramos la primera categoría y se debe especificar “homegoods”, “apparel” o “toys”. |
filter |
La expresión de filtrado. Se puede usar para restringir los resultados de la búsqueda en función de las etiquetas de producto. Actualmente se admite un operador AND u OR de expresiones clave-valor. Cada expresión dentro de un OR debe tener la misma clave. Por ejemplo, “(color = rojo OR color = azul) AND marca = Google” es aceptable, pero no “(color = rojo OR marca = Google)” ni “color : rojo”. |
ProductSearchResults
Resultados de una solicitud de búsqueda de productos.
| Campos | |
|---|---|
index_time |
Marca de tiempo del índice que proporcionó estos resultados. Los cambios que se realicen después de esta fecha no se reflejarán en los resultados actuales. |
results[] |
Lista de resultados, uno para cada coincidencia de producto. |
product_grouped_results[] |
Lista de resultados agrupados por productos detectados en la imagen de la consulta. Cada entrada corresponde a un polígono de límite en la imagen de la consulta y contiene los productos coincidentes específicos de esa región. Puede haber coincidencias de productos duplicadas en la unión de todos los resultados por producto. |
GroupedResult
Información sobre los productos similares a un solo producto en una imagen de consulta.
| Campos | |
|---|---|
bounding_poly |
El polígono de límite alrededor del producto detectado en la imagen de consulta. |
results[] |
Lista de resultados, uno para cada coincidencia de producto. |
object_annotations[] |
Lista de predicciones genéricas para el objeto en el cuadro de límite. |
ObjectAnnotation
Predicción para saber cuál es el objeto en el cuadro de límite.
| Campos | |
|---|---|
mid |
ID de objeto que debe alinearse con el mid de EntityAnnotation. |
language_code |
El código de idioma BCP-47, como "en-US" o "sr-Latn". Para obtener más información, consulta http://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
name |
Nombre del objeto, expresado en su lenguaje de |
score |
Puntuación del resultado. Rango [0, 1]. |
Resultado
Información sobre un producto
| Campos | |
|---|---|
product |
El producto. |
score |
Un nivel de confianza en la coincidencia, que varía de 0 (sin confianza) a 1 (confianza total). |
image |
El nombre de recurso de la imagen del producto que tiene la coincidencia más cercana con la consulta. |
ProductSet
Un ProductSet contiene productos. Un ProductSet puede contener un máximo de 1 millón de imágenes de referencia. Si se excede el límite, la indexación periódica fallará.
| Campos | |
|---|---|
name |
Es el nombre del recurso de ProductSet. Formato: Este campo se ignora cuando se crea un ProductSet. |
display_name |
El nombre proporcionado por el usuario para este ProductSet. No debe estar vacío. Debe tener como máximo 4,096 caracteres. |
index_time |
Solo salida. La hora en la que se indexó este ProductSet por última vez. Los resultados de la consulta reflejarán todas las actualizaciones antes de esta fecha. Si este ProductSet nunca se indexó, esta marca de tiempo es el valor predeterminado "1970-01-01T00:00:00Z". Este campo se ignora cuando se crea un ProductSet. |
index_error |
Solo salida. Si se produjo un error durante la indexación del conjunto de productos, el campo se propaga. Este campo se ignora cuando se crea un ProductSet. |
Propiedad
Un objeto Property consta de un par nombre/valor proporcionado por el usuario.
| Campos | |
|---|---|
name |
El nombre de la propiedad. |
value |
Valor de la propiedad. |
uint64_value |
Valor de propiedades numéricas. |
confidence |
Valor en el rango [0..1]. La confianza de este valor de propiedad. |
mid |
ID de valor de propiedad opaco. Es posible que algunos ID estén disponibles en la API de búsqueda en el Gráfico de conocimiento de Google. Una propiedad de ejemplo para un abrigo azul sería: Propiedad { nombre: 'color' valor: 'azul' medio: '/m/01g5v' // Para el color azul } |
QualityOptimizationParams
Parámetros para las optimizaciones de calidad de la imagen.
| Campos | |
|---|---|
type |
Elige un tipo de optimización. |
compression_config |
Especifica la configuración de compresión. |
enhancement_config |
Especifica la configuración de ajuste automático. |
quality_score_config |
Especifica la configuración del nivel de calidad |
CompressionConfig
Configuración para COMPRESSION.
| Campos | |
|---|---|
target_quality |
Dentro del rango [0, 1]. Calidad objetivo después de la compresión. 1 significa sin pérdidas en comparación con la imagen de entrada; 0 significa que no hay un requisito de calidad mínima. |
EnhancementConfig
Configuración para ENHANCMENT. Si no se especifica enhancement_config, se usarán los valores predeterminados de sharpening_level igual a 0.5, auto_hdr_level igual a 0.5 y upscale_ratio igual a 1. Si deseas personalizar cualquiera de los tres parámetros, debes especificar EnhancementConfig por completo. Por ejemplo, si deseas usar un auto_hdr_level más alto, lo que generalmente hará que la imagen sea más brillante, y mantener el nivel de enfoque y la proporción de ampliación en sus valores predeterminados, puedes establecer la configuración de la siguiente manera: enhancement_config { sharpening_level: 0.5 auto_hdr_level: 1.0 upscale_ratio: 1 }
| Campos | |
|---|---|
sharpening_level |
Dentro del rango [0,1]. El nivel de nitidez, 0 significa sin nitidez, 1 significa nitidez mayor. La cantidad predeterminada es 0.5. |
auto_hdr_level |
Dentro del rango [0,1]. El nivel de HDR automático, 0 significa que no hay HDR automático, 1 significa el AutoHDR más grande. La cantidad predeterminada es 0.5. |
upscale_ratio |
Dentro del rango [1, 2]. Indica si se aumenta el tamaño. El valor predeterminado es 1, que significa que no hay un aumento de tamaño. Si se especifica, el alto y el ancho del resultado serán iguales a la altura y el ancho originales multiplicados por upscale_ratio. |
QualityScoreConfig
Configuración de QUALITY_SCORE.
| Campos | |
|---|---|
quality_model |
Especifica qué modelo usar. El valor predeterminado es una string vacía y se mostrará la puntuación estética. Otro modelo de calidad compatible es “builtin/technical-score”, que mostrará la calidad técnica de la imagen. |
Tipo
Enumeración del tipo de optimización de calidad.
| Enums | |
|---|---|
TYPE_UNSPECIFIED |
No válido. El cliente debe seleccionar un tipo. |
COMPRESSION |
Reduce el tamaño del archivo de imagen. Parámetros detallados especificados en ComprimionConfig. Si el cliente no especifica ComprimionConfig, se reducirá el tamaño del archivo de imagen sin reducir la calidad de la imagen. Si el cliente especifica zipionConfig, reduciremos el tamaño de los archivos y, al mismo tiempo, manteneremos ComprimirParams.target_Quality. |
ENHANCEMENT |
Ruido, nitidez, HDR y escalamiento vertical. Parámetros detallados especificados en EnhancementConfig. Si el cliente no especifica EnhancmentConfig, realizará la mejora de la imagen con valores predeterminados. Si no se especifica upscale_ratio, la imagen de salida tendrá la misma resolución que la imagen de entrada. |
QUALITY_SCORE |
Nivel de calidad de consulta de una imagen. Parámetros detallados especificados enQualityScoreConfig. Si el cliente no especifica ValueScoreConfig, se mostrará la puntuación estética de la imagen. |
QualityOptimizationResult
Almacena bytes de imagen mejorados.
| Campos | |
|---|---|
quality_optimization_type |
Es el tipo de optimización requerido. |
image |
Bytes de imagen optimizados. |
mime_type |
Tipo de MIME de la imagen de salida. |
ReferenceImage
ReferenceImage representa una imagen de producto y sus metadatos asociados, como cuadros de límite.
| Campos | |
|---|---|
name |
El nombre del recurso de la imagen de referencia Formato:
Este campo se ignora cuando se crea una imagen de referencia. |
uri |
El URI de Google Cloud Storage de la imagen de referencia. El URI debe comenzar con Obligatorio. |
bounding_polys[] |
Límites de polígonos en las áreas de interés en la imagen de referencia. Opcional. Si este campo está vacío, el sistema intentará detectar las regiones de interés. Se usarán, como máximo, 10 polígonos de límite. La forma proporcionada se convierte en un rectángulo no rotado. Una vez convertido, el borde pequeño del rectángulo debe ser mayor o igual que 300 píxeles. La relación de aspecto debe ser de 1:4 o menos (es decir, 1:3 es aceptable; 1:5 no). |
RemoveProductFromProductSetRequest
Mensaje de la solicitud para el método RemoveProductFromProductSet.
| Campos | |
|---|---|
name |
Es el nombre del recurso que se debe modificar para el ProductSet. Formato: |
product |
El nombre de recurso del Product que se quitará de este ProductSet. Formato: |
SafeSearchAnnotation
Conjunto de características de la imagen, calculadas mediante métodos de visión artificial sobre sectores verticales de búsqueda segura (por ejemplo, adulto, falsificación, medicina, violencia).
| Campos | |
|---|---|
adult |
Representa la probabilidad de que la imagen incluya contenido para adultos. El contenido para adultos puede contener elementos como desnudez, imágenes o caricaturas pornográficas, o actividades sexuales. |
spoof |
Probabilidad de falsificación. La probabilidad de que se haya modificado la versión canónica de la imagen para que parezca divertida u ofensiva. |
medical |
Probabilidad de que esta sea una imagen médica. |
violence |
Probabilidad de que esta imagen incluya contenido violento. |
racy |
Probabilidad de que la imagen de la solicitud incluya contenido subido de tono. El contenido subido de tono puede incluir (pero no se limita a) ropa escasa o transparente, desnudos cubiertos estratégicamente, poses obscenas o provocativas, o primeros planos de partes privadas del cuerpo. |
Símbolo
Representación de un solo símbolo.
| Campos | |
|---|---|
property |
Se detectó información adicional para el símbolo. |
bounding_box |
El cuadro de límite del símbolo. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo: * cuando el texto es horizontal, puede verse así: 0----1 | | 3----2 * cuando se rota 180 grados alrededor de la esquina superior izquierda se convierte en: 2----3 | | 1----0 y el orden de vértices seguirá siendo (0, 1, 2, 3). |
text |
La representación UTF-8 real del símbolo. |
confidence |
Se obtiene la confianza de los resultados de OCR para el símbolo. Rango [0, 1]. |
Tabla
Una representación de tabla similar a la estructura de tabla HTML.
| Campos | |
|---|---|
header_rows[] |
Filas del encabezado de la tabla |
body_rows[] |
Filas del cuerpo de la tabla |
TableCell
Representación de celdas dentro de tablas.
| Campos | |
|---|---|
row_span |
Cuántas filas abarca esta celda. |
col_span |
Cuántas columnas abarca esta celda. |
text_block |
Bloque de texto para esta celda que también contiene el cuadro de límite normalizado para la celda y las estructuras más profundas de una celda, si está presente. |
text |
El valor de texto combinado de esta celda, que omite cualquier información estructural más profunda a diferencia de |
Fila de la tabla
Una fila de celdas de la tabla.
| Campos | |
|---|---|
cells[] |
Celdas que conforman esta fila. |
TableBoundHint
Una sugerencia para un cuadro de límite de tabla en la página para el análisis de tablas.
| Campos | |
|---|---|
page_number |
Número de página opcional para entradas de varias páginas a las que se aplica esta sugerencia. Si no se proporciona, esta sugerencia se aplicará a todas las páginas de forma predeterminada. Este valor tiene indexación de base 1. |
bounding_box |
Sugerencia de cuadro de límite para una tabla de esta página. Las coordenadas deben normalizarse a [0,1] y el cuadro de límite debe ser un rectángulo alineado al eje. |
TableDetectionOptions
Opciones para la detección de tablas.
| Campos | |
|---|---|
table_bound_hints[] |
Sugerencias opcionales de cuadros de límite de tablas que se pueden proporcionar para casos complejos en los que nuestro algoritmo no puede ubicar las tablas. |
TextAnnotation
TextAnnotation contiene una representación estructurada del texto extraído de OCR. La jerarquía de una estructura de texto extraída de OCR es así: TextAnnotation -> Página -> Bloque -> Párrafo -> Palabra -> Símbolo. Cada componente estructural, a partir de la página, puede tener sus propias propiedades. Las propiedades describen los idiomas detectados, los saltos de línea, etcétera. Consulta la definición de mensaje TextAnnotation.TextProperty a continuación para obtener más detalles.
| Campos | |
|---|---|
pages[] |
Lista de páginas detectadas por OCR. |
text |
Texto UTF-8 detectado en las páginas. |
DetectedBreak
Inicio o final detectado de un componente estructural.
| Campos | |
|---|---|
type |
Se detectó un tipo de salto. |
is_prefix |
Tiene el valor verdadero si el salto antecede al elemento. |
BreakType
Enumeración que indica el tipo de salto encontrado. Línea nueva, espacio, etcétera.
| Enums | |
|---|---|
UNKNOWN |
Tipo de etiqueta de salto desconocida. |
SPACE |
Espacio normal. |
SURE_SPACE |
Espacio grueso (muy ancho). |
EOL_SURE_SPACE |
Salto de línea. |
HYPHEN |
Guion de línea que no está presente en el texto no coincide con SPACE, LEADER_SPACE ni LINE_BREAK. |
LINE_BREAK |
Salto de línea que termina en un párrafo. |
DetectedLanguage
Idioma detectado en un componente estructural.
| Campos | |
|---|---|
language_code |
El código de idioma BCP-47, como "en-US" o "sr-Latn". Para obtener más información, consulta http://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
La confianza del idioma detectado. Rango [0, 1]. |
TextProperty
Información adicional detectada en el componente estructural.
| Campos | |
|---|---|
detected_languages[] |
Una lista de idiomas detectados y la confianza. |
detected_break |
El inicio y el final detectados de un segmento de texto. |
TextDetectionParams
Parámetros para las detecciones de texto. Se usa para controlar las funciones TEXT_DETECTION y DOCUMENT_TEXT_DETECTION.
| Campos | |
|---|---|
disable_orientation_detection |
Inhabilita la detección de orientación para que no se detecte el texto rotado. Esto solo se admite para DOCUMENT_TEXT_DETECTION. |
disable_text_annotations |
Inhabilita el campo text_annotations anterior. Solo se mostrará full_text_annotations. |
page_filter |
Controla qué datos se muestran en el nivel de la página en full_text_annotation. Valor predeterminado cuando no se establece Se incluyen todos los campos |
block_filter |
Controla qué datos se muestran en el nivel de bloque en full_text_annotation. Valor predeterminado cuando no se establece: Todos los campos se incluyen, excepto |
paragraph_filter |
Controla qué datos se muestran a nivel de párrafo en full_text_annotation. Valor predeterminado cuando no se establece: Todos los campos se incluyen, excepto |
word_filter |
Controla qué datos se muestran a nivel de palabra en full_text_annotation. Valor predeterminado cuando no se establece: Todos los campos se incluyen, excepto |
symbol_filter |
Controla qué datos se muestran en el nivel de la símbolo en full_text_annotation. Valor predeterminado cuando no se establece: Todos los campos se incluyen, excepto |
UpdateProductRequest
Mensaje de la solicitud para el método UpdateProduct.
| Campos | |
|---|---|
product |
El recurso de Product que reemplaza al que está en el servidor. product.name es inmutable. |
update_mask |
El |
UpdateProductSetRequest
Mensaje de la solicitud para el método UpdateProductSet.
| Campos | |
|---|---|
product_set |
El recurso ProductSet que reemplaza al que se encuentra en el servidor. |
update_mask |
El |
Vertex
Un vértice representa un punto 2D en la imagen. NOTA: Las coordenadas de los vértices se encuentran en la misma escala que la imagen original.
| Campos | |
|---|---|
x |
Coordenada de X. |
y |
Coordenada de Y. |
WebDetection
Información relevante para la imagen de Internet.
| Campos | |
|---|---|
web_entities[] |
Entidades deducidas de imágenes similares en Internet. |
full_matching_images[] |
Imágenes completamente coincidentes de Internet. Puede incluir copias redimensionadas de la imagen de consulta. |
partial_matching_images[] |
Imágenes de coincidencia parcial de Internet. Esas imágenes son lo suficientemente similares para compartir algunas características de puntos clave. Por ejemplo, es probable que una imagen original tenga coincidencias parciales con sus recortes. |
pages_with_matching_images[] |
Páginas web que contienen las imágenes coincidentes de Internet. |
visually_similar_images[] |
Los resultados de imágenes que son similares visualmente. |
best_guess_labels[] |
La mejor suposición del sistema del tema de la imagen de la solicitud. Se deduce a partir de imágenes similares en la Web abierta. |
WebEntity
Entidad deducida de imágenes similares en Internet.
| Campos | |
|---|---|
entity_id |
ID de entidad opaco. |
score |
Puntuación general de relevancia para la entidad. No se normaliza y no se puede comparar en diferentes consultas de imágenes. |
description |
La descripción canónica de la entidad, en inglés. |
WebImage
Metadatos de imágenes en línea.
| Campos | |
|---|---|
url |
La URL de la imagen resultante. |
score |
(Obsoleto) Puntuación general de relevancia para la imagen. |
WebLabel
Etiqueta que proporciona metadatos adicionales para la detección web.
| Campos | |
|---|---|
label |
Etiqueta para metadatos adicionales. |
language_code |
El código de idioma BCP-47 para |
WebPage
Metadatos de páginas web.
| Campos | |
|---|---|
url |
La URL de la página web de resultados. |
score |
(Obsoleto) La puntuación de relevancia general para la página web. |
page_title |
El título de la página web puede contener lenguajes de marcado HTML. |
full_matching_images[] |
Imágenes que coinciden por completo en la página. Puede incluir copias redimensionadas de la imagen de consulta. |
partial_matching_images[] |
Imágenes que coinciden de forma parcial en la página. Esas imágenes son lo suficientemente similares para compartir algunas características de puntos clave. Por ejemplo, es probable que una imagen original tenga coincidencias parciales con sus recortes. |
WebDetectionParams
Parámetros para la solicitud de detección web.
| Campos | |
|---|---|
include_geo_results |
Indica si se incluyen o no los resultados derivados de la información geográfica de la imagen. |
Word
Representación de palabras.
| Campos | |
|---|---|
property |
Información adicional para la palabra. |
bounding_box |
El cuadro de límite de la palabra. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo: * cuando el texto es horizontal, puede verse así: 0----1 | | 3----2 * cuando se rota 180 grados alrededor de la esquina superior izquierda se convierte en: 2----3 | | 1----0 y el orden de vértices se mantendrá como (0, 1, 2, 3). |
symbols[] |
Lista de símbolos de la palabra. El orden de los símbolos sigue el orden natural de lectura. |
confidence |
La confianza de los resultados de OCR para la palabra. Rango [0, 1]. |
merged_text |
Todo el texto UTF-8 detectado en esta palabra. Este campo no se muestra de forma predeterminada, a menos que se especifique en TextDetectionParams.word_filter. |