Package google.cloud.vision.v1

Indice

ImageAnnotator

Servizio che esegue attività di rilevamento dell'API Google Cloud Vision sulle immagini del client, ad esempio rilevamento di volti, punti di riferimento, loghi, etichette e testo. Il servizio ImageAnnotator restituisce le entità rilevate dalle immagini.

AsyncBatchAnnotateFiles

rpc AsyncBatchAnnotateFiles(AsyncBatchAnnotateFilesRequest) returns (Operation)

Esegui il rilevamento e l'annotazione asincroni delle immagini per un elenco di file generici, ad esempio file PDF, che possono contenere più pagine e più immagini per pagina. L'avanzamento e i risultati possono essere recuperati tramite l'interfaccia google.longrunning.Operations. Operation.metadata contiene OperationMetadata (metadati). Operation.response contiene AsyncBatchAnnotateFilesResponse (risultati).

Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

AsyncBatchAnnotateImages

rpc AsyncBatchAnnotateImages(AsyncBatchAnnotateImagesRequest) returns (Operation)

Esegui il rilevamento e l'annotazione asincroni delle immagini per un elenco di immagini.

L'avanzamento e i risultati possono essere recuperati tramite l'interfaccia google.longrunning.Operations. Operation.metadata contiene OperationMetadata (metadati). Operation.response contiene AsyncBatchAnnotateImagesResponse (risultati).

Questo servizio scrive gli output di annotazione delle immagini in file JSON nel bucket Google Cloud Storage del cliente. Ogni file JSON contiene il proto BatchAnnotateImagesResponse.

Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

BatchAnnotateFiles

rpc BatchAnnotateFiles(BatchAnnotateFilesRequest) returns (BatchAnnotateFilesResponse)

Servizio che esegue il rilevamento e l'annotazione delle immagini per un batch di file. Ora sono supportati solo "application/pdf", "image/tiff" e "image/gif".

Questo servizio estrae al massimo i primi 10 fotogrammi (GIF) o pagine (PDF o TIFF) da ogni file fornito ed esegue il rilevamento e l'annotazione per ogni immagine estratta.

Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

BatchAnnotateImages

rpc BatchAnnotateImages(BatchAnnotateImagesRequest) returns (BatchAnnotateImagesResponse)

Esegui il rilevamento e l'annotazione delle immagini per un batch di immagini.

Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

Google Product Search

Gestisce i prodotti e i set di prodotti di immagini di riferimento da utilizzare nella ricerca di prodotti. Utilizza il seguente modello di risorsa:

  • L'API ha una raccolta di risorse ProductSet, denominate projects/*/locations/*/productSets/*, che funge da modo per raggruppare diversi prodotti per limitarne l'identificazione.

Parallelamente,

  • L'API ha una raccolta di risorse Product, denominata projects/*/locations/*/products/*

  • Ogni Product ha una raccolta di risorse ReferenceImage, denominata projects/*/locations/*/products/*/referenceImages/*.

AddProductToProductSet

rpc AddProductToProductSet(AddProductToProductSetRequest) returns (Empty)

Aggiunge un prodotto al ProductSet specificato. Se il prodotto è già presente, non viene apportata alcuna modifica.

Un prodotto può essere aggiunto a un massimo di 100 ProductSet.

Possibili errori:

  • Restituisce NOT_FOUND se il prodotto o il ProductSet non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

CreateProduct

rpc CreateProduct(CreateProductRequest) returns (Product)

Crea e restituisce una nuova risorsa prodotto.

Possibili errori:

  • Restituisce INVALID_ARGUMENT se display_name non è presente o supera i 4096 caratteri.
  • Restituisce INVALID_ARGUMENT se la descrizione contiene più di 4096 caratteri.
  • Restituisce INVALID_ARGUMENT se product_category è mancante o non valido.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

CreateProductSet

rpc CreateProductSet(CreateProductSetRequest) returns (ProductSet)

Crea e restituisce una nuova risorsa ProductSet.

Possibili errori:

  • Restituisce INVALID_ARGUMENT se display_name non è presente o supera i 4096 caratteri.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

CreateReferenceImage

rpc CreateReferenceImage(CreateReferenceImageRequest) returns (ReferenceImage)

Crea e restituisce una nuova risorsa ReferenceImage.

Il campo bounding_poly è facoltativo. Se bounding_poly non è specificato, il sistema tenterà di rilevare le regioni di interesse nell'immagine compatibili con product_category nel prodotto principale. Se viene specificato, il rilevamento viene SEMPRE ignorato. Il sistema converte i poligoni in rettangoli non ruotati.

Tieni presente che la pipeline ridimensionerà l'immagine se la risoluzione è troppo elevata per essere elaborata (superiore a 50 MP).

Possibili errori:

  • Restituisce INVALID_ARGUMENT se image_uri è mancante o più lungo di 4096 caratteri.
  • Restituisce INVALID_ARGUMENT se il prodotto non esiste.
  • Restituisce INVALID_ARGUMENT se bounding_poly non viene fornito e non viene rilevato nulla di compatibile con product_category del prodotto principale.
  • Restituisce INVALID_ARGUMENT se bounding_poly contiene più di 10 poligoni.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

DeleteProduct

rpc DeleteProduct(DeleteProductRequest) returns (Empty)

Elimina definitivamente un prodotto e le relative immagini di riferimento.

I metadati del prodotto e tutte le relative immagini verranno eliminati immediatamente, ma le query di ricerca nei ProductSet contenenti il prodotto potrebbero comunque funzionare finché tutte le cache correlate non vengono aggiornate.

Possibili errori:

  • Restituisce NOT_FOUND se il prodotto non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

DeleteProductSet

rpc DeleteProductSet(DeleteProductSetRequest) returns (Empty)

Elimina definitivamente un ProductSet. I prodotti e le ReferenceImage nel ProductSet non vengono eliminati.

I file immagine effettivi non vengono eliminati da Google Cloud Storage.

Possibili errori:

  • Restituisce NOT_FOUND se ProductSet non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

DeleteReferenceImage

rpc DeleteReferenceImage(DeleteReferenceImageRequest) returns (Empty)

Elimina definitivamente un'immagine di riferimento.

I metadati dell'immagine verranno eliminati immediatamente, ma le query di ricerca sui ProductSet contenenti l'immagine potrebbero comunque funzionare finché tutte le cache correlate non vengono aggiornate.

I file immagine effettivi non vengono eliminati da Google Cloud Storage.

Possibili errori:

  • Restituisce NOT_FOUND se l'immagine di riferimento non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

GetProduct

rpc GetProduct(GetProductRequest) returns (Product)

Recupera le informazioni associate a un prodotto.

Possibili errori:

  • Restituisce NOT_FOUND se il prodotto non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

GetProductSet

rpc GetProductSet(GetProductSetRequest) returns (ProductSet)

Recupera le informazioni associate a un ProductSet.

Possibili errori:

  • Restituisce NOT_FOUND se ProductSet non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

GetReferenceImage

rpc GetReferenceImage(GetReferenceImageRequest) returns (ReferenceImage)

Recupera le informazioni associate a un ReferenceImage.

Possibili errori:

  • Restituisce NOT_FOUND se l'immagine specificata non esiste.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

ImportProductSets

rpc ImportProductSets(ImportProductSetsRequest) returns (Operation)

API asincrona che importa un elenco di immagini di riferimento in set di prodotti specificati in base a un elenco di informazioni sulle immagini.

L'API google.longrunning.Operation può essere utilizzata per monitorare l'avanzamento e i risultati della richiesta. Operation.metadata contiene BatchOperationMetadata. (avanzamento) Operation.response contiene ImportProductSetsResponse. (risultati)

L'origine di input di questo metodo è un file CSV su Google Cloud Storage. Per il formato del file CSV, vedi ImportProductSetsGcsSource.csv_file_uri.

Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

ListProductSets

rpc ListProductSets(ListProductSetsRequest) returns (ListProductSetsResponse)

Elenca i ProductSet in un ordine non specificato.

Possibili errori:

  • Restituisce INVALID_ARGUMENT se page_size è maggiore di 100 o minore di 1.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

ListProducts

rpc ListProducts(ListProductsRequest) returns (ListProductsResponse)

Elenca i prodotti in un ordine non specificato.

Possibili errori:

  • Restituisce INVALID_ARGUMENT se page_size è maggiore di 100 o minore di 1.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

ListProductsInProductSet

rpc ListProductsInProductSet(ListProductsInProductSetRequest) returns (ListProductsInProductSetResponse)

Elenca i prodotti in un ProductSet, in un ordine non specificato. Se ProductSet non esiste, il campo products della risposta sarà vuoto.

Possibili errori:

  • Restituisce INVALID_ARGUMENT se page_size è maggiore di 100 o minore di 1.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

ListReferenceImages

rpc ListReferenceImages(ListReferenceImagesRequest) returns (ListReferenceImagesResponse)

Elenca le immagini di riferimento.

Possibili errori:

  • Restituisce NOT_FOUND se il prodotto principale non esiste.
  • Restituisce INVALID_ARGUMENT se page_size è maggiore di 100 o minore di 1.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

RemoveProductFromProductSet

rpc RemoveProductFromProductSet(RemoveProductFromProductSetRequest) returns (Empty)

Rimuove un prodotto dal ProductSet specificato.

Possibili errori:

  • Restituisce NOT_FOUND se il prodotto non viene trovato in ProductSet.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

UpdateProduct

rpc UpdateProduct(UpdateProductRequest) returns (Product)

Apporta modifiche a una risorsa Product. Al momento è possibile aggiornare solo i campi display_name, description e labels.

Se le etichette vengono aggiornate, la modifica non verrà visualizzata nelle query fino al successivo aggiornamento dell'indice.

Possibili errori:

  • Restituisce NOT_FOUND se il prodotto non esiste.
  • Restituisce INVALID_ARGUMENT se display_name è presente in update_mask, ma manca nella richiesta o supera i 4096 caratteri.
  • Restituisce INVALID_ARGUMENT se la descrizione è presente in update_mask, ma è più lunga di 4096 caratteri.
  • Restituisce INVALID_ARGUMENT se product_category è presente in update_mask.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

UpdateProductSet

rpc UpdateProductSet(UpdateProductSetRequest) returns (ProductSet)

Apporta modifiche a una risorsa ProductSet. Al momento è possibile aggiornare solo display_name.

Possibili errori:

  • Restituisce NOT_FOUND se ProductSet non esiste.
  • Restituisce INVALID_ARGUMENT se display_name è presente in update_mask, ma manca nella richiesta o è più lungo di 4096 caratteri.
Ambiti di autorizzazione

Richiede uno dei seguenti ambiti OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

Per saperne di più, consulta Panoramica dell'autenticazione.

AddProductToProductSetRequest

Messaggio di richiesta per il metodo AddProductToProductSet.

Campi
name

string

Il nome della risorsa per il ProductSet da modificare.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

product

string

Il nome della risorsa del prodotto da aggiungere a questo ProductSet.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

AnnotateFileRequest

Una richiesta di annotazione di un singolo file, ad esempio un file PDF, TIFF o GIF.

Campi
input_config

InputConfig

Obbligatorio. Informazioni sul file di input.

features[]

Feature

Obbligatorio. Funzionalità richieste.

image_context

ImageContext

Contesto aggiuntivo che può accompagnare le immagini nel file.

pages[]

int32

Pagine del file su cui eseguire l'annotazione delle immagini.

Le pagine iniziano da 1, quindi la prima pagina del file è la pagina 1. Per richiesta sono supportate al massimo 5 pagine. Le pagine possono essere negative.

Pagina 1 indica la prima pagina. Pagina 2 indica la seconda pagina. La pagina -1 indica l'ultima pagina. La pagina -2 indica la penultima pagina.

Se il file è GIF anziché PDF o TIFF, la pagina si riferisce ai frame GIF.

Se questo campo è vuoto, per impostazione predefinita il servizio esegue l'annotazione delle immagini per le prime 5 pagine del file.

AnnotateFileResponse

Risposta a una singola richiesta di annotazione del file. Un file può contenere una o più immagini, ognuna con le proprie risposte.

Campi
input_config

InputConfig

Informazioni sul file per cui viene generata questa risposta.

responses[]

AnnotateImageResponse

Singole risposte alle immagini trovate all'interno del file.

AnnotateImageRequest

Richiesta di esecuzione di attività dell'API Google Cloud Vision su un'immagine fornita dall'utente, con le funzionalità richieste dall'utente e con informazioni contestuali.

Campi
image

Image

L'immagine da elaborare.

features[]

Feature

Funzionalità richieste.

image_context

ImageContext

Contesto aggiuntivo che può accompagnare l'immagine.

custom_label_detection_models[]

string

Quando effettui una richiesta con un valore CUSTOM_LABEL_DETECTION nel campo features.type, il campo CustomLabelDetectionModels deve specificare i modelli personalizzati da utilizzare. Il formato del nome del modello imita l'URL della risorsa del modello personalizzato: /projects/PROJECT_ID/models/MODEL_ID o /models/MODEL_ID se il modello appartiene al progetto corrente.

AnnotateImageResponse

Risposta a una richiesta di annotazione per l'immagine.

Campi
face_annotations[]

FaceAnnotation

Se presente, il rilevamento del volto è stato completato correttamente.

landmark_annotations[]

EntityAnnotation

Se presente, il rilevamento dei punti di riferimento è stato completato correttamente.

logo_annotations[]

EntityAnnotation

Se presente, il rilevamento del logo è stato completato correttamente.

label_annotations[]

EntityAnnotation

Se presente, il rilevamento delle etichette è stato completato correttamente.

localized_object_annotations[]

LocalizedObjectAnnotation

Se presente, il rilevamento degli oggetti localizzato è stato completato correttamente. Verranno ordinati in ordine decrescente in base al punteggio di confidenza.

custom_label_annotations[]

CustomEntityAnnotation

Se presente, l'annotazione personalizzata è stata completata correttamente.

text_annotations[]

EntityAnnotation

Se presente, il rilevamento del testo (OCR) è stato completato correttamente.

full_text_annotation

TextAnnotation

Se presente, il rilevamento del testo (OCR) o del testo del documento (OCR) è stato completato correttamente. Questa annotazione fornisce la gerarchia strutturale per il testo rilevato tramite OCR.

safe_search_annotation

SafeSearchAnnotation

Se presente, l'annotazione SafeSearch è stata completata correttamente.

image_properties_annotation

ImageProperties

Se presenti, le proprietà dell'immagine sono state estratte correttamente.

crop_hints_annotation

CropHintsAnnotation

Se presenti, i suggerimenti per il ritaglio sono stati completati correttamente.

web_detection

WebDetection

Se presente, il rilevamento web è stato completato correttamente.

product_search_results

ProductSearchResults

Se presente, la ricerca di prodotti è stata completata correttamente.

error

Status

Se impostato, rappresenta il messaggio di errore per l'operazione. Tieni presente che le annotazioni delle immagini compilate sono garantite come corrette, anche quando è impostato error.

context

ImageAnnotationContext

Se presenti, le informazioni contestuali sono necessarie per capire da dove proviene questa immagine.

image_quality_annotation

ImageQuality

Se presente, il calcolo della qualità dell'immagine è stato completato correttamente.

object_attribute_annotations[]

EntityAnnotation

Se presente, il calcolo degli attributi degli oggetti è stato completato correttamente. Il valore degli attributi verrà inserito in EntityAnnotation.properties. Esempio: object_attribute_annotations { properties { name: "color" value: "blue" confidence: 0.1 } properties { name: "color" value: "white" confidence: 0.2 } properties { name: "material" value: "silk" confidence: 0.3 } }

quality_optimization_result

QualityOptimizationResult

Se presente, l'ottimizzazione della qualità dell'immagine è stata completata correttamente.

localized_barcode_annotations[]

LocalizedBarcodeAnnotation

Se presente, il rilevamento del codice a barre localizzato è stato completato correttamente.

AsyncAnnotateFileRequest

Una richiesta di annotazione di file offline.

Campi
input_config

InputConfig

Obbligatorio. Informazioni sul file di input.

features[]

Feature

Obbligatorio. Funzionalità richieste.

image_context

ImageContext

Contesto aggiuntivo che può accompagnare le immagini nel file.

output_config

OutputConfig

Obbligatorio. La posizione di output e i metadati desiderati (ad es. il formato).

AsyncAnnotateFileResponse

La risposta a una singola richiesta di annotazione di file offline.

Campi
output_config

OutputConfig

La posizione di output e i metadati di AsyncAnnotateFileRequest.

AsyncBatchAnnotateFilesRequest

Più richieste di annotazione asincrona dei file vengono raggruppate in una singola chiamata di servizio.

Campi
requests[]

AsyncAnnotateFileRequest

Singole richieste asincrone di annotazione dei file per questo batch.

AsyncBatchAnnotateFilesResponse

Risposta a una richiesta di annotazione di file batch asincrona.

Campi
responses[]

AsyncAnnotateFileResponse

L'elenco delle risposte di annotazione dei file, una per ogni richiesta in AsyncBatchAnnotateFilesRequest.

AsyncBatchAnnotateImagesRequest

Richiesta di annotazione asincrona di immagini per un elenco di immagini.

Campi
requests[]

AnnotateImageRequest

Singole richieste di annotazione per le immagini di questo batch.

output_config

OutputConfig

Obbligatorio. La posizione di output e i metadati desiderati (ad es. il formato).

AsyncBatchAnnotateImagesResponse

Risposta a una richiesta batch asincrona di annotazione di immagini.

Campi
output_config

OutputConfig

La posizione di output e i metadati di AsyncBatchAnnotateImagesRequest.

BatchAnnotateFilesRequest

Un elenco di richieste per annotare i file utilizzando l'API BatchAnnotateFiles.

Campi
requests[]

AnnotateFileRequest

L'elenco delle richieste di annotazione dei file. Al momento supportiamo solo una richiesta AnnotateFileRequest in BatchAnnotateFilesRequest.

BatchAnnotateFilesResponse

Un elenco di risposte alle annotazioni dei file.

Campi
responses[]

AnnotateFileResponse

L'elenco delle risposte di annotazione dei file, ciascuna risposta corrispondente a ogni AnnotateFileRequest in BatchAnnotateFilesRequest.

BatchAnnotateImagesRequest

Più richieste di annotazione di immagini vengono raggruppate in una singola chiamata di servizio.

Campi
requests[]

AnnotateImageRequest

Singole richieste di annotazione per le immagini di questo batch.

BatchAnnotateImagesResponse

Risposta a una richiesta batch di annotazione per immagine.

Campi
responses[]

AnnotateImageResponse

Risposte individuali alle richieste di annotazione delle immagini all'interno del batch.

BatchOperationMetadata

Metadati per le operazioni batch, ad esempio lo stato attuale.

Questo è incluso nel campo metadata di Operation restituito dalla chiamata GetOperation del servizio google::longrunning::Operations.

Campi
state

State

Lo stato attuale dell'operazione batch.

submit_time

Timestamp

L'ora in cui la richiesta batch è stata inviata al server.

end_time

Timestamp

L'ora in cui la richiesta batch è terminata e google.longrunning.Operation.done è impostato su true.

Stato

Elenca i possibili stati in cui può trovarsi la richiesta batch.

Enum
STATE_UNSPECIFIED Non valido.
PROCESSING La richiesta è in fase di elaborazione.
SUCCESSFUL La richiesta è stata completata e almeno un elemento è stato elaborato correttamente.
FAILED La richiesta è stata completata e nessun elemento è stato elaborato correttamente.
CANCELLED La richiesta viene completata dopo che l'utente ha chiamato longrunning.Operations.CancelOperation. Tutti i record elaborati prima del comando di annullamento vengono restituiti come specificato nella richiesta.

Blocca

Elemento logico della pagina.

Campi
property

TextProperty

Informazioni aggiuntive rilevate per il blocco.

bounding_box

BoundingPoly

Il riquadro di delimitazione del blocco. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio:

  • quando il testo è orizzontale, potrebbe apparire così:
    0----1
    |    |
    3----2
  • quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa:
    2----3
    |    |
    1----0

e l'ordine dei vertici sarà ancora (0, 1, 2, 3).

paragraphs[]

Paragraph

Elenco dei paragrafi in questo blocco (se il blocco è di tipo testo).

block_type

BlockType

Il tipo di blocco rilevato (testo, immagine e così via) per questo blocco.

confidence

float

Affidabilità dei risultati dell'OCR sul blocco. Intervallo [0, 1].

table

Table

Tabella rilevata per TABLE block_type. Questo campo non viene restituito per impostazione predefinita, a meno che non sia abilitato tramite TextDetectionParams.table_detection_options. Il bounding_box per questo blocco saranno i limiti rilevati per questa tabella.

key_value_pair

KeyValuePair

Coppia rilevata per block_type KEY_VALUE_PAIR. Per impostazione predefinita, questo campo non viene restituito a meno che non venga specificato DocumentType.

merged_text

string

Tutto il testo UTF-8 rilevato in questo blocco. Questo campo non viene restituito per impostazione predefinita, a meno che non sia specificato in TextDetectionParams.block_filter.

BlockType

Tipo di blocco (testo, immagine e così via) identificato dall'OCR.

Enum
UNKNOWN Tipo di blocco sconosciuto.
TEXT Blocco di testo normale.
TABLE Blocco tabella.
PICTURE Blocco immagine.
RULER Casella della linea orizzontale/verticale.
BARCODE Blocco del codice a barre.
KEY_VALUE_PAIR Un blocco di coppie chiave-valore.

BoundingPoly

Un poligono di delimitazione per l'annotazione dell'immagine rilevata.

Campi
vertices[]

Vertex

I vertici del poligono di delimitazione.

normalized_vertices[]

NormalizedVertex

I vertici normalizzati del poligono di delimitazione.

ColorInfo

Le informazioni sul colore sono costituite da canali RGB, punteggio e frazione dell'immagine occupata dal colore.

Campi
color

Color

Componenti RGB del colore.

score

float

Punteggio specifico per l'immagine per questo colore. Valore compreso nell'intervallo [0, 1].

pixel_fraction

float

La frazione di pixel occupata dal colore nell'immagine. Valore compreso nell'intervallo [0, 1].

CreateProductRequest

Messaggio di richiesta per il metodo CreateProduct.

Campi
parent

string

Il progetto in cui deve essere creato il prodotto.

Il formato è projects/PROJECT_ID/locations/LOC_ID.

product

Product

Il prodotto da creare.

product_id

string

Un ID risorsa fornito dall'utente per questo prodotto. Se impostato, il server tenterà di utilizzare questo valore come ID risorsa. Se è già in uso, viene restituito un errore con il codice ALREADY_EXISTS. Deve avere una lunghezza massima di 128 caratteri. Non può contenere il carattere /.

CreateProductSetRequest

Messaggio di richiesta per il metodo CreateProductSet.

Campi
parent

string

Il progetto in cui deve essere creato il ProductSet.

Il formato è projects/PROJECT_ID/locations/LOC_ID.

product_set

ProductSet

Il ProductSet da creare.

product_set_id

string

Un ID risorsa fornito dall'utente per questo ProductSet. Se impostato, il server tenterà di utilizzare questo valore come ID risorsa. Se è già in uso, viene restituito un errore con il codice ALREADY_EXISTS. Deve avere una lunghezza massima di 128 caratteri. Non può contenere il carattere /.

CreateReferenceImageRequest

Messaggio di richiesta per il metodo CreateReferenceImage.

Campi
parent

string

Nome della risorsa del prodotto in cui creare l'immagine di riferimento.

Il formato è projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

reference_image

ReferenceImage

L'immagine di riferimento da creare. Se viene specificato un ID immagine, viene ignorato.

reference_image_id

string

Un ID risorsa fornito dall'utente per l'immagine di riferimento da aggiungere. Se impostato, il server tenterà di utilizzare questo valore come ID risorsa. Se è già in uso, viene restituito un errore con il codice ALREADY_EXISTS. Deve avere una lunghezza massima di 128 caratteri. Non può contenere il carattere /.

CropHint

Suggerimento di ritaglio singolo utilizzato per generare un nuovo ritaglio durante la pubblicazione di un'immagine.

Campi
bounding_poly

BoundingPoly

Il poligono di delimitazione per l'area di ritaglio. Le coordinate del riquadro di delimitazione sono nella scala dell'immagine originale.

confidence

float

Confidenza che si tratti di una regione saliente. Intervallo [0, 1].

importance_fraction

float

Frazione di importanza di questa regione saliente rispetto all'immagine originale.

CropHintsAnnotation

Insieme di suggerimenti di ritaglio utilizzati per generare nuovi ritagli durante la pubblicazione delle immagini.

Campi
crop_hints[]

CropHint

Risultati dei suggerimenti di ritaglio.

CropHintsParams

Parametri per la richiesta di annotazione dei suggerimenti di ritaglio.

Campi
aspect_ratios[]

float

Proporzioni in numeri decimali, che rappresentano il rapporto tra la larghezza e l'altezza dell'immagine. Ad esempio, se le proporzioni desiderate sono 4/3, il valore float corrispondente deve essere 1,33333. Se non specificato, viene restituito il ritaglio migliore possibile. Il numero di formati forniti è limitato a un massimo di 16; i formati forniti dopo il sedicesimo vengono ignorati.

CustomEntityAnnotation

Un CustomEntityAnnotation contiene annotazioni previste utilizzando modelli Vision personalizzati.

Campi
model

string

Identifica il modello personalizzato utilizzato per creare questa annotazione. Il formato del nome del modello è l'URL della risorsa della modalità personalizzata sottoposta a query: /projects/PROJECT_ID/models/MODEL_ID o /models/MODEL_ID se il modello appartiene al progetto corrente.

label

string

L'etichetta prevista dal modello personalizzato.

score

float

Il punteggio di affidabilità dell'etichetta in base al modello personalizzato.

DeleteProductRequest

Messaggio di richiesta per il metodo DeleteProduct.

Campi
name

string

Nome della risorsa del prodotto da eliminare.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

DeleteProductSetRequest

Messaggio di richiesta per il metodo DeleteProductSet.

Campi
name

string

Nome della risorsa del ProductSet da eliminare.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

DeleteReferenceImageRequest

Messaggio di richiesta per il metodo DeleteReferenceImage.

Campi
name

string

Il nome della risorsa dell'immagine di riferimento da eliminare.

Il formato è:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID

DocumentParsingParams

Parametri per la funzionalità DOCUMENT_PARSING.

Campi
disable_orientation_detection

bool

Disattiva il rilevamento dell'orientamento in modo che il testo ruotato non venga rilevato.

table_detection_options

TableDetectionOptions

Controlla il comportamento di rilevamento delle tabelle. Il rilevamento delle tabelle è disattivato se questo campo non è impostato.

document_type

string

Specifica un tipo di documento noto per un rilevamento più approfondito della struttura. I valori validi sono attualmente "invoice" o "general".

DominantColorsAnnotation

Set di colori dominanti e relativi punteggi.

Campi
colors[]

ColorInfo

Valori di colore RGB con il relativo punteggio e frazione di pixel.

EntityAnnotation

Insieme di funzionalità dell'entità rilevata.

Campi
mid

string

ID entità opaco. Alcuni ID potrebbero essere disponibili nell'API Google Knowledge Graph Search.

locale

string

Il codice lingua delle impostazioni internazionali in cui è espresso il testo dell'entità description.

description

string

Descrizione testuale dell'entità, espressa nella lingua locale.

score

float

Punteggio complessivo del risultato. Intervallo [0, 1].

confidence
(deprecated)

float

Ritirato. Utilizza invece score. La precisione del rilevamento delle entità in un'immagine. Ad esempio, per un'immagine in cui viene rilevata l'entità "Torre Eiffel", questo campo rappresenta la certezza che nell'immagine della query sia presente una torre. Intervallo [0, 1].

topicality

float

La pertinenza dell'etichetta ICA (Image Content Annotation) per l'immagine. Ad esempio, la pertinenza di "torre" è probabilmente maggiore per un'immagine contenente la "Torre Eiffel" rilevata rispetto a un'immagine contenente un edificio torreggiante distante rilevato, anche se la confidenza che ci sia una torre in ogni immagine potrebbe essere la stessa. Intervallo [0, 1].

bounding_poly

BoundingPoly

La regione dell'immagine a cui appartiene questa entità. Non prodotto per le funzionalità di LABEL_DETECTION.

locations[]

LocationInfo

Le informazioni sulla posizione dell'entità rilevata. Possono essere presenti più elementi LocationInfo perché una posizione può indicare la posizione della scena nell'immagine e un'altra posizione può indicare la posizione del luogo in cui è stata scattata l'immagine. Le informazioni sulla posizione sono generalmente presenti per i punti di riferimento.

properties[]

Property

Alcune entità potrebbero avere campi Property (nome/valore) facoltativi forniti dall'utente, ad esempio un punteggio o una stringa che qualifica l'entità.

FaceAnnotation

Un oggetto di annotazione del volto contiene i risultati del rilevamento del volto.

Campi
bounding_poly

BoundingPoly

Il poligono di delimitazione intorno al volto. Le coordinate del riquadro di delimitazione sono nella scala dell'immagine originale. Il riquadro di delimitazione viene calcolato per "inquadrare" il volto in base alle aspettative umane. Si basa sui risultati del punto di riferimento. Tieni presente che una o più coordinate x e/o y potrebbero non essere generate in BoundingPoly (il poligono non sarà delimitato) se nell'immagine da annotare viene visualizzato solo un volto parziale.

fd_bounding_poly

BoundingPoly

Il poligono di delimitazione fd_bounding_poly è più stretto del boundingPoly e racchiude solo la parte di pelle del viso. In genere, viene utilizzato per eliminare il volto da qualsiasi analisi delle immagini che rileva la "quantità di pelle" visibile in un'immagine. Non si basa sui risultati del punto di riferimento, ma solo sul rilevamento iniziale del volto, quindi

fd

(face detection) prefix.

landmarks[]

Landmark

Punti di riferimento del volto rilevati.

roll_angle

float

Angolo di rollio, che indica la quantità di rotazione in senso orario/antiorario del volto rispetto alla verticale dell'immagine attorno all'asse perpendicolare al volto. Intervallo [-180,180].

pan_angle

float

L'angolo di imbardata, che indica l'angolo verso sinistra/destra in cui è rivolto il volto rispetto al piano verticale perpendicolare all'immagine. Intervallo [-180,180].

tilt_angle

float

L'angolo di beccheggio, che indica l'angolazione verso l'alto o verso il basso del volto rispetto al piano orizzontale dell'immagine. Intervallo [-180,180].

detection_confidence

float

Affidabilità del rilevamento. Intervallo [0, 1].

landmarking_confidence

float

Confidenza del rilevamento dei punti del volto. Intervallo [0, 1].

joy_likelihood

Likelihood

Probabilità di gioia.

sorrow_likelihood

Likelihood

Probabilità di tristezza.

anger_likelihood

Likelihood

Probabilità di rabbia.

surprise_likelihood

Likelihood

Probabilità di sorpresa.

under_exposed_likelihood

Likelihood

Probabilità di sottosposizione.

blurred_likelihood

Likelihood

Probabilità sfocata.

headwear_likelihood

Likelihood

Probabilità di indossare un copricapo.

Punto di riferimento

Un punto di riferimento specifico per il volto (ad esempio, una caratteristica del viso).

Campi
type

Type

Tipo di punto di riferimento del viso.

position

Position

Posizione dei punti di riferimento del volto.

Tipo

Tipo di punto di riferimento (caratteristica) del viso. Sinistra e destra sono definite dal punto di vista dello spettatore dell'immagine senza considerare le proiezioni speculari tipiche delle foto. Quindi, LEFT_EYE è in genere l'occhio destro della persona.

Enum
UNKNOWN_LANDMARK È stato rilevato un punto di riferimento del volto sconosciuto. Non deve essere compilato.
LEFT_EYE Occhio sinistro.
RIGHT_EYE Occhio destro.
LEFT_OF_LEFT_EYEBROW A sinistra del sopracciglio sinistro.
RIGHT_OF_LEFT_EYEBROW A destra del sopracciglio sinistro.
LEFT_OF_RIGHT_EYEBROW A sinistra del sopracciglio destro.
RIGHT_OF_RIGHT_EYEBROW Sopracciglio destro.
MIDPOINT_BETWEEN_EYES Punto medio tra gli occhi.
NOSE_TIP Punta del naso.
UPPER_LIP Labbro superiore.
LOWER_LIP Labbro inferiore.
MOUTH_LEFT Bocca a sinistra.
MOUTH_RIGHT Bocca a destra.
MOUTH_CENTER Centro della bocca.
NOSE_BOTTOM_RIGHT Naso, in basso a destra.
NOSE_BOTTOM_LEFT Naso, in basso a sinistra.
NOSE_BOTTOM_CENTER Naso, in basso al centro.
LEFT_EYE_TOP_BOUNDARY Occhio sinistro, limite superiore.
LEFT_EYE_RIGHT_CORNER Occhio sinistro, angolo destro.
LEFT_EYE_BOTTOM_BOUNDARY Occhio sinistro, limite inferiore.
LEFT_EYE_LEFT_CORNER Occhio sinistro, angolo sinistro.
RIGHT_EYE_TOP_BOUNDARY Occhio destro, limite superiore.
RIGHT_EYE_RIGHT_CORNER Occhio destro, angolo destro.
RIGHT_EYE_BOTTOM_BOUNDARY Occhio destro, limite inferiore.
RIGHT_EYE_LEFT_CORNER Occhio destro, angolo sinistro.
LEFT_EYEBROW_UPPER_MIDPOINT Sopracciglio sinistro, punto medio superiore.
RIGHT_EYEBROW_UPPER_MIDPOINT Sopracciglio destro, punto medio superiore.
LEFT_EAR_TRAGION Trago dell'orecchio sinistro.
RIGHT_EAR_TRAGION Trago dell'orecchio destro.
LEFT_EYE_PUPIL Pupilla dell'occhio sinistro.
RIGHT_EYE_PUPIL Pupilla dell'occhio destro.
FOREHEAD_GLABELLA Glabella della fronte.
CHIN_GNATHION Gnatio del mento.
CHIN_LEFT_GONION Gonio sinistro del mento.
CHIN_RIGHT_GONION Gonion mento destro.

Funzionalità

Il tipo di rilevamento dell'API Google Cloud Vision da eseguire e il numero massimo di risultati da restituire per quel tipo. È possibile specificare più oggetti Feature nell'elenco features.

Campi
type

Type

Il tipo di funzionalità.

max_results

int32

Numero massimo di risultati di questo tipo. Non si applica a TEXT_DETECTION, DOCUMENT_TEXT_DETECTION o CROP_HINTS.

model

string

Il modello da utilizzare per la funzionalità. Valori supportati: "builtin/stable" (il valore predefinito se non impostato) e "builtin/latest".

Tipo

Tipo di funzionalità dell'API Google Cloud Vision da estrarre.

Enum
TYPE_UNSPECIFIED Tipo di funzionalità non specificato.
FACE_DETECTION Esegui il riconoscimento facciale.
LANDMARK_DETECTION Esegui il rilevamento dei punti di riferimento.
LOGO_DETECTION Esegui il rilevamento dei loghi.
LABEL_DETECTION Esegui il rilevamento etichette.
TEXT_DETECTION Esegui il rilevamento del testo / il riconoscimento ottico dei caratteri (OCR). Il rilevamento del testo è ottimizzato per aree di testo all'interno di un'immagine più grande. Se l'immagine è un documento, utilizza invece DOCUMENT_TEXT_DETECTION.
DOCUMENT_TEXT_DETECTION Esegui l'OCR sui documenti di testo ad alta densità. Ha la precedenza quando sono presenti sia DOCUMENT_TEXT_DETECTION che TEXT_DETECTION.
SAFE_SEARCH_DETECTION Esegui SafeSearch per rilevare contenuti potenzialmente non sicuri o indesiderati.
IMAGE_PROPERTIES Calcola un insieme di proprietà relative all'immagine, come i colori predominanti dell'immagine.
CROP_HINTS Esegui i suggerimenti di ritaglio.
WEB_DETECTION Esegui il rilevamento web.
CUSTOM_LABEL_DETECTION Esegui il rilevamento delle etichette personalizzate.
OBJECT_LOCALIZATION Esegui il localizzatore per il rilevamento di oggetti.
IMAGE_QUALITY Esegui il calcolo del punteggio di qualità.
OBJECT_ATTRIBUTES Calcola gli attributi degli oggetti rilevati nell'immagine. Sono supportati quattro domini di oggetti. Seleziona tramite Feature.model (obbligatorio): "builtin/apparel", "builtin/car", "builtin/food" o "builtin/wildlife".
QUALITY_OPTIMIZATION Esegui algoritmi di ottimizzazione della qualità. Esistono tre tipi di operazioni: COMPRESSIONE, MIGLIORAMENTO e PUNTEGGIO_QUALITÀ. I parametri COMPRESSION e ENHANCEMENT e la scelta del modello QUALITY_SCORE possono essere specificati in image_context.quality_optimization_params.
BARCODE_DETECTION Esegui il rilevamento e il riconoscimento dei codici a barre.
DOCUMENT_PARSING Esegui algoritmi di analisi dei documenti per estrarre dati strutturati come tabelle e moduli. I risultati si trovano in full_text_annotation -> page -> block con tipo TABLE per le tabelle o KEY_VALUE_PAIR per le coppie chiave-valore nei moduli.

GcsDestination

La posizione di Google Cloud Storage in cui verrà scritto l'output.

Campi
uri

string

URI Google Cloud Storage in cui verranno archiviati i risultati. I risultati saranno in formato JSON e preceduti dall'URI di input corrispondente. Questo campo può rappresentare un singolo file o un prefisso per più output. I prefissi devono terminare con un /.

Esempi:

Se ci sono più output, ogni risposta è comunque AnnotateFileResponse, ognuna delle quali contiene un sottoinsieme dell'elenco completo di AnnotateImageResponse. Possono verificarsi più output se, ad esempio, il JSON di output è troppo grande e si estende su più file suddivisi.

GcsSource

La posizione di Google Cloud Storage da cui verranno letti gli input.

Campi
uri

string

URI Google Cloud Storage per il file di input. Deve essere solo un oggetto Google Cloud Storage. I caratteri jolly non sono attualmente supportati.

GetProductRequest

Messaggio di richiesta per il metodo GetProduct.

Campi
name

string

Nome della risorsa del prodotto da ottenere.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

GetProductSetRequest

Messaggio di richiesta per il metodo GetProductSet.

Campi
name

string

Nome della risorsa del ProductSet da ottenere.

Il formato è: projects/PROJECT_ID/locations/LOG_ID/productSets/PRODUCT_SET_ID

GetReferenceImageRequest

Messaggio di richiesta per il metodo GetReferenceImage.

Campi
name

string

Il nome della risorsa ReferenceImage da ottenere.

Il formato è:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID.

Immagine

Immagine del client su cui eseguire le attività dell'API Google Cloud Vision.

Campi
content

bytes

Contenuti dell'immagine, rappresentati come un flusso di byte. Nota: come per tutti i campi bytes, i buffer di protocollo utilizzano una rappresentazione binaria pura, mentre le rappresentazioni JSON utilizzano base64.

source

ImageSource

Posizione dell'immagine Google Cloud Storage o URL dell'immagine accessibile pubblicamente. Se per un'immagine vengono forniti sia content che source, content ha la precedenza e viene utilizzato per eseguire la richiesta di annotazione dell'immagine.

ImageAnnotationContext

Se un'immagine è stata prodotta da un file (ad es. un PDF), questo messaggio fornisce informazioni sull'origine dell'immagine.

Campi
uri

string

L'URI del file utilizzato per produrre l'immagine.

page_number

int32

Se il file era un PDF o un TIFF, questo campo indica il numero di pagina all'interno del file utilizzato per produrre l'immagine.

ImageContext

Parametri specifici per il contesto dell'immagine e/o della funzionalità.

Campi
lat_long_rect

LatLongRect

Non utilizzato.

language_hints[]

string

Elenco delle lingue da utilizzare per TEXT_DETECTION. Nella maggior parte dei casi, un valore vuoto produce i risultati migliori, in quanto consente il rilevamento automatico della lingua. Per le lingue basate sull'alfabeto latino, l'impostazione language_hints non è necessaria. In rari casi, quando la lingua del testo nell'immagine è nota, l'impostazione di un suggerimento aiuterà a ottenere risultati migliori (anche se sarà un ostacolo significativo se il suggerimento è errato). Il rilevamento del testo restituisce un errore se una o più delle lingue specificate non sono tra le lingue supportate.

crop_hints_params

CropHintsParams

Parametri per la richiesta di annotazione dei suggerimenti di ritaglio.

product_search_params

ProductSearchParams

Parametri per la ricerca di prodotti.

web_detection_params

WebDetectionParams

Parametri per il rilevamento web.

text_detection_params

TextDetectionParams

Parametri per il rilevamento del testo in un documento.

quality_optimization_params

QualityOptimizationParams

Parametri per le ottimizzazioni della qualità delle immagini.

document_parsing_params

DocumentParsingParams

Parametri per l'analisi dei documenti.

ImageProperties

Memorizza le proprietà dell'immagine, come i colori dominanti.

Campi
dominant_colors

DominantColorsAnnotation

Se presenti, i colori dominanti sono stati completati correttamente.

ImageQuality

Memorizza i punteggi di qualità delle immagini, che possono essere di qualità estetica o tecnica.

Campi
quality_score

float

Un punteggio che rappresenta la qualità estetica/tecnica dell'immagine. Il punteggio è compreso nell'intervallo [0, 1]. Un valore più alto corrisponde a foto dall'aspetto più professionale. 0 indica che l'immagine è di qualità molto scadente, mentre 1 indica che l'immagine è di qualità molto elevata.

ImageSource

Origine immagine esterna (Google Cloud Storage o posizione dell'immagine nell'URL web).

Campi
gcs_image_uri

string

Utilizza invece image_uri.

L'URI Google Cloud Storage nel formato gs://bucket_name/object_name. Il controllo delle versioni degli oggetti non è supportato. Per ulteriori informazioni, consulta URI delle richieste Google Cloud Storage.

image_uri

string

L'URI dell'immagine di origine. Può essere:

  1. Un URI Google Cloud Storage nel formato gs://bucket_name/object_name. Il controllo delle versioni degli oggetti non è supportato. Per ulteriori informazioni, consulta URI delle richieste Google Cloud Storage.

  2. Un URL HTTP/HTTPS di un'immagine accessibile pubblicamente. Quando recupera le immagini dagli URL HTTP/HTTPS, Google non può garantire che la richiesta venga completata. La richiesta potrebbe non andare a buon fine se l'host specificato la rifiuta (ad es. a causa della limitazione delle richieste o della prevenzione di attacchi DoS) o se Google limita le richieste al sito per prevenire abusi. Non devi fare affidamento su immagini ospitate esternamente per le applicazioni di produzione.

Quando vengono specificati sia gcs_image_uri che image_uri, image_uri ha la precedenza.

ImportProductSetsGcsSource

La posizione Google Cloud Storage di un file CSV che conserva un elenco di ImportProductSetRequests in ogni riga.

Campi
csv_file_uri

string

L'URI Google Cloud Storage del file CSV di input.

L'URI deve iniziare con gs://.

Il formato del file CSV di input deve essere un'immagine per riga. Ogni riga contiene 8 colonne.

  1. image-uri
  2. image-id
  3. product-set-id
  4. product-id
  5. product-category
  6. product-display-name
  7. etichette
  8. bounding-poly

Le colonne image-uri, product-set-id, product-id e product-category sono obbligatorie. Tutte le altre colonne sono facoltative.

Se il ProductSet o il Product specificato dai valori product-set-id e product-id non esiste, il sistema creerà un nuovo ProductSet o Product per l'immagine. In questo caso, la colonna product-display-name si riferisce a display_name, la colonna product-category si riferisce a product_category e la colonna labels si riferisce a product_labels.

La colonna image-id è facoltativa, ma deve essere univoca se fornita. Se è vuoto, il sistema assegnerà automaticamente un ID univoco all'immagine.

La colonna product-display-name è facoltativa. Se è vuoto, il sistema imposta il campo display_name per il prodotto su uno spazio (" "). Puoi aggiornare il campo display_name in un secondo momento utilizzando l'API.

Se esiste già un Product con il product-id specificato, il sistema ignora le colonne product-display-name, product-category e labels.

La colonna labels (facoltativa) è una riga contenente un elenco di coppie chiave-valore separate da virgole, nel seguente formato:

"key_1=value_1,key_2=value_2,...,key_n=value_n"

La colonna bounding-poly (facoltativa) identifica una regione di interesse dell'immagine nello stesso modo di CreateReferenceImage. Se non specifichi la colonna bounding-poly, il sistema tenterà di rilevare automaticamente le regioni di interesse.

È consentita al massimo una colonna bounding-poly per riga. Se l'immagine contiene più regioni di interesse, aggiungi una riga al file CSV che includa le stesse informazioni sul prodotto e i valori bounding-poly per ogni regione di interesse.

La colonna bounding-poly deve contenere un numero pari di numeri separati da virgole, nel formato "p1_x,p1_y,p2_x,p2_y,...,pn_x,pn_y". Utilizza numeri interi non negativi per i poligoni di delimitazione assoluti e valori float compresi tra 0 e 1 per i poligoni di delimitazione normalizzati.

Il sistema ridimensionerà l'immagine se la risoluzione è troppo elevata per essere elaborata (superiore a 20 MP).

ImportProductSetsInputConfig

I contenuti di input per il metodo ImportProductSets.

Campi
gcs_source

ImportProductSetsGcsSource

La posizione Google Cloud Storage di un file CSV che conserva un elenco di ImportProductSetRequests in ogni riga.

ImportProductSetsRequest

Messaggio di richiesta per il metodo ImportProductSets.

Campi
parent

string

Il progetto in cui devono essere importati i ProductSet.

Il formato è projects/PROJECT_ID/locations/LOC_ID.

input_config

ImportProductSetsInputConfig

Il contenuto dell'input per l'elenco delle richieste.

ImportProductSetsResponse

Messaggio di risposta per il metodo ImportProductSets.

Questo messaggio viene restituito dal metodo google.longrunning.Operations.GetOperation nel campo google.longrunning.Operation.response restituito.

Campi
reference_images[]

ReferenceImage

L'elenco delle reference_images importate correttamente.

statuses[]

Status

Lo stato RPC per ogni richiesta ImportProductSet, inclusi gli esiti positivi e gli errori.

Il numero di stati qui corrisponde al numero di righe nel file CSV e statuses[i] memorizza lo stato di riuscita o non riuscita dell'elaborazione della i-esima riga del file CSV, a partire dalla riga 0.

InputConfig

La posizione e i metadati di input desiderati.

Campi
gcs_source

GcsSource

La posizione di Google Cloud Storage da cui leggere l'input.

content

bytes

Contenuti del file, rappresentati come un flusso di byte. Nota: come per tutti i campi bytes, i buffer di protocollo utilizzano una rappresentazione binaria pura, mentre le rappresentazioni JSON utilizzano base64.

Al momento, questo campo funziona solo per le richieste BatchAnnotateFiles. Non funziona per le richieste AsyncBatchAnnotateFiles.

mime_type

string

Il tipo di file. Al momento sono supportati solo "application/pdf" e "image/tiff". I caratteri jolly non sono supportati.

KeyValuePair

Proto per una coppia chiave-valore.

Campi
key

string

Il valore stringa della chiave.

key_block

Block

Blocco chiave della coppia contenente il riquadro di delimitazione normalizzato e il testo della chiave.

value_block

Block

Blocco di valori della coppia contenente il riquadro di delimitazione normalizzato e il testo del valore, comprese le strutture potenzialmente più profonde all'interno del testo del valore.

value_type

string

Tipo di valore. Le stringhe valide sono le seguenti:

"generic" (generico): per il testo generico mappato a un valore. "number" (numero) per i tipi numerici e "id" (ID) per gli identificatori generici. "currency" (valuta) per i valori di valuta. "date" (data) per le date. "time" (ora) per i valori di ora e durata. "date_range" per gli intervalli di date. "address" (indirizzo) per i valori di indirizzo (possono essere lunghi). "person" (persona) per nomi di persone o altri identificatori personali. "phone" (telefono) per i numeri di telefono.

normalized_key

string

(Facoltativo) Il testo della chiave normalizzato se il testo è comune e classificato.

Ad esempio, "TOTALE DOVUTO" verrà normalizzato in "Importo totale".

LatLongRect

Rettangolo determinato dalle coppie min e max LatLng.

Campi
min_lat_lng

LatLng

Coppia lat/long minima.

max_lat_lng

LatLng

Coppia latitudine/longitudine massima.

Probabilità

Una rappresentazione in bucket della probabilità, che ha lo scopo di fornire ai clienti risultati altamente stabili negli aggiornamenti del modello.

Enum
UNKNOWN Probabilità sconosciuta.
VERY_UNLIKELY È molto improbabile che l'immagine appartenga alla verticale specificata.
UNLIKELY È improbabile che l'immagine appartenga alla verticale specificata.
POSSIBLE È possibile che l'immagine appartenga alla verticale specificata.
LIKELY È probabile che l'immagine appartenga al verticale specificato.
VERY_LIKELY È molto probabile che l'immagine appartenga al verticale specificato.

ListProductSetsRequest

Messaggio di richiesta per il metodo ListProductSets.

Campi
parent

string

Il progetto da cui devono essere elencati i ProductSet.

Il formato è projects/PROJECT_ID/locations/LOC_ID.

page_size

int32

Il numero massimo di elementi da restituire. Il valore predefinito è 10, il valore massimo è 100.

page_token

string

Il token next_page_token restituito da una precedente richiesta List, se presente.

ListProductSetsResponse

Messaggio di risposta per il metodo ListProductSets.

Campi
product_sets[]

ProductSet

Elenco di ProductSet.

next_page_token

string

Token per recuperare la pagina successiva di risultati o vuoto se non sono presenti altri risultati nell'elenco.

ListProductsInProductSetRequest

Messaggio di richiesta per il metodo ListProductsInProductSet.

Campi
name

string

La risorsa ProductSet per cui recuperare i prodotti.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

page_size

int32

Il numero massimo di elementi da restituire. Il valore predefinito è 10, il valore massimo è 100.

page_token

string

Il token next_page_token restituito da una precedente richiesta List, se presente.

ListProductsInProductSetResponse

Messaggio di risposta per il metodo ListProductsInProductSet.

Campi
products[]

Product

L'elenco dei prodotti.

next_page_token

string

Token per recuperare la pagina successiva di risultati o vuoto se non sono presenti altri risultati nell'elenco.

ListProductsRequest

Messaggio di richiesta per il metodo ListProducts.

Campi
parent

string

Il progetto O ProductSet da cui devono essere elencati i prodotti.

Formato: projects/PROJECT_ID/locations/LOC_ID

page_size

int32

Il numero massimo di elementi da restituire. Il valore predefinito è 10, il valore massimo è 100.

page_token

string

Il token next_page_token restituito da una precedente richiesta List, se presente.

ListProductsResponse

Messaggio di risposta per il metodo ListProducts.

Campi
products[]

Product

Elenco dei prodotti.

next_page_token

string

Token per recuperare la pagina successiva di risultati o vuoto se non sono presenti altri risultati nell'elenco.

ListReferenceImagesRequest

Messaggio di richiesta per il metodo ListReferenceImages.

Campi
parent

string

Nome della risorsa del prodotto contenente le immagini di riferimento.

Il formato è projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

page_size

int32

Il numero massimo di elementi da restituire. Il valore predefinito è 10, il valore massimo è 100.

page_token

string

Un token che identifica una pagina di risultati da restituire. Questo è il valore di nextPageToken restituito in una precedente richiesta di elenco di immagini di riferimento.

Se non specificato, il valore predefinito è la prima pagina.

ListReferenceImagesResponse

Messaggio di risposta per il metodo ListReferenceImages.

Campi
reference_images[]

ReferenceImage

L'elenco delle immagini di riferimento.

page_size

int32

Il numero massimo di elementi da restituire. Il valore predefinito è 10, il valore massimo è 100.

next_page_token

string

Il token next_page_token restituito da una precedente richiesta List, se presente.

LocalizedBarcodeAnnotation

Insieme di codici a barre rilevati con riquadri di delimitazione.

Campi
format

string

Il formato del codice a barre descrive il formato di un codice a barre. I formati supportati sono: CODE_128: tipo Code 128. CODE_39: tipo Code 39. CODE_93: tipo di codice 93. CODABAR: tipo di Codabar. DATA_MATRIX: tipo Data Matrix 2D. ITF: tipo di ITF. EAN_13: tipo EAN-13. EAN_8: tipo EAN-8. QR_CODE: tipo di codice QR 2D. UPC_A: tipo UPC-A. UPC_E: tipo UPC-E. PDF417: tipo PDF417. AZTEC: tipo di codice Aztec 2D. DATABAR: tipo di codice GS1 DataBar.

value_format

string

L'ID formato del valore del codice a barre descrive il formato del valore codificato da un codice a barre. I formati dei valori supportati sono: CONTACT_INFO: dati di contatto. EMAIL: indirizzo email. ISBN: identificatore ISBN. PHONE: Numero di telefono. PRODOTTO: Prodotto. SMS: messaggio SMS. TEXT: Stringa di testo. URL: indirizzo URL. WIFI: informazioni sul Wi-Fi. GEO: Geolocalizzazione (longitudine e latitudine). CALENDAR_EVENT: evento nel calendario. DRIVER_LICENSE: patente di guida.

value

string

Il valore del codice a barre, ovvero il valore ASCII acquisito nel codice a barre. Il codice a barre può codificare valori strutturati, ad esempio "MEBKM:TITLE:Google;URL:https://www.google.com;;'.

confidence

float

Il valore di confidenza del risultato. Intervallo [0, 1].

bounding_poly

BoundingPoly

Regione dell'immagine a cui appartiene questo codice a barre. Questo campo deve essere compilato.

LocalizedObjectAnnotation

Insieme di oggetti rilevati con riquadri di delimitazione.

Campi
mid

string

ID oggetto che deve corrispondere al MID di EntityAnnotation.

language_code

string

Il codice lingua BCP-47, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

name

string

Nome dell'oggetto, espresso nella lingua language_code.

score

float

Punteggio del risultato. Intervallo [0, 1].

bounding_poly

BoundingPoly

Regione dell'immagine a cui appartiene questo oggetto. Questo campo deve essere compilato.

LocationInfo

Informazioni sulla posizione dell'entità rilevata.

Campi
lat_lng

LatLng

Coordinate di latitudine/longitudine della posizione.

NormalizedVertex

Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate dei vertici normalizzate sono relative all'immagine originale e vanno da 0 a 1.

Campi
x

float

Coordinata X.

y

float

Coordinata Y.

OperationMetadata

Contiene i metadati per l'operazione BatchAnnotateImages.

Campi
state

State

Stato attuale dell'operazione batch.

create_time

Timestamp

L'ora in cui è stata ricevuta la richiesta batch.

update_time

Timestamp

L'ora dell'ultimo aggiornamento del risultato dell'operazione.

Stato

Stati delle operazioni batch.

Enum
STATE_UNSPECIFIED Non valido.
CREATED Richiesta ricevuta.
RUNNING La richiesta è in fase di elaborazione.
DONE L'elaborazione batch è terminata.
CANCELLED L'elaborazione batch è stata annullata.

OutputConfig

La posizione di output e i metadati desiderati.

Campi
gcs_destination

GcsDestination

La posizione Google Cloud Storage in cui scrivere gli output.

batch_size

int32

Il numero massimo di proto di risposta da inserire in ogni file JSON di output su Google Cloud Storage. L'intervallo valido è [1, 100]. Se non specificato, il valore predefinito è 20.

Ad esempio, per un file PDF con 100 pagine, verranno generati 100 proto di risposta. Se batch_size = 20, verranno scritti 5 file JSON contenenti ciascuno 20 proto di risposta con il prefisso gcs_destination.uri.

Al momento, batch_size si applica solo a GcsDestination, con un potenziale supporto futuro per altre configurazioni di output.

Pagina

Pagina rilevata tramite OCR.

Campi
property

TextProperty

Sono state rilevate informazioni aggiuntive sulla pagina.

width

int32

Larghezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel.

height

int32

Altezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel.

blocks[]

Block

Elenco di blocchi di testo, immagini e così via in questa pagina.

confidence

float

Affidabilità dei risultati OCR sulla pagina. Intervallo [0, 1].

merged_text

string

Tutto il testo UTF-8 rilevato in questa pagina. Questo campo non viene restituito per impostazione predefinita, a meno che non sia specificato in TextDetectionParams.page_filter.

Paragrafo

Unità strutturale di testo che rappresenta un numero di parole in un determinato ordine.

Campi
property

TextProperty

Sono state rilevate informazioni aggiuntive per il paragrafo.

bounding_box

BoundingPoly

Il riquadro di delimitazione del paragrafo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3).

words[]

Word

Elenco delle parole in questo paragrafo.

confidence

float

Affidabilità dei risultati dell'OCR per il paragrafo. Intervallo [0, 1].

merged_text

string

Tutto il testo UTF-8 rilevato in questo paragrafo. Questo campo non viene restituito per impostazione predefinita, a meno che non sia specificato in TextDetectionParams.paragraph_filter.

Posizione

Una posizione 3D nell'immagine, utilizzata principalmente per i punti di riferimento del rilevamento del volto. Una posizione valida deve avere coordinate x e y. Le coordinate della posizione sono nella stessa scala dell'immagine originale.

Campi
x

float

Coordinata X.

y

float

Coordinata Y.

z

float

Coordinata Z (o profondità).

Prodotto

Un prodotto contiene ReferenceImages.

Campi
name

string

Il nome della risorsa del prodotto.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

Questo campo viene ignorato durante la creazione di un prodotto.

display_name

string

Il nome fornito dall'utente per questo prodotto. Non deve essere vuoto. Deve avere una lunghezza massima di 4096 caratteri.

description

string

I metadati forniti dall'utente da archiviare con questo prodotto. Deve avere una lunghezza massima di 4096 caratteri.

product_category

string

La categoria del prodotto identificato dall'immagine di riferimento. Deve essere "homegoods", "apparel" o "toys".

Questo campo è immutabile.

product_labels[]

KeyValue

Coppie chiave-valore che possono essere associate a un prodotto. Al momento della query, i vincoli possono essere specificati in base a product_labels.

Tieni presente che i valori interi possono essere forniti come stringhe, ad esempio "1199". Solo le stringhe con valori interi possono corrispondere a una limitazione basata sull'intervallo, che verrà supportata a breve.

È possibile assegnare più valori alla stessa chiave. Un prodotto può avere fino a 100 product_labels.

KeyValue

Un'etichetta prodotto rappresentata come coppia chiave-valore.

Campi
key

string

La chiave dell'etichetta collegata al prodotto. Non può essere vuoto e non può superare i 128 byte.

value

string

Il valore dell'etichetta associata al prodotto. Non può essere vuoto e non può superare i 128 byte.

ProductSearchParams

Parametri per una richiesta di ricerca di prodotto.

Campi
bounding_poly

BoundingPoly

Il poligono di delimitazione intorno all'area di interesse nell'immagine. Facoltativo. Se non specificato, verrà applicata la discrezione del sistema.

product_set

string

Il nome della risorsa di un ProductSet in cui cercare immagini simili.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID.

product_categories[]

string

L'elenco delle categorie di prodotti in cui eseguire la ricerca. Al momento prendiamo in considerazione solo la prima categoria e devi specificare "articoli per la casa", "abbigliamento" o "giocattoli".

filter

string

L'espressione di filtro. Può essere utilizzato per limitare i risultati di ricerca in base alle etichette prodotto. Al momento supportiamo un AND di OR di espressioni chiave-valore, in cui ogni espressione all'interno di un OR deve avere la stessa chiave.

Ad esempio, "(color = red OR color = blue) AND brand = Google" è accettabile, ma non "(color = red OR brand = Google)" o "color: red".

ProductSearchResults

Risultati di una richiesta di ricerca di un prodotto.

Campi
index_time

Timestamp

Timestamp dell'indice che ha fornito questi risultati. Le modifiche apportate dopo questa data non si riflettono nei risultati attuali.

results[]

Result

Elenco dei risultati, uno per ogni corrispondenza di prodotto.

product_grouped_results[]

GroupedResult

Elenco dei risultati raggruppati per prodotti rilevati nell'immagine della query. Ogni voce corrisponde a un poligono di delimitazione nell'immagine della query e contiene i prodotti corrispondenti specifici per quella regione. Potrebbero essere presenti corrispondenze di prodotto duplicate nell'unione di tutti i risultati per prodotto.

GroupedResult

Informazioni sui prodotti simili a un singolo prodotto in un'immagine di query.

Campi
bounding_poly

BoundingPoly

Il poligono di delimitazione intorno al prodotto rilevato nell'immagine della query.

results[]

Result

Elenco dei risultati, uno per ogni corrispondenza di prodotto.

object_annotations[]

ObjectAnnotation

Elenco di previsioni generiche per l'oggetto nel riquadro di delimitazione.

ObjectAnnotation

Previsione di ciò che è l'oggetto nel riquadro di delimitazione.

Campi
mid

string

ID oggetto che deve corrispondere al MID di EntityAnnotation.

language_code

string

Il codice lingua BCP-47, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

name

string

Nome dell'oggetto, espresso nella lingua language_code.

score

float

Punteggio del risultato. Intervallo [0, 1].

Risultato

Informazioni su un prodotto.

Campi
product

Product

Il Prodotto.

score

float

Un livello di confidenza della corrispondenza, compreso tra 0 (nessuna confidenza) e 1 (confidenza totale).

image

string

Il nome della risorsa dell'immagine del prodotto che corrisponde maggiormente alla query.

ProductSet

Un ProductSet contiene prodotti. Un ProductSet può contenere un massimo di 1 milione di immagini di riferimento. Se il limite viene superato, l'indicizzazione periodica non andrà a buon fine.

Campi
name

string

Il nome della risorsa del ProductSet.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID.

Questo campo viene ignorato durante la creazione di un ProductSet.

display_name

string

Il nome fornito dall'utente per questo ProductSet. Non deve essere vuoto. Deve avere una lunghezza massima di 4096 caratteri.

index_time

Timestamp

Solo output. L'ora in cui questo ProductSet è stato indicizzato per l'ultima volta. I risultati della query rifletteranno tutti gli aggiornamenti precedenti a questo orario. Se questo ProductSet non è mai stato indicizzato, questo timestamp è il valore predefinito "1970-01-01T00:00:00Z".

Questo campo viene ignorato durante la creazione di un ProductSet.

index_error

Status

Solo output. Se si è verificato un errore durante l'indicizzazione del set di prodotti, il campo viene compilato.

Questo campo viene ignorato durante la creazione di un ProductSet.

Proprietà

Un Property è costituito da una coppia nome/valore fornita dall'utente.

Campi
name

string

Nome della proprietà.

value

string

Valore della proprietà.

uint64_value

uint64

Valore delle proprietà numeriche.

confidence

float

Valore compreso nell'intervallo [0..1]. Confidenza di questo valore della proprietà.

mid

string

ID valore della proprietà opaco. Alcuni ID potrebbero essere disponibili nell'API Google Knowledge Graph Search. Un esempio di proprietà per un cappotto blu è: Property { name: 'color' value: 'blue' mid: '/m/01g5v' // For color blue }

QualityOptimizationParams

Parametri per le ottimizzazioni della qualità delle immagini.

Campi
type

Type

Scegli un tipo di ottimizzazione.

compression_config

CompressionConfig

Specifica la configurazione della compressione.

enhancement_config

EnhancementConfig

Specifica la configurazione del miglioramento automatico.

quality_score_config

QualityScoreConfig

Specifica la configurazione del punteggio di qualità.

CompressionConfig

Configurazione per COMPRESSION.

Campi
target_quality

float

Nell'intervallo [0, 1]. Qualità target dopo la compressione. 1 indica l'assenza di perdita rispetto all'immagine di input, 0 indica l'assenza di requisiti di qualità minimi.

EnhancementConfig

Configurazione per ENHANCEMENT. Se non specifichi enhancement_config, verranno utilizzati i valori predefiniti sharpening_level pari a 0,5, auto_hdr_level pari a 0,5 e upscale_ratio pari a 1. Se vuoi personalizzare uno dei tre parametri, devi specificare l'intera EnhancementConfig. Ad esempio, se vuoi utilizzare un valore auto_hdr_level più alto, che in genere rende l'immagine più luminosa, e mantenere il livello di nitidezza e il rapporto di upscaling uguali a quelli predefiniti, puoi impostare la configurazione come segue: enhancement_config { sharpening_level: 0.5 auto_hdr_level: 1.0 upscale_ratio: 1 }

Campi
sharpening_level

float

Compreso nell'intervallo [0,1]. Livello di nitidezza, 0 significa nessuna nitidezza, 1 significa la nitidezza più elevata. Il valore predefinito è 0,5.

auto_hdr_level

float

Compreso nell'intervallo [0,1]. Livello di HDR automatico, 0 significa nessun HDR automatico, 1 significa HDR automatico più grande. Il valore predefinito è 0,5.

upscale_ratio

float

Nell'intervallo [1, 2]. Se eseguire l'upscaling, il valore predefinito sarà 1, il che significa nessun upscaling. Se specificato, l'altezza e la larghezza dell'output saranno uguali all'altezza e alla larghezza originali moltiplicate per upscale_ratio.

QualityScoreConfig

Configurazione per QUALITY_SCORE.

Campi
quality_model

string

Specifica il modello da utilizzare. Il valore predefinito è una stringa vuota e verrà restituito il punteggio estetico. Un altro modello di qualità supportato è "builtin/technical-score", che restituisce la qualità tecnica dell'immagine.

Tipo

Enum del tipo di ottimizzazione della qualità.

Enum
TYPE_UNSPECIFIED Non valido. Il cliente deve selezionare un tipo.
COMPRESSION Riduci le dimensioni del file immagine. Parametri dettagliati specificati in CompressionConfig. Se il cliente non specifica CompressionConfig, le dimensioni del file immagine verranno ridotte senza comprometterne la qualità. Se il cliente specifica CompressionConfig, ridurremo le dimensioni del file mantenendo CompressionParams.target_quality.
ENHANCEMENT Riduzione del rumore, nitidezza, HDR e upscaling. Parametri dettagliati specificati in EnhancementConfig. Se il cliente non specifica EnhancmentConfig, il miglioramento dell'immagine verrà eseguito utilizzando i valori predefiniti. Se upscale_ratio non è specificato, l'immagine di output avrà la stessa risoluzione dell'immagine di input.
QUALITY_SCORE Punteggio di qualità della query per un'immagine. Parametri dettagliati specificati in QualityScoreConfig. Se il cliente non specifica QualityScoreConfig, verrà restituito il punteggio estetico dell'immagine.

QualityOptimizationResult

Memorizza i byte delle immagini avanzate.

Campi
quality_optimization_type

Type

Tipo di ottimizzazione obbligatorio.

image

bytes

Byte dell'immagine ottimizzata.

mime_type

string

Tipo MIME dell'immagine di output.

ReferenceImage

Un ReferenceImage rappresenta l'immagine di un prodotto e i relativi metadati, ad esempio i riquadri di selezione.

Campi
name

string

Il nome della risorsa dell'immagine di riferimento.

Il formato è:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID.

Questo campo viene ignorato quando crei un'immagine di riferimento.

uri

string

L'URI Google Cloud Storage dell'immagine di riferimento.

L'URI deve iniziare con gs://.

Obbligatorio.

bounding_polys[]

BoundingPoly

Poligoni di delimitazione intorno alle aree di interesse nell'immagine di riferimento. Facoltativo. Se questo campo è vuoto, il sistema tenterà di rilevare le regioni di interesse. Verranno utilizzati al massimo 10 poligoni di delimitazione.

La forma fornita viene convertita in un rettangolo non ruotato. Una volta convertito, il lato corto del rettangolo deve essere maggiore o uguale a 300 pixel. Le proporzioni devono essere pari o inferiori a 1:4 (ad es. 1:3 è accettabile, 1:5 no).

RemoveProductFromProductSetRequest

Messaggio di richiesta per il metodo RemoveProductFromProductSet.

Campi
name

string

Il nome della risorsa per il ProductSet da modificare.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

product

string

Il nome della risorsa del prodotto da rimuovere da questo ProductSet.

Il formato è: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

SafeSearchAnnotation

Insieme di funzionalità relative all'immagine, calcolate con metodi di computer vision su verticali di ricerca sicura (ad esempio, per adulti, spoof, medico, violenza).

Campi
adult

Likelihood

Rappresenta la probabilità che l'immagine contenga contenuti per adulti. I contenuti per adulti possono includere elementi come nudità, immagini o cartoni animati pornografici o attività sessuali.

spoof

Likelihood

Probabilità di spoofing. La probabilità che sia stata apportata una modifica alla versione canonica dell'immagine per farla apparire divertente o offensiva.

medical

Likelihood

Probabilità che si tratti di un'immagine medica.

violence

Likelihood

Probabilità che questa immagine includa contenuti violenti.

racy

Likelihood

Probabilità che l'immagine della richiesta contenga contenuti allusivi. I contenuti osé possono includere, a titolo esemplificativo, abiti succinti o trasparenti, nudità strategicamente coperta, pose oscene o provocanti o primi piani di parti del corpo sensibili.

Simbolo

Rappresentazione di un singolo simbolo.

Campi
property

TextProperty

Informazioni aggiuntive rilevate per il simbolo.

bounding_box

BoundingPoly

Il riquadro di delimitazione del simbolo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3).

text

string

La rappresentazione UTF-8 effettiva del simbolo.

confidence

float

Affidabilità dei risultati dell'OCR per il simbolo. Intervallo [0, 1].

Tabella

Una rappresentazione tabellare simile alla struttura di una tabella HTML.

Campi
header_rows[]

TableRow

Righe di intestazione della tabella

body_rows[]

TableRow

Righe del corpo della tabella

TableCell

Una rappresentazione delle celle all'interno delle tabelle.

Campi
row_span

int32

Il numero di righe che questa cella occupa.

col_span

int32

Il numero di colonne che questa cella occupa.

text_block

Block

Blocco di testo per questa cella che contiene anche il riquadro di delimitazione normalizzato per la cella e strutture più profonde all'interno di una cella, se presenti.

text

string

Il valore di testo unito di questa cella, omettendo eventuali informazioni strutturali più profonde a differenza di text_block. Questa opzione è utile per le celle semplici.

TableRow

Una riga di celle della tabella.

Campi
cells[]

TableCell

Le celle che compongono questa riga.

TableBoundHint

Un suggerimento per un riquadro di delimitazione della tabella nella pagina per l'analisi della tabella.

Campi
page_number

int32

Numero di pagina facoltativo per gli input multipagina a cui si applica questo suggerimento. Se non viene fornito, questo suggerimento verrà applicato a tutte le pagine per impostazione predefinita. Questo valore è indicizzato a 1.

bounding_box

BoundingPoly

Suggerimento sul riquadro di delimitazione per una tabella in questa pagina. Le coordinate devono essere normalizzate a [0,1] e il riquadro di delimitazione deve essere un rettangolo allineato agli assi.

TableDetectionOptions

Opzioni per il rilevamento delle tabelle.

Campi
table_bound_hints[]

TableBoundHint

Suggerimenti facoltativi per il riquadro di delimitazione della tabella che possono essere forniti per i casi complessi in cui il nostro algoritmo non riesce a individuare le tabelle.

TextAnnotation

TextAnnotation contiene una rappresentazione strutturata del testo estratto con l'OCR. La gerarchia di una struttura di testo estratta con l'OCR è la seguente: TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol Ogni componente strutturale, a partire da Page, può avere ulteriori proprietà. Le proprietà descrivono le lingue rilevate, le interruzioni e così via. Per ulteriori dettagli, consulta la definizione del messaggio TextAnnotation.TextProperty riportata di seguito.

Campi
pages[]

Page

Elenco delle pagine rilevate dall'OCR.

text

string

Testo UTF-8 rilevato nelle pagine.

DetectedBreak

Rilevato l'inizio o la fine di un componente strutturale.

Campi
type

BreakType

Tipo di pausa rilevato.

is_prefix

bool

True se l'interruzione precede l'elemento.

BreakType

Enumerazione per indicare il tipo di pausa trovato. Nuova riga, spazio e così via.

Enum
UNKNOWN Tipo di etichetta di interruzione sconosciuto.
SPACE Spazio normale.
SURE_SPACE Spazio sicuro (molto ampio).
EOL_SURE_SPACE Interruzione del ritorno a capo automatico.
HYPHEN Trattino di fine riga non presente nel testo; non si verifica contemporaneamente a SPACE, LEADER_SPACE o LINE_BREAK.
LINE_BREAK Interruzione di riga che termina un paragrafo.

DetectedLanguage

Lingua rilevata per un componente strutturale.

Campi
language_code

string

Il codice lingua BCP-47, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

confidence

float

Affidabilità della lingua rilevata. Intervallo [0, 1].

TextProperty

Informazioni aggiuntive rilevate sul componente strutturale.

Campi
detected_languages[]

DetectedLanguage

Un elenco delle lingue rilevate insieme al livello di confidenza.

detected_break

DetectedBreak

Rilevato l'inizio o la fine di un segmento di testo.

TextDetectionParams

Parametri per i rilevamenti di testo. Viene utilizzato per controllare le funzionalità TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Campi
disable_orientation_detection

bool

Disattiva il rilevamento dell'orientamento in modo che il testo ruotato non venga rilevato. Questa funzionalità è supportata solo per DOCUMENT_TEXT_DETECTION.

disable_text_annotations

bool

Disattiva il vecchio campo text_annotations. Verranno restituite solo le annotazioni full_text_annotations.

page_filter

FieldMask

Controlla quali dati vengono restituiti a livello di pagina in full_text_annotation. Valore predefinito se non impostato: tutti i campi sono inclusi

block_filter

FieldMask

Controlla quali dati vengono restituiti a livello di blocco in full_text_annotation. Valore predefinito se non impostato: tutti i campi sono inclusi, tranne merged_text.

paragraph_filter

FieldMask

Controlla quali dati vengono restituiti a livello di paragrafo in full_text_annotation. Valore predefinito se non impostato: tutti i campi sono inclusi, tranne merged_text

word_filter

FieldMask

Controlla quali dati vengono restituiti a livello di parola in full_text_annotation. Valore predefinito se non impostato: tutti i campi sono inclusi, tranne merged_text

symbol_filter

FieldMask

Controlla quali dati vengono restituiti a livello di simbolo in full_text_annotation. Valore predefinito se non impostato: tutti i campi sono inclusi, tranne bounding_box

UpdateProductRequest

Messaggio di richiesta per il metodo UpdateProduct.

Campi
product

Product

La risorsa Product che sostituisce quella sul server. product.name è immutabile.

update_mask

FieldMask

FieldMask che specifica quali campi aggiornare. Se update_mask non è specificato, tutti i campi modificabili devono essere aggiornati. I percorsi della maschera validi includono product_labels, display_name e description.

UpdateProductSetRequest

Messaggio di richiesta per il metodo UpdateProductSet.

Campi
product_set

ProductSet

La risorsa ProductSet che sostituisce quella sul server.

update_mask

FieldMask

FieldMask che specifica quali campi aggiornare. Se update_mask non è specificato, tutti i campi modificabili devono essere aggiornati. Il percorso della maschera valido è display_name.

Vertex

Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate dei vertici sono nella stessa scala dell'immagine originale.

Campi
x

int32

Coordinata X.

y

int32

Coordinata Y.

WebDetection

Informazioni pertinenti per l'immagine provenienti da internet.

Campi
web_entities[]

WebEntity

Entità dedotte da immagini simili su internet.

full_matching_images[]

WebImage

Immagini corrispondenti al 100% provenienti da internet. Possono includere copie ridimensionate dell'immagine della query.

partial_matching_images[]

WebImage

Immagini con corrispondenza parziale da internet. Queste immagini sono abbastanza simili da condividere alcune caratteristiche dei punti chiave. Ad esempio, un'immagine originale avrà probabilmente una corrispondenza parziale per i suoi ritagli.

pages_with_matching_images[]

WebPage

Pagine web contenenti le immagini corrispondenti trovate su internet.

visually_similar_images[]

WebImage

I risultati delle immagini visivamente simili.

best_guess_labels[]

WebLabel

La migliore ipotesi del servizio sull'argomento dell'immagine richiesta. Dedotte da immagini simili sul web aperto.

WebEntity

Entità dedotta da immagini simili su internet.

Campi
entity_id

string

ID entità opaco.

score

float

Punteggio di pertinenza complessivo per l'entità. Non normalizzato e non confrontabile tra diverse query di immagini.

description

string

Descrizione canonica dell'entità, in inglese.

WebImage

Metadati per le immagini online.

Campi
url

string

L'URL dell'immagine risultante.

score

float

(Obsoleto) Punteggio di pertinenza complessivo per l'immagine.

WebLabel

Etichetta per fornire metadati aggiuntivi per il rilevamento web.

Campi
label

string

Etichetta per i metadati aggiuntivi.

language_code

string

Il codice lingua BCP-47 per label, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

WebPage

Metadati per le pagine web.

Campi
url

string

L'URL della pagina web dei risultati.

score

float

(Obsoleto) Punteggio di pertinenza complessivo per la pagina web.

page_title

string

Titolo della pagina web, può contenere markup HTML.

full_matching_images[]

WebImage

Immagini completamente corrispondenti sulla pagina. Possono includere copie ridimensionate dell'immagine della query.

partial_matching_images[]

WebImage

Immagini con corrispondenza parziale sulla pagina. Queste immagini sono abbastanza simili da condividere alcune caratteristiche dei punti chiave. Ad esempio, un'immagine originale avrà probabilmente una corrispondenza parziale per i suoi ritagli.

WebDetectionParams

Parametri per la richiesta di rilevamento web.

Campi
include_geo_results

bool

Se includere i risultati derivati dalle informazioni geografiche nell'immagine.

Word

Una rappresentazione della parola.

Campi
property

TextProperty

Sono state rilevate informazioni aggiuntive per la parola.

bounding_box

BoundingPoly

Il riquadro di delimitazione della parola. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3).

symbols[]

Symbol

Elenco dei simboli nella parola. L'ordine dei simboli segue l'ordine di lettura naturale.

confidence

float

Il livello di attendibilità dei risultati dell'OCR per la parola. Intervallo [0, 1].

merged_text

string

Tutto il testo UTF-8 rilevato in questa parola. Questo campo non viene restituito per impostazione predefinita, a meno che non sia specificato in TextDetectionParams.word_filter.