Package google.cloud.vision.v1

Der Zeitpunkt, zu dem die Batchanfrage an den Server gesendet wurde.

end_time

Der Zeitpunkt, zu dem die Batchanfrage beendet und google.longrunning.Operation.done auf „true“ gesetzt wurde.

Status

Zählt die möglichen Statusangaben auf, die die Batchanfrage aufweisen kann.

Enums
`STATE_UNSPECIFIED`	Ungültig.
`PROCESSING`	Die Anfrage wird aktiv verarbeitet.
`SUCCESSFUL`	Die Anfrage ist abgeschlossen und mindestens ein Element wurde erfolgreich verarbeitet.
`FAILED`	Die Anfrage wurde abgeschlossen und es wurde kein Element erfolgreich verarbeitet.
`CANCELLED`	Die Anfrage wurde ausgeführt, nachdem der Nutzer longrunning.Operations.CancelOperation aufgerufen hat. Alle Datensätze, die vor dem Abbruchbefehl verarbeitet wurden, werden wie in der Anfrage angegeben ausgegeben.

Block

Logisches Element auf der Seite

Felder
`property`	`TextProperty` Zusätzliche für den Block erkannte Informationen
`bounding_box`	`BoundingPoly` Der Begrenzungsrahmen für den Block. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel: wenn der Text horizontal ist, könnte er so aussehen: `0----1 \| \| 3----2` wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus: `2----3 \| \| 1----0` und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).
`paragraphs[]`	`Paragraph` Liste der Absätze in diesem Block (wenn der Block den Typ „Text“ hat)
`block_type`	`BlockType` Erkannter Blocktyp (Text, Bild usw.) für diesen Block
`confidence`	`float` Die Konfidenz der OCR-Ergebnisse für den Block. Bereich [0, 1].
`table`	`Table` Erkannte Tabelle für TABLE-block_type. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es über TextDetectionParams.table_detection_options aktiviert ist. Die `bounding_box` für diesen Block sind die erkannten Grenzen für diese Tabelle.
`key_value_pair`	`KeyValuePair` Erkanntes Paar für KEY_VALUE_PAIR-block_type. Dieses Feld wird standardmäßig nur zurückgegeben, wenn DocumentType angegeben ist.
`merged_text`	`string` Der gesamte in diesem Block erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.block_filter angegeben ist.

BlockType

Typ eines Blocks (Text, Bild usw.), der durch OCR identifiziert wurde.

Enums
`UNKNOWN`	Unbekannter Blocktyp
`TEXT`	Normaler Textblock
`TABLE`	Tabellenblock
`PICTURE`	Bildblock
`RULER`	Feld mit horizontaler/vertikaler Linie
`BARCODE`	Barcodeblock
`KEY_VALUE_PAIR`	Ein Block von Schlüssel/Wert-Paaren

BoundingPoly

Ein Begrenzungspolygon für die erkannte Bildanmerkung

Felder

Felder
`vertices[]`	`Vertex` Die Eckpunkte des Begrenzungspolygons.
`normalized_vertices[]`	`NormalizedVertex` Die normalisierten Eckpunkte des Eckpolygons.

vertices[]

Vertex

Die Eckpunkte des Begrenzungspolygons.

normalized_vertices[]

NormalizedVertex

Die normalisierten Eckpunkte des Eckpolygons.

ColorInfo

Die Farbinformationen umfassen RGB-Kanäle, den Wert sowie den Anteil des Bildes, den die jeweilige Farbe einnimmt.

Felder

Felder
`color`	`Color` RGB-Komponenten der Farbe
`score`	`float` Bildspezifischer Wert für diese Farbe. Wert im Bereich [0, 1].
`pixel_fraction`	`float` Der Anteil der Pixel, die die jeweilige Farbe im Bild belegt. Wert im Bereich [0, 1].

color

Color

RGB-Komponenten der Farbe

score

float

Bildspezifischer Wert für diese Farbe. Wert im Bereich [0, 1].

pixel_fraction

float

Der Anteil der Pixel, die die jeweilige Farbe im Bild belegt. Wert im Bereich [0, 1].

CreateProductRequest

Anfragenachricht für die Methode CreateProduct.

Felder

Felder
`parent`	`string` Das Projekt, in dem das Produkt erstellt werden soll. Das Format ist `projects/PROJECT_ID/locations/LOC_ID`.
`product`	`Product` Das zu erstellende Produkt.
`product_id`	`string` Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses Produkt. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen `/` nicht enthalten.

parent

string

Das Projekt, in dem das Produkt erstellt werden soll.

Das Format ist projects/PROJECT_ID/locations/LOC_ID.

product

Das zu erstellende Produkt.

product_id

string

Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses Produkt. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen / nicht enthalten.

CreateProductSetRequest

Anfragenachricht für die Methode CreateProductSet.

Felder

Felder
`parent`	`string` Das Projekt, in dem das ProductSet erstellt werden soll. Das Format ist `projects/PROJECT_ID/locations/LOC_ID`.
`product_set`	`ProductSet` Das zu erstellende ProductSet.
`product_set_id`	`string` Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses ProductSet. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen `/` nicht enthalten.

parent

string

Das Projekt, in dem das ProductSet erstellt werden soll.

Das Format ist projects/PROJECT_ID/locations/LOC_ID.

product_set

ProductSet

Das zu erstellende ProductSet.

product_set_id

string

Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses ProductSet. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen / nicht enthalten.

CreateReferenceImageRequest

Anfragenachricht für die Methode CreateReferenceImage.

Felder

Felder
`parent`	`string` Ressourcenname des Produkts, in dem das Referenzbild erstellt werden soll. Das Format ist `projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID`.
`reference_image`	`ReferenceImage` Das zu erstellende Referenzbild. Wenn eine Bild-ID angegeben wird, wird sie ignoriert.
`reference_image_id`	`string` Eine vom Nutzer bereitgestellte Ressourcen-ID für das ReferenceImage, das hinzugefügt werden soll. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen `/` nicht enthalten.

parent

string

Ressourcenname des Produkts, in dem das Referenzbild erstellt werden soll.

Das Format ist projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

reference_image

ReferenceImage

Das zu erstellende Referenzbild. Wenn eine Bild-ID angegeben wird, wird sie ignoriert.

reference_image_id

string

Eine vom Nutzer bereitgestellte Ressourcen-ID für das ReferenceImage, das hinzugefügt werden soll. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen / nicht enthalten.

CropHint

Einzelner Zuschneidehinweis, der zum Generieren eines neuen Zuschneidevorgangs beim Verarbeiten eines Bildes verwendet wird.

Felder

Felder
`bounding_poly`	`BoundingPoly` Das Begrenzungspolygon für den Zuschnittbereich. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds.
`confidence`	`float` Die Konfidenz, dass dies ein wichtiger Bereich ist. Bereich [0, 1].
`importance_fraction`	`float` Anteil der Bedeutung dieses auffälligen Bereichs in Bezug auf das Originalbild.

bounding_poly

DominantColorsAnnotation

Das Begrenzungspolygon für den Zuschnittbereich. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds.

confidence

float

Die Konfidenz, dass dies ein wichtiger Bereich ist. Bereich [0, 1].

importance_fraction

float

Anteil der Bedeutung dieses auffälligen Bereichs in Bezug auf das Originalbild.

CropHintsAnnotation

Ein Satz von Zuschneidehinweisen, die zum Generieren neuer Zuschneidevorgänge beim Verarbeiten von Bildern verwendet werden.

Felder

Felder
`crop_hints[]`	`CropHint` Ergebnisse der Zuschneidehinweise

crop_hints[]

CropHint

Ergebnisse der Zuschneidehinweise

CropHintsParams

Parameter für Annotationsanfragen zu Zuschneidehinweisen

Felder

Felder
`aspect_ratios[]`	`float` Seitenverhältnisse in Gleitkommazahlen, die das Verhältnis von Breite zu Höhe des Bildes darstellen. Wenn das gewünschte Seitenverhältnis beispielsweise 4:3 ist, sollte der entsprechende Gleitkommawert 1,33333 betragen. Wenn nichts angegeben ist, wird der bestmögliche Zuschnitt geliefert. Die Anzahl der bereitgestellten Seitenverhältnisse ist auf maximal 16 begrenzt; alle nach dem 16. Seitenverhältnis angegebenen Seitenverhältnisse werden ignoriert.

aspect_ratios[]

float

Seitenverhältnisse in Gleitkommazahlen, die das Verhältnis von Breite zu Höhe des Bildes darstellen. Wenn das gewünschte Seitenverhältnis beispielsweise 4:3 ist, sollte der entsprechende Gleitkommawert 1,33333 betragen. Wenn nichts angegeben ist, wird der bestmögliche Zuschnitt geliefert. Die Anzahl der bereitgestellten Seitenverhältnisse ist auf maximal 16 begrenzt; alle nach dem 16. Seitenverhältnis angegebenen Seitenverhältnisse werden ignoriert.

CustomEntityAnnotation

Eine CustomEntityAnnotation enthält Annotationen, die mit benutzerdefinierten Vision-Modellen vorhergesagt wurden.

Felder

Felder
`model`	`string` Gibt das benutzerdefinierte Modell an, das zum Erstellen dieser Annotation verwendet wurde. Das Format des Modellnamens ist die Ressourcen-URL des benutzerdefinierten Modells, das abgefragt wurde: `/projects/PROJECT_ID/models/MODEL_ID` oder `/models/MODEL_ID`, wenn das Modell zum aktuellen Projekt gehört.
`label`	`string` Das vom benutzerdefinierten Modell vorhergesagte Label.
`score`	`float` Der Konfidenzwert des Labels nach dem benutzerdefinierten Modell.

model

string

Gibt das benutzerdefinierte Modell an, das zum Erstellen dieser Annotation verwendet wurde. Das Format des Modellnamens ist die Ressourcen-URL des benutzerdefinierten Modells, das abgefragt wurde: /projects/PROJECT_ID/models/MODEL_ID oder /models/MODEL_ID, wenn das Modell zum aktuellen Projekt gehört.

label

string

Das vom benutzerdefinierten Modell vorhergesagte Label.

score

float

Der Konfidenzwert des Labels nach dem benutzerdefinierten Modell.

DeleteProductRequest

Anfragenachricht für die Methode DeleteProduct.

Felder

name

string

Ressourcenname des zu löschenden Produkts.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

DeleteProductSetRequest

Anfragenachricht für die Methode DeleteProductSet.

Felder

name

string

Ressourcenname des zu löschenden ProductSets.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

DeleteReferenceImageRequest

Anfragenachricht für die Methode DeleteReferenceImage.

Felder

name

string

Der Ressourcenname des zu löschenden Referenzbilds.

Format ist:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID

DocumentParsingParams

Parameter für die Funktion DOCUMENT_PARSING.

Felder

disable_orientation_detection

bool

Deaktiviert die Ausrichtungserkennung, sodass gedrehter Text nicht erkannt wird.

table_detection_options

TableDetectionOptions

Steuert das Verhalten der Tabellenerkennung. Die Tabellenerkennung ist deaktiviert, wenn dieses Feld nicht festgelegt ist.

document_type

string

Geben Sie einen bekannten Dokumenttyp für eine tiefere Strukturerkennung an. Gültige Werte sind derzeit "invoice" oder "general".

DominantColorsAnnotation

Satz dominierender Farben und ihre entsprechenden Werte

Felder

colors[]

ColorInfo

RGB-Farbwerte mit ihren Werten und ihrem Pixelanteil

EntityAnnotation

Satz erkannter Entitätsmerkmale

Felder
`mid`	`string` Intransparente Entitäts-ID. Einige IDs sind möglicherweise in Google Knowledge Graph Search API verfügbar.
`locale`	`string` Der Sprachcode für die Sprache, in der die textliche `description` der Entität verfasst ist.
`description`	`string` Entitätstextbeschreibungen in ihrer `locale`-Sprache
`score`	`float` Gesamtwert des Ergebnisses. Bereich [0, 1].
`confidence (deprecated)`	`float` Dieses Element ist veraltet. Eingestellt. Verwenden Sie stattdessen `score`. Die Genauigkeit der Entitätserkennung in einem Bild. Beispielsweise stellt bei einem Bild, in dem die Entität "Eiffelturm" erkannt wird, dieses Feld die Konfidenz dar, dass sich im Abfragebild ein Turm befindet. Bereich [0, 1].
`topicality`	`float` Die Relevanz des ICA-Labels (Image Content Annotation) für das Bild. Zum Beispiel ist die Relevanz von "Turm" für ein Bild, das den erkannten "Eiffelturm" enthält, wahrscheinlich höher als für ein Bild, das ein erkanntes entferntes, hoch aufragendes Gebäude enthält. Dabei kann die Konfidenz, dass es in jedem Bild einen Turm gibt, gleich sein. Bereich [0, 1].
`bounding_poly`	`BoundingPoly` Bildbereich, zu dem diese Entität gehört. Nicht für `LABEL_DETECTION`-Funktionen erstellt.
`locations[]`	`LocationInfo` Die Standortinformation für die erkannte Entität. Es können mehrere `LocationInfo`-Elemente vorhanden sein: Ein Ort kann den Standort der Szene im Bild angeben und ein anderer den Ort, an dem das Bild aufgenommen wurde. Standortinformationen sind normalerweise für Sehenswürdigkeiten vorhanden.
`properties[]`	`Property` Einige Entitäten haben möglicherweise optionale, vom Nutzer angegebene `Property`-Felder (Name/Wert), z. B. einen Wert oder einen String, der die Entität qualifiziert.

FaceAnnotation

Ein Gesichtsannotationsobjekt enthält die Ergebnisse der Gesichtserkennung.

Felder
`bounding_poly`	`BoundingPoly` Das Begrenzungspolygon um das Gesicht. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds. Der Begrenzungsrahmen wird so berechnet, dass er das Gesicht entsprechend den menschlichen Erwartungen „einrahmt“. Es basiert auf den Ergebnissen für auffällige Stellen. Es kann sein, dass eine oder mehrere x- bzw. y-Koordinaten im `BoundingPoly` nicht generiert werden (das Polygon ist unbegrenzt), wenn nur ein Teil des Gesichts zur Annotation im Bild erkennbar ist.
`fd_bounding_poly`	`BoundingPoly` Das Begrenzungspolygon `fd_bounding_poly` ist enger als `boundingPoly` und umschließt nur den Hautteil des Gesichts. In der Regel wird es verwendet, um das Gesicht von einer Bildanalyse zu eliminieren, die die „Menge an Haut“ erkennt, die in einem Bild sichtbar ist. Es basiert nicht auf den Landmark-Ergebnissen, sondern nur auf der anfänglichen Gesichtserkennung; deshalb das Präfix `fd` (face detection, Gesichtserkennung).
`landmarks[]`	`Landmark` Erkannte markante Stellen im Gesicht (Landmarks).
`roll_angle`	`float` Rollwinkel, der den Betrag der Drehung des Gesichts im Uhrzeigersinn/gegen den Uhrzeigersinn relativ zur senkrechten Achse des Bildes um die Achse senkrecht zum Gesicht angibt. Bereich [-180,180].
`pan_angle`	`float` Schiebewinkel, der den nach links/rechts gerichteten Winkel des Gesichts relativ zur vertikalen Ebene senkrecht zum Bild anzeigt. Bereich [-180,180].
`tilt_angle`	`float` Neigungswinkel, der den Aufwärts-/Abwärtswinkel des Gesichts relativ zur horizontalen Ebene des Bildes anzeigt. Bereich [-180,180].
`detection_confidence`	`float` Erkennungskonfidenz. Bereich [0, 1].
`landmarking_confidence`	`float` Gesichts-Landmark-Konfidenz. Bereich [0, 1].
`joy_likelihood`	`Likelihood` Wahrscheinlichkeit für Freude.
`sorrow_likelihood`	`Likelihood` Wahrscheinlichkeit für Kummer.
`anger_likelihood`	`Likelihood` Wahrscheinlichkeit für Wut.
`surprise_likelihood`	`Likelihood` Wahrscheinlichkeit für Überraschung.
`under_exposed_likelihood`	`Likelihood` Wahrscheinlichkeit für unterbelichtetes Foto.
`blurred_likelihood`	`Likelihood` Wahrscheinlichkeit für unscharfes Foto.
`headwear_likelihood`	`Likelihood` Wahrscheinlichkeit für Kopfbedeckung.

Landmark

Eine gesichtsspezifische markante Stelle (z. B. ein Gesichtsmerkmal).

Felder

type

Type

Gesichts-Landmark-Typ

position

Position

Gesichts-Landmark-Position

Typ

Gesichts-Landmark-Typ (Gesichtsmerkmaltyp). Links und rechts werden aus der Sicht des Betrachters des Bildes definiert, ohne Spiegelprojektionen zu berücksichtigen, die für Fotos typisch sind. Deshalb ist LEFT_EYE typischerweise das rechte Auge der Person.

Enums
`UNKNOWN_LANDMARK`	Unbekannte Gesichts-Landmark erkannt. Sollte nicht ausgefüllt sein.
`LEFT_EYE`	Linkes Auge
`RIGHT_EYE`	Rechtes Auge
`LEFT_OF_LEFT_EYEBROW`	Links von der linken Augenbraue
`RIGHT_OF_LEFT_EYEBROW`	Rechte von der linken Augenbraue
`LEFT_OF_RIGHT_EYEBROW`	Linke von der rechten Augenbraue
`RIGHT_OF_RIGHT_EYEBROW`	Rechts von der rechten Augenbraue
`MIDPOINT_BETWEEN_EYES`	Mittelpunkt zwischen den Augen
`NOSE_TIP`	Nasenspitze
`UPPER_LIP`	Oberlippe
`LOWER_LIP`	Unterlippe
`MOUTH_LEFT`	Mund links
`MOUTH_RIGHT`	Mund rechts
`MOUTH_CENTER`	Mundmitte
`NOSE_BOTTOM_RIGHT`	Nase, unten rechts
`NOSE_BOTTOM_LEFT`	Nase, unten links
`NOSE_BOTTOM_CENTER`	Nase, unten Mitte
`LEFT_EYE_TOP_BOUNDARY`	Linkes Auge, obere Begrenzung
`LEFT_EYE_RIGHT_CORNER`	Linkes Auge, rechte Ecke
`LEFT_EYE_BOTTOM_BOUNDARY`	Linkes Auge, untere Begrenzung
`LEFT_EYE_LEFT_CORNER`	Linkes Auge, linke Ecke
`RIGHT_EYE_TOP_BOUNDARY`	Rechtes Auge, obere Begrenzung
`RIGHT_EYE_RIGHT_CORNER`	Rechtes Auge, rechte Ecke
`RIGHT_EYE_BOTTOM_BOUNDARY`	Rechtes Auge, untere Begrenzung
`RIGHT_EYE_LEFT_CORNER`	Rechtes Auge, linke Ecke
`LEFT_EYEBROW_UPPER_MIDPOINT`	Linke Augenbraue, oberer Mittelpunkt
`RIGHT_EYEBROW_UPPER_MIDPOINT`	Rechte Augenbraue, oberer Mittelpunkt
`LEFT_EAR_TRAGION`	Tragion linkes Ohr
`RIGHT_EAR_TRAGION`	Tragion rechtes Ohr
`LEFT_EYE_PUPIL`	Pupille linkes Auge
`RIGHT_EYE_PUPIL`	Pupille rechtes Auge
`FOREHEAD_GLABELLA`	Glabella Stirn
`CHIN_GNATHION`	Gnathion Kinn
`CHIN_LEFT_GONION`	Kinn, linker Gonion
`CHIN_RIGHT_GONION`	Kinn, rechter Gonion

Funktion

Der Typ der durchzuführenden Google Cloud Vision API-Erkennung und die maximale Anzahl von Ergebnissen, die für diesen Typ zurückgegeben werden sollen. In der Liste features können mehrere Feature-Objekte angegeben werden.

Felder

type

Type

Funktionstyp

max_results

int32

Maximale Anzahl von Ergebnissen dieses Typs Gilt nicht für TEXT_DETECTION, DOCUMENT_TEXT_DETECTION oder CROP_HINTS.

model

string

Das für das Feature zu verwendende Modell. Unterstützte Werte: "builtin/stable" (Standardeinstellung, wenn nicht festgelegt) und "builtin/latest".

Typ

Typ der Google Cloud Vision API-Funktion, die extrahiert werden soll.

Enums
`TYPE_UNSPECIFIED`	Nicht angegebener Funktionstyp
`FACE_DETECTION`	Gesichtserkennung ausführen
`LANDMARK_DETECTION`	Sehenswürdigkeiten-Erkennung ausführen
`LOGO_DETECTION`	Logoerkennung ausführen
`LABEL_DETECTION`	Labelerkennung ausführen
`TEXT_DETECTION`	Texterkennung/optische Zeichenerkennung (OCR) ausführen. Die Texterkennung ist für Textbereiche in einem größeren Bild optimiert. Wenn das Bild ein Dokument ist, verwenden Sie stattdessen `DOCUMENT_TEXT_DETECTION`.
`DOCUMENT_TEXT_DETECTION`	OCR für Dokument mit dicht gesetztem Text ausführen. Hat Vorrang, wenn `DOCUMENT_TEXT_DETECTION` und `TEXT_DETECTION` vorhanden sind.
`SAFE_SEARCH_DETECTION`	SafeSearch ausführen, um potenziell unsichere oder unerwünschte Inhalte zu erkennen.
`IMAGE_PROPERTIES`	Eine Reihe von Bildeigenschaften berechnen, z. B. die dominanten Farben des Bildes.
`CROP_HINTS`	Zuschneidehinweise ausführen
`WEB_DETECTION`	Weberkennung ausführen
`PRODUCT_SEARCH`	Produktsuche ausführen
`CUSTOM_LABEL_DETECTION`	Die benutzerdefinierte Labelerkennung ausführen
`OBJECT_LOCALIZATION`	Führen Sie den Localizer für die Objekterkennung aus.
`IMAGE_QUALITY`	Quality Scorer ausführen.
`OBJECT_ATTRIBUTES`	Berechnet die Attribute der im Bild erkannten Objekte. Es werden vier Objektdomains unterstützt. Wählen Sie über Feature.model (erforderlich) aus: "builtin/apparel", "builtin/car", "builtin/food" oder "builtin/wildlife".
`QUALITY_OPTIMIZATION`	Führen Sie Algorithmen zur Qualitätsoptimierung aus. Es gibt drei Arten von Vorgängen: COMPRESSION, ENHANCEMENT und QUALITY_SCORE. Die Parameter COMPRESSION und ENHANCEMENT sowie die Modellauswahl für QUALITY_SCORE können in image_context.quality_optimization_params angegeben werden.
`BARCODE_DETECTION`	Barcodeerkennung ausführen
`DOCUMENT_PARSING`	Führen Sie Algorithmen zum Parsen von Dokumenten aus, um strukturierte Daten wie Tabellen und Formulare zu extrahieren. Die Ergebnisse finden Sie unter `full_text_annotation` -> `page` -> `block` mit dem Typ TABLE für Tabellen oder KEY_VALUE_PAIR für Schlüssel/Wert-Paare in Formularen.

GcsDestination

Der Google Cloud Storage-Speicherort, in den die Ausgabe geschrieben wird.

Felder

uri

string

Der Google Cloud Storage-URI, unter dem die Ergebnisse gespeichert werden. Die Ergebnisse haben das JSON-Format und als Präfix den zugehörigen Eingabe-URI. Dieses Feld kann entweder eine einzelne Datei oder ein Präfix für mehrere Ausgaben darstellen. Präfixe müssen mit / enden.

Beispiele:

Bei mehreren Ausgaben enthält jede Antwort immer noch AnnotateFileResponse, die jeweils einen Teil der vollständigen Liste von AnnotateImageResponse enthält. Mehrere Ausgaben können auftreten, wenn die JSON-Ausgabe beispielsweise zu groß ist und in mehrere fragmentierte Dateien überläuft.

GcsSource

Der Google Cloud Storage-Speicherort, aus dem die Eingabe gelesen wird.

Felder

uri

string

Der Google Cloud Storage-URI für die Eingabedatei. Dies darf nur ein Google Cloud Storage-Objekt sein. Platzhalter werden derzeit nicht unterstützt.

GetProductRequest

Anfragenachricht für die Methode GetProduct.

Felder

name

string

Ressourcenname des abzurufenden Produkts.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

GetProductSetRequest

Anfragenachricht für die Methode GetProductSet.

Felder

name

string

Ressourcenname des abzurufenden ProductSets.

Das Format ist: projects/PROJECT_ID/locations/LOG_ID/productSets/PRODUCT_SET_ID

GetReferenceImageRequest

Anfragenachricht für die Methode GetReferenceImage.

Felder

name

string

Der Ressourcenname des abzurufenden ReferenceImage.

Das Format ist:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID.

Bild

Kundenbild, für das Google Cloud Vision API-Aufgaben ausgeführt werden sollen

Felder

content

bytes

Bildinhalt, dargestellt als ein Stream von Byte. Hinweis: Wie bei allen bytes-Feldern verwenden auch Protokollpuffer eine reine Binärdarstellung, während JSON-Darstellungen base64 verwenden.

source

ImageSource

Google Cloud Storage-Bildspeicherort oder öffentlich zugängliche Bild-URL Wenn sowohl content als auch source für ein Bild angegeben sind, hat content Vorrang und wird zur Anfrage der Bildannotation verwendet.

ImageAnnotationContext

Wenn ein Bild aus einer Datei (z. B. einer PDF-Datei) erstellt wurde, enthält diese Nachricht Informationen zur Quelle des Bildes.

Felder

uri

string

Der URI der Datei, die zur Erstellung des Bildes verwendet wurde.

page_number

int32

Falls es sich um eine PDF- oder TIFF-Datei handelt, gibt dieses Feld die Seitenzahl in der Datei an, die zum Erstellen des Bildes verwendet wurde.

ImageContext

Bildkontext- bzw. funktionsspezifische Parameter

Felder
`lat_long_rect`	`LatLongRect` Nicht verwendet.
`language_hints[]`	`string` Liste der Sprachen, die für TEXT_DETECTION verwendet werden sollen. Ein leerer Wert liefert in den meisten Fällen jedoch die besten Ergebnisse, weil dadurch die automatische Spracherkennung aktiviert wird. Bei Sprachen, die auf dem lateinischen Alphabet basieren, ist die Einstellung `language_hints` nicht erforderlich. In seltenen Fällen werden durch das Festlegen eines Hinweises verbesserte Ergebnisse erzielt, wenn die Sprache des Bildtextes bekannt ist. Falls der Hinweis jedoch falsch ist, behindert er die Texterkennung erheblich. Wenn eine oder mehrere der angegebenen Sprachen nicht zu den unterstützten Sprachen zählen, gibt die Texterkennung einen Fehler zurück.
`crop_hints_params`	`CropHintsParams` Parameter für Annotationsanfragen zu Zuschneidehinweisen
`product_search_params`	`ProductSearchParams` Parameter für die Produktsuche
`web_detection_params`	`WebDetectionParams` Parameter für Weberkennung
`text_detection_params`	`TextDetectionParams` Parameter für die Texterkennung in Dokumenten
`quality_optimization_params`	`QualityOptimizationParams` Parameter für die Optimierung der Bildqualität
`document_parsing_params`	`DocumentParsingParams` Parameter für das Parsen von Dokumenten

ImageProperties

Speichert Bildeigenschaften, z. B. dominante Farben

Felder

dominant_colors

Falls vorhanden, wurden dominante Farben erfolgreich abgeschlossen.

ImageQuality

Speichert die Bildqualitätsfaktoren, entweder als ästhetische oder technische Qualität.

Felder

quality_score

float

Wert, der die ästhetische/technische Qualität des Bilds angibt. Der Wert liegt im Bereich [0, 1]. Ein höherer Wert entspricht professionelleren Fotos. 0 bedeutet, dass das Bild sehr schlecht aussieht, 1 bedeutet, dass das Bild sehr hohe Qualität hat.

ImageSource

Externe Bildquelle (Google Cloud Storage- oder Web-URL-Bildspeicherort)

Felder

gcs_image_uri

string

Verwenden Sie stattdessen image_uri.

Der Google Cloud Storage-URI der Form gs://bucket_name/object_name. Objektversionsverwaltung wird nicht unterstützt. Weitere Informationen finden Sie unter Google Cloud Storage-Anfrage-URIs.

image_uri

string

Der URI des Quellbilds. Es gibt folgende Möglichkeiten:

Der Google Cloud Storage-URI der Form gs://bucket_name/object_name. Objektversionsverwaltung wird nicht unterstützt. Weitere Informationen finden Sie unter Google Cloud Storage-Anfrage-URIs.
Eine öffentlich zugängliche HTTP-/HTTPS-Bild-URL. Beim Abrufen von Bildern von HTTP- oder HTTPS-URLs kann Google nicht garantieren, dass die Anfrage abgeschlossen wird. Ihre Anfrage kann fehlschlagen, wenn der angegebene Host die Anfrage ablehnt (z. B. aufgrund von Anfragendrosselung oder zur DoS-Prävention) oder wenn Google Anfragen an die Website drosselt, um Missbrauch vorzubeugen. Sie sollten sich bei Produktionsanwendungen nicht auf extern gehostete Bilder verlassen.

Wenn sowohl gcs_image_uri als auch image_uri angegeben sind, hat image_uri Vorrang.

ImportProductSetsGcsSource

Der Google Cloud Storage-Speicherort für eine CSV-Datei, die in jeder Zeile eine Liste von ImportProductSetRequests enthält.

Felder

csv_file_uri

string

Der Google Cloud Storage-URI der CSV-Eingabedatei.

Der URI muss mit gs:// beginnen.

Das Format der CSV-Eingabedatei sollte ein Bild pro Zeile sein. In jeder Zeile sind acht Spalten vorhanden.

image-uri
image-id
product-set-id
product-id
product-category
product-display-name
labels
bounding-poly

Die Spalten image-uri, product-set-id, product-id und product-category sind erforderlich. Alle anderen Spalten sind optional.

Wenn die ProductSet- und Product-Werte, die in den Werten product-set-id und product-id angegeben sind, nicht vorhanden sind, erstellt das System ein neues ProductSet oder Product für das Image. In diesem Fall verweist die Spalte product-display-name auf display_name, die Spalte product-category auf product_category und die Spalte labels auf product_labels.

Die Spalte image-id ist optional, muss aber eindeutig sein, wenn sie angegeben wird. Wenn sie leer ist, weist das System dem Bild automatisch eine eindeutige ID zu.

Die Spalte product-display-name ist optional. Wenn dieser Wert leer ist, setzt das System das Feld display_name für das Produkt auf ein Leerzeichen („ “). Sie können display_name später mithilfe der API aktualisieren.

Wenn ein Product mit der angegebenen product-id bereits vorhanden ist, ignoriert das System die Spalten product-display-name, product-category und labels.

Die Spalte labels (optional) ist eine Zeile, die eine Liste mit durch Kommas getrennten Schlüssel/Wert-Paaren im folgenden Format enthält:

"key_1=value_1,key_2=value_2,...,key_n=value_n"

In der Spalte bounding-poly (optional) wird ein bestimmter Bereich eines Bilds aus dem Bild auf die gleiche Weise aufgeführt wie CreateReferenceImage. Wenn Sie die Spalte bounding-poly nicht angeben, versucht das System, Regionen von Interesse automatisch zu erkennen.

Pro Zeile ist maximal eine Spalte bounding-poly zulässig. Wenn das Bild mehrere relevante Regionen enthält, fügen Sie der CSV-Datei eine Zeile mit denselben Produktinformationen und den bounding-poly-Werten für die einzelnen Regionen hinzu.

Die Spalte bounding-poly muss eine gerade Anzahl durch Kommas getrennter Zahlen im Format „p1_x,p1_y,p2_x,p2_y,...,pn_x,pn_y“ enthalten. Verwenden Sie für absolute Begrenzungspolygone nicht negative Ganzzahlen und für normalisierte Begrenzungspolygone Gleitkommawerte in [0, 1].

Die Größe des Bildes wird vom System angepasst, wenn das Bild zu groß für die Verarbeitung ist (größer als 20 MP).

ImportProductSetsInputConfig

Der Eingabeinhalt für die Methode ImportProductSets.

Felder

gcs_source

ImportProductSetsGcsSource

Der Google Cloud Storage-Speicherort für eine CSV-Datei, die in jeder Zeile eine Liste von ImportProductSetRequests enthält.

ImportProductSetsRequest

Anfragenachricht für die Methode ImportProductSets.

Felder

parent

string

Das Projekt, in das die ProductSets importiert werden sollen.

Das Format ist projects/PROJECT_ID/locations/LOC_ID.

input_config

ImportProductSetsInputConfig

Der Eingabeinhalt für die Liste der Anfragen.

ImportProductSetsResponse

Antwortnachricht für die ImportProductSets-Methode.

Diese Nachricht wird von der Methode google.longrunning.Operations.GetOperation im zurückgegebenen Feld google.longrunning.Operation.response zurückgegeben.

Felder

reference_images[]

ReferenceImage

Die Liste der erfolgreich importierten reference_images.

statuses[]

Status

Der RPC-Status für jede ImportProductSet-Anfrage, einschließlich Erfolg und Fehler.

Die Anzahl der Status hier stimmt mit der Anzahl der Zeilen in der CSV-Datei überein. Status[i] speichert den Erfolgs- oder Fehlerstatus der i-ten Zeile der CSV-Datei ab Zeile 0.

InputConfig

Der gewünschte Eingabeort und die Metadaten.

Felder

gcs_source

GcsSource

Der Google Cloud Storage-Speicherort, aus dem die Eingabe gelesen werden soll.

content

bytes

Bildinhalt, dargestellt als ein Bytestream. Hinweis: Wie bei allen bytes-Feldern verwenden auch Protokollpuffer eine reine Binärdarstellung, während JSON-Darstellungen base64 verwenden.

Derzeit funktioniert dieses Feld nur für BatchAnnotateFiles-Anfragen. Es funktioniert nicht bei AsyncBatchAnnotateFiles-Anfragen.

mime_type

string

Der Typ der Datei. Derzeit werden nur „application/pdf“ und „image/tiff“ unterstützt. Platzhalter werden nicht unterstützt.

KeyValuePair

Proto für ein Schlüssel/Wert-Paar.

Felder
`key`	`string` Der Schlüsselstring-Wert.
`key_block`	`Block` Schlüsselblock des Paars mit dem normalisierten Begrenzungsrahmen und dem Schlüsseltext.
`value_block`	`Block` Wertblock des Paars mit dem normalisierten Begrenzungsrahmen und dem normalisierten Werttext, einschließlich potenziell tieferer Strukturen innerhalb des Werttexts.
`value_type`	`string` Typ des Werts. Gültige Strings sind: „generic“: für generischen Text, der einem Wert zugeordnet wird „number“: für numerische Typen „id“: für generische Kennungen „currency“: für Währungswerte „date“: für Datumsangaben „time“: für Zeit- und Dauerwerte „date_range“: für Zeiträume „address“: für Adresswerte (kann lang sein). „person“: für Namen von Personen oder andere persönliche Informationen „phone“: für Telefonnummern
`normalized_key`	`string` (Optional) Der normalisierte Schlüsseltext, wenn der Text üblich und klassifiziert ist. Beispielsweise wird „TOTAL DUE“ auf „Gesamtbetrag“ normalisiert.

LatLongRect

Durch LatLng-Paare (Min. und Max.) festgelegtes Rechteck

Felder

min_lat_lng

LatLng

Breiten-/Längengradpaar (Min.)

max_lat_lng

LatLng

Breiten-/Längengradpaar (Max.)

Wahrscheinlichkeit

Eine "bucketisierte" Darstellung von Wahrscheinlichkeiten, die Kunden höchst stabile Ergebnisse bei Modellaktualisierungen liefern soll.

Enums
`UNKNOWN`	Unbekannte Wahrscheinlichkeit
`VERY_UNLIKELY`	Es ist sehr unwahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.
`UNLIKELY`	Es ist unwahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.
`POSSIBLE`	Es ist möglich, dass das Bild zur angegebenen Kategorie gehört.
`LIKELY`	Es ist wahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.
`VERY_LIKELY`	Es ist sehr wahrscheinlich, dass das Bild zur angegebenen Kategorie gehört.

ListProductSetsRequest

Anfragenachricht für die Methode ListProductSets.

Felder

parent

string

Das Projekt, aus dem ProductSets aufgelistet werden sollen.

Das Format ist projects/PROJECT_ID/locations/LOC_ID.

page_size

int32

Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100.

page_token

string

Der Wert „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

ListProductSetsResponse

Antwortnachricht für die ListProductSets-Methode.

Felder

product_sets[]

ProductSet

Liste der ProductSets.

next_page_token

string

Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind.

ListProductsInProductSetRequest

Anfragenachricht für die Methode ListProductsInProductSet.

Felder

name

string

Die ProductSet-Ressource, für die Produkte abgerufen werden sollen.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

page_size

int32

Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100.

page_token

string

Der Wert „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

ListProductsInProductSetResponse

Antwortnachricht für die Methode ListProductsInProductSet.

Felder

products[]

Die Liste der Produkte.

next_page_token

string

Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind.

ListProductsRequest

Anfragenachricht für die Methode ListProducts.

Felder

parent

string

Das Projekt ODER ProductSet, aus dem Produkte aufgelistet werden sollen.

Format: projects/PROJECT_ID/locations/LOC_ID

page_size

int32

Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100.

page_token

string

Der Wert „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

ListProductsResponse

Antwortnachricht für die Methode ListProducts.

Felder

products[]

Liste der Produkte.

next_page_token

string

Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind.

ListReferenceImagesRequest

Anfragenachricht für die Methode ListReferenceImages.

Felder

parent

string

Ressourcenname des Produkts, das die Referenzbilder enthält.

Das Format ist projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID.

page_size

int32

Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. Standardmäßig 10, maximal 100.

page_token

string

Ein Token, das eine Ergebnisseite identifiziert, die zurückgegeben werden soll. Dies ist der Wert von nextPageToken, der in einer vorherigen Anfrage der Referenzbildliste zurückgegeben wurde.

Wenn keine Angabe gemacht wird, wird standardmäßig die erste Seite verwendet.

ListReferenceImagesResponse

Antwortnachricht für die Methode ListReferenceImages.

Felder

reference_images[]

ReferenceImage

Die Liste der Referenzbilder.

page_size

int32

Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100.

next_page_token

string

Der „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben.

LocalizedBarcodeAnnotation

Satz erkannter Barcodes mit Begrenzungsrahmen.

Felder
`format`	`string` Das Barcodeformat beschreibt das Format eines Barcodes. Unterstützte Formate sind: CODE_128: Code 128-Typ. CODE_39: Code 39-Typ. CODE_93: Code 93-Typ. CODABAR: Codabar-Typ. DATA_MATRIX: 2D-Data-Matrix-Typ. ITF: ITF-Typ. EAN_13: EAN-13-Typ. EAN_8: EAN-8-Typ. QR_CODE: 2D-QR-Codetyp. UPC_A: UPC-A-Typ. UPC_E: UPC-E-Typ. PDF417: PDF417-Typ. AZTEC: 2D-Aztec-Codetyp. DATABAR: GS1-DataBar-Codetyp.
`value_format`	`string` Das Barcode-Wertformat beschreibt das Format des Werts, den ein Barcode codiert. Unterstützte Wertformate sind: CONTACT_INFO: Kontaktdaten. EMAIL: E-Mail-Adresse. ISBN: ISBN-Kennung. PHONE: Telefonnummer. PRODUCT: Produkt. SMS: SMS-Nachricht. TEXT: Textstring. URL: URL-Adresse. WIFI: WLAN-Informationen. GEO: Geolokalisierung (Länge und Breite). CALENDAR_EVENT: Kalendertermin. DRIVER_LICENSE: Führerschein.
`value`	`string` Barcodewert, also der im Barcode erfasste ASCII-Wert Barcode kann strukturierte Werte codieren, z. B. 'MEBKM:TITLE:Google;URL:https://www.google.com;;'.
`confidence`	`float` Konfidenzwert des Ergebnisses. Bereich [0, 1].
`bounding_poly`	`BoundingPoly` Bildbereich, zu dem dieser Barcode gehört. Dies muss ausgefüllt werden.

LocalizedObjectAnnotation

Satz erkannter Objekte mit Begrenzungsrahmen

Felder
`mid`	`string` Objekt-ID, die mit EntityAnnotation mittig ausgerichtet werden soll.
`language_code`	`string` Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“ Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.
`name`	`string` Objektname, ausgedrückt in der Sprache `language_code`.
`score`	`float` Punktzahl des Ergebnisses. Bereich [0, 1].
`bounding_poly`	`BoundingPoly` Bildbereich, zu dem diese Entität gehört. Darf nicht leer sein.

LocationInfo

Erkannte Entitätsstandortinformationen

Felder

lat_lng

LatLng

Breiten-/Längengradkoordinaten des Standorts

NormalizedVertex

Ein Scheitelpunkt repräsentiert einen 2D-Punkt im Bild. HINWEIS: Die normalisierten Eckpunktkoordinaten sind relativ zum Originalbild und reichen von 0 bis 1.

Felder

x

float

X-Koordinate

y

float

Y-Koordinate

OperationMetadata

Enthält Metadaten für den BatchAnnotateImages-Vorgang.

Felder

state

State

Aktueller Status des Batchvorgangs.

create_time

Die Uhrzeit, zu der die Batchanfrage empfangen wurde.

update_time

Die Uhrzeit, zu der das Ergebnis des Vorgangs zuletzt aktualisiert wurde.

Status

Status für Batchvorgänge.

Enums
`STATE_UNSPECIFIED`	Ungültig.
`CREATED`	Anfrage ist eingegangen
`RUNNING`	Die Anfrage wird aktiv verarbeitet.
`DONE`	Die Batchverarbeitung ist abgeschlossen
`CANCELLED`	Die Batchverarbeitung wurde abgebrochen

OutputConfig

Der gewünschte Ausgabeort und die gewünschten Metadaten.

Felder

gcs_destination

GcsDestination

Der Google Cloud Storage-Speicherort, in den die Ausgabe geschrieben wird.

batch_size

int32

Die maximale Anzahl von Antwort-Protos, die in jede JSON-Ausgabedatei in Google Cloud Storage eingefügt werden sollen. Der gültige Bereich ist [1, 100]. Wenn keine Angabe erfolgt, beträgt der Standardwert 20.

Bei einer PDF-Datei mit 100 Seiten werden beispielsweise 100 Antwort-Proto-Dateien generiert. Bei batch_size = 20 werden 5 JSON-Dateien mit 20 Antwort-Proto-Dateien unter dem Präfix gcs_destination geschrieben.uri

Derzeit gilt batch_size nur für GcsDestination. Künftig werden möglicherweise auch andere Ausgabekonfigurationen unterstützt.

Seite

Mit OCR erkannte Seite

Felder
`property`	`TextProperty` Weitere auf der Seite erkannte Informationen.
`width`	`int32` Seitenbreite. Bei PDF-Dateien handelt es sich bei der Einheit um Punkte. Bei Bildern (einschließlich TIFFs) ist die Einheit Pixel.
`height`	`int32` Seitenhöhe. Bei PDF-Dateien handelt es sich bei der Einheit um Punkte. Bei Bildern (einschließlich TIFFs) ist die Einheit Pixel.
`blocks[]`	`Block` Liste von Textblöcken, Bildern usw. auf dieser Seite
`confidence`	`float` Die Konfidenz der OCR-Ergebnisse auf der Seite. Bereich [0, 1].
`merged_text`	`string` Der gesamte auf dieser Seite erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.page_filter angegeben ist.

Absatz

Strukturelle Texteinheit, die mehrere Wörter in einer bestimmten Reihenfolge darstellt

Felder
`property`	`TextProperty` Zusätzliche für den Absatz erkannte Informationen
`bounding_box`	`BoundingPoly` Der Begrenzungsrahmen für den Absatz. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 \| \| 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 \| \| 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).
`words[]`	`Word` Liste der Wörter in diesem Absatz.
`confidence`	`float` Die Konfidenz der OCR-Ergebnisse für den Absatz. Bereich [0, 1].
`merged_text`	`string` Der gesamte in diesem Absatz erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.paragraph_filter angegeben ist.

Position

Eine 3D-Position im Bild, die hauptsächlich für Gesichtserkennungs-Landmarks verwendet wird. Eine gültige Position muss sowohl x- als auch y-Koordinaten haben. Die Positionskoordinaten haben den gleichen Maßstab wie das Originalbild.

Felder

x

float

X-Koordinate

y

float

Y-Koordinate

z

float

Z-Koordinate (oder Tiefe)

Produkt

Ein Produkt enthält ReferenceImages.

Felder
`name`	`string` Der Ressourcenname des Produkts. Das Format ist: `projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID`. Dieses Feld wird beim Erstellen eines Produkts ignoriert.
`display_name`	`string` Der vom Nutzer bereitgestellte Name für dieses Produkt. Darf nicht leer sein. Darf höchstens 4.096 Zeichen lang sein.
`description`	`string` Vom Nutzer bereitgestellte Metadaten, die mit diesem Produkt gespeichert werden sollen. Darf höchstens 4.096 Zeichen lang sein.
`product_category`	`string` Die Kategorie des zum Referenzbild gehörenden Produkts. Sollte entweder „homegoods“, „apparel“ oder „toys“ sein. Dieses Feld ist unveränderlich.
`product_labels[]`	`KeyValue` Schlüssel/Wert-Paare, die an ein Produkt angehängt werden können. Zum Zeitpunkt der Abfrage können Einschränkungen basierend auf den product_labels festgelegt werden. Ganzzahlwerte können als Strings bereitgestellt werden, z. B. „1199“. Nur Strings mit ganzzahligen Werten können einer bereichsbasierten Einschränkung entsprechen. Diese Funktion wird bald unterstützt. Einem Schlüssel können mehrere Werte zugewiesen werden. Ein Produkt kann bis zu 100 product_labels haben.

KeyValue

Ein Produktlabel, das als Schlüssel/Wert-Paar dargestellt wird.

Felder

key

string

Der Schlüssel des Labels, das an das Produkt angehängt ist. Darf nicht leer sein und 128 Byte nicht überschreiten.

value

string

Der Wert des Labels, das an das Produkt angehängt wird. Darf nicht leer sein und 128 Byte nicht überschreiten.

ProductSearchParams

Parameter für eine Anfrage für die Produktsuche.

Felder
`bounding_poly`	`BoundingPoly` Das Begrenzungspolygon um den gewünschten Bereich im Bild. Optional. Ist er nicht angegeben, entscheidet das System.
`product_set`	`string` Der Ressourcenname eines `ProductSet`, in dem nach ähnlichen Bildern gesucht werden soll. Das Format ist: `projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID`.
`product_categories[]`	`string` Die Liste der Produktkategorien, in denen gesucht werden soll. Momentan berücksichtigen wir nur die erste Kategorie. Wir müssen entweder „homegoods“, „apparel“ oder „toys“ angeben.
`filter`	`string` Der Filterausdruck. Damit können Suchergebnisse basierend auf Produktlabels beschränkt werden. Derzeit wird AND von OR von Schlüssel/Wert-Paar-Ausdrücken unterstützt, in denen jeder Ausdruck in einem OR denselben Schlüssel haben muss. Zum Beispiel ist „(color = red ODER color = blue) UND Marke = Google“ akzeptabel, aber „(color = red ODER Marke = Google)“ oder „color: red“ ist nicht zulässig.

ProductSearchResults

Ergebnisse für eine Produktsuche

Felder

index_time

Zeitstempel des Index, der diese Ergebnisse bereitgestellt hat. Änderungen nach diesem Zeitpunkt werden in den aktuellen Ergebnissen nicht angezeigt.

results[]

Result

Ergebnisliste, eine für jede Produktübereinstimmung.

product_grouped_results[]

GroupedResult

Liste der Ergebnisse, die nach im Abfragebild erkannten Produkten gruppiert sind. Jeder Eintrag entspricht einem Begrenzungspolygon im Abfragebild und enthält die passenden Produkte für diese Region. Es kann zu Übereinstimmungen bei den Produkten kommen, die alle Produktergebnisse enthalten.

GroupedResult

Informationen zu Produkten, die einem einzelnen Produkt in einem Abfragebild ähneln.

Felder

bounding_poly

Das Begrenzungspolygon um das im Abfragebild erkannte Produkt.

results[]

Result

Ergebnisliste, eine für jede Produktübereinstimmung.

object_annotations[]

ObjectAnnotation

Liste der allgemeinen Vorhersagen für das Objekt im Begrenzungsrahmen.

ObjectAnnotation

Vorhersage für das Objekt im Begrenzungsrahmen.

Felder
`mid`	`string` Objekt-ID, die mit EntityAnnotation mittig ausgerichtet werden soll.
`language_code`	`string` Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“ Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.
`name`	`string` Objektname, ausgedrückt in der Sprache `language_code`.
`score`	`float` Punktzahl des Ergebnisses. Bereich [0, 1].

Ergebnis

Informationen zu einem Produkt.

Felder

product

Produkt

score

float

Eine Konfidenzstufe der Übereinstimmung, zwischen 0 (keine Konfidenz) und 1 (hohe Konfidenz).

image

string

Der Ressourcenname des Bildes des Produkts, das der Abfrage am nächsten kommt.

ProductSet

Ein ProductSet enthält Produkte. Ein ProductSet kann maximal 1 Million Referenzbilder enthalten. Wird diese Beschränkung überschritten, schlägt die regelmäßige Indexierung fehl.

Felder
`name`	`string` Der Ressourcenname des ProductSets. Das Format ist: `projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID`. Dieses Feld wird beim Erstellen eines ProductSets ignoriert.
`display_name`	`string` Der vom Nutzer bereitgestellte Name für dieses ProductSet. Darf nicht leer sein. Darf höchstens 4.096 Zeichen lang sein.
`index_time`	`Timestamp` Nur Ausgabe. Der Zeitpunkt, zu dem dieses ProductSet zuletzt indexiert wurde. Die Abfrageergebnisse spiegeln alle Aktualisierungen vor diesem Zeitpunkt wider. Wenn dieses ProductSet nie indexiert wurde, ist dieser Zeitstempel der Standardwert „1970-01-01T00:00:00Z“. Dieses Feld wird beim Erstellen eines ProductSets ignoriert.
`index_error`	`Status` Nur Ausgabe. Wenn bei der Indexierung des ProductSets ein Fehler aufgetreten ist, wird das Feld ausgefüllt. Dieses Feld wird beim Erstellen eines ProductSets ignoriert.

Attribut

Eine Property besteht aus einem vom Nutzer bereitgestellten Name-Wert-Paar.

Felder
`name`	`string` Name der Eigenschaft
`value`	`string` Wert der Eigenschaft
`uint64_value`	`uint64` Wert von numerischen Eigenschaften
`confidence`	`float` Wert im Bereich [0, 1]. Die Konfidenz dieses Attributwerts.
`mid`	`string` Intransparente Attributwert-ID. Einige IDs sind möglicherweise in der Google Knowledge Graph Search API verfügbar. Ein Beispielattribut für einen blauen Mantel wäre: Property { name: 'color' value: 'blue' mid: '/m/01g5v' // For color blue }

QualityOptimizationParams

Parameter für die Optimierung der Bildqualität

Felder
`type`	`Type` Wählen Sie einen Optimierungstyp aus.
`compression_config`	`CompressionConfig` Geben Sie die Komprimierungskonfiguration an.
`enhancement_config`	`EnhancementConfig` Geben Sie die Konfiguration für die automatische Optimierung an.
`quality_score_config`	`QualityScoreConfig` Legen Sie die Konfiguration für den Qualitätsfaktor fest.

CompressionConfig

Konfiguration zur Komprimierung

Felder

target_quality

float

Im Bereich [0, 1]. Zielqualität nach Komprimierung. 1 bedeutet verlustfrei im Vergleich zum Eingabebild, 0 bedeutet, dass keine Mindestqualität erforderlich ist.

EnhancementConfig

Konfiguration für ENHANCEMENT. Wenn Sie enhancement_config nicht angeben, werden die Standardwerte sharpening_level gleich 0,5, auto_hdr_level gleich 0,5 und upscale_ratio gleich 1 verwendet. Wenn Sie einen der drei Parameter anpassen möchten, müssen Sie die gesamte EnhancementConfig angeben. Wenn Sie beispielsweise einen höheren Wert für auto_hdr_level verwenden möchten, wodurch das Bild in der Regel heller wird, und das Level der Scharfstellung und das Skalierungsverhältnis in der Standardeinstellung beibehalten möchten, können Sie die Konfiguration so festlegen: enhancement_config { sharpening_level: 0.5 auto_hdr_level: 1.0 upscale_ratio: 1 }

Felder

sharpening_level

float

Im Bereich [0,1]. Level der Scharfstellung, 0 bedeutet keine Scharfstellung, 1 bedeutet größtmögliche Scharfstellung. Der Standardwert ist 0.5.

auto_hdr_level

float

Im Bereich [0,1]. Auto-HDR-Level, 0 bedeutet, dass keine automatische HDR vorliegt, 1 steht für größtmögliche AutoHDR. Der Standardwert ist 0.5.

upscale_ratio

float

Im Bereich [1, 2]. Der Standardwert ist 1, d. h. es wird keine Hochskalierung verwendet. Wenn dieser Wert angegeben ist, entspricht die Ausgabehöhe und -breite der ursprünglichen Höhe und Breite multipliziert mit dem Skalierungsverhältnis.

QualityScoreConfig

Konfiguration für den Qualitätsfaktor

Felder

quality_model

string

Geben Sie an, welches Modell verwendet werden soll. Der Standardwert ist ein leerer String und der ästhetische Wert wird zurückgegeben. Ein weiteres unterstütztes Qualitätsmodell ist "builtin/technical-score". Damit wird die technische Qualität des Bilds zurückgegeben.

Typ

Enum für Typ der Qualitätsoptimierung.

Enums
`TYPE_UNSPECIFIED`	Ungültig Der Kunde muss einen Typ auswählen.
`COMPRESSION`	Reduzieren Sie die Größe der Bilddatei. Detaillierte Parameter sind in CompressionConfig angegeben. Wenn der Kunde CompressionConfig nicht angibt, verringert er damit die Größe der Bilddatei, ohne die Bildqualität zu beeinträchtigen. Wenn der Kunde CompressionConfig angibt, reduzieren wir die Dateigröße, während CompressionParams-target_quality beibehalten wird.
`ENHANCEMENT`	Rauschreduktion, Scharfstellen, HDR und Skalierung Detaillierte Parameter, die in EnhancementConfig angegeben werden. Wenn der Kunde EnhancementConfig nicht angibt, wird eine Bildoptimierung mit Standardwerten durchgeführt. Wenn upscale_ratio nicht angegeben ist, hat das Ausgabebild dieselbe Auflösung wie das Eingabebild.
`QUALITY_SCORE`	Qualitätsfaktor für ein Bild abfragen Detaillierte Parameter, die in QualityScoreConfig angegeben werden. Wenn der Kunde QualityScoreConfig nicht angibt, wird der ästhetische Qualitätsfaktor des Bildes zurückgegeben.

QualityOptimizationResult

Speichert optimierte Image-Bytes.

Felder

quality_optimization_type

Type

Erforderlicher Optimierungstyp.

image

bytes

Optimierte Image-Bytes.

mime_type

string

MIME-Typ des Ausgabebilds.

ReferenceImage

Ein ReferenceImage stellt ein Produktbild und die zugehörigen Metadaten wie Begrenzungsrahmen dar.

Felder

name

string

Der Ressourcenname des Referenzbildes.

Das Format ist:

projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID/referenceImages/IMAGE_ID.

Dieses Feld wird beim Erstellen eines Referenzbildes ignoriert.

uri

string

Der Google Cloud Storage-URI des Referenzbildes.

Der URI muss mit gs:// beginnen.

Erforderlich.

bounding_polys[]

Begrenzt Polygone an den relevanten Bereichen im Referenzbild. Optional. Wenn dieses Feld leer ist, versucht das System, Regionen von Interesse zu erkennen. Es werden maximal zehn Begrenzungspolygone verwendet.

Die bereitgestellte Form wird in ein nicht gedrehtes Rechteck konvertiert. Nach der Umwandlung muss der kleine Rand des Rechtecks größer oder gleich 300 Pixel sein. Das Seitenverhältnis muss 1:4 oder niedriger sein, z. B. 1:3 ist zulässig, 1:5 nicht.

RemoveProductFromProductSetRequest

Anfragenachricht für die Methode RemoveProductFromProductSet.

Felder

name

string

Der Ressourcenname des zu ändernden ProductSets.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

product

string

Der Ressourcenname des Produkts, das aus diesem ProductSet entfernt werden soll.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/products/PRODUCT_ID

SafeSearchAnnotation

Eine Reihe von Merkmalen des Bildes, die durch Methoden für Computer Vision in Bezug auf SafeSearch-Kategorien berechnet wurden (z. B. nicht jugendfreie Inhalte, Spoofing, Medizin, Gewalt).

Felder
`adult`	`Likelihood` Stellt die Wahrscheinlichkeit dar, dass das Bild Inhalte nur für Erwachsene enthält. Inhalte nur für Erwachsene können Elemente wie Nacktheit, pornografische Bilder oder Cartoons oder sexuelle Aktivitäten enthalten.
`spoof`	`Likelihood` Wahrscheinlichkeit für Spoofing. Die Wahrscheinlichkeit, dass eine Änderung an der kanonischen Version des Bildes vorgenommen wurde, um es lustig oder anstößig erscheinen zu lassen.
`medical`	`Likelihood` Wahrscheinlichkeit, dass dies ein medizinisches Bild ist.
`violence`	`Likelihood` Wahrscheinlichkeit, dass dieses Bild gewalttätige Inhalte enthält.
`racy`	`Likelihood` Wahrscheinlichkeit, dass das Anfragebild nicht jugendfreie Inhalte enthält. Nicht jugendfreie Inhalte können unter anderem knappe oder durchsichtige Bekleidung, strategisch verhüllte Nacktheit, anzügliche oder provozierende Posen oder Nahaufnahmen sensibler Körperpartien umfassen.

Symbol

Eine einzelne Symboldarstellung

Felder
`property`	`TextProperty` Zusätzliche für das Symbol erkannte Informationen
`bounding_box`	`BoundingPoly` Der Begrenzungsrahmen für das Symbol. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 \| \| 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 \| \| 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3).
`text`	`string` Die tatsächliche UTF-8-Darstellung des Symbols
`confidence`	`float` Die Konfidenz der OCR-Ergebnisse für das Symbol. Bereich [0, 1].

Tabelle

Eine Tabellendarstellung, die der HTML-Tabellenstruktur ähnelt.

Felder

header_rows[]

TableRow

Überschriftszeilen der Tabelle

body_rows[]

TableRow

Textzeilen der Tabelle

TableCell

Eine Zellendarstellung innerhalb von Tabellen.

Felder
`row_span`	`int32` Die Anzahl von Zeilen, die diese Zelle umfasst.
`col_span`	`int32` Die Anzahl von Spalten, die diese Zelle umfasst.
`text_block`	`Block` Textblock für diese Zelle, der auch den normalisierten Begrenzungsrahmen für die Zelle und gegebenenfalls tiefere Strukturen innerhalb einer Zelle enthält.
`text`	`string` Der zusammengeführte Textwert dieser Zelle, wobei umfassendere strukturelle Informationen im Gegensatz zu `text_block` weggelassen werden. Dies ist für einfache Zellen nützlich.

TableRow

Eine Zeile mit Tabellenzellen.

Felder

cells[]

TableCell

Zellen, aus denen diese Zeile besteht.

TableBoundHint

Ein Hinweis für einen Tabellenbegrenzungsrahmen auf der Seite für das Parsen der Tabelle.

Felder

page_number

int32

Optionale Seitennummer für mehrseitige Eingaben, für die dieser Hinweis gilt. Wenn nicht angegeben, gilt dieser Hinweis standardmäßig für alle Seiten. Dieser Wert ist 1-indexiert.

bounding_box

Hinweis zu einem Begrenzungsrahmen für eine Tabelle auf dieser Seite. Die Koordinaten müssen auf [0,1] normalisiert sein und der Begrenzungsrahmen muss ein Rechteck sein, das an den Achsen ausgerichtet ist.

TableDetectionOptions

Optionen für die Tabellenerkennung

Felder

table_bound_hints[]

TableBoundHint

Optionale Hinweise für Tabellenbegrenzungsrahmen, die für komplexe Fälle bereitgestellt werden können, in denen der Algorithmus die Tabelle(n) nicht findet.

TextAnnotation

TextAnnotation enthält eine strukturierte Darstellung von mit OCR extrahiertem Text. Die Hierarchie einer mit OCR extrahierten Textstruktur sieht folgendermaßen aus: TextAnnotation -> Seite -> Block -> Absatz -> Wort -> Symbol. Jede Strukturkomponente ab Seite kann außerdem eigene Eigenschaften haben. Attribute beschreiben erkannte Sprachen, Unterbrechungen usw. Weitere Informationen finden Sie in der TextAnnotation.TextProperty-Nachrichtendefinition unten.

Felder

pages[]

Page

Liste der durch OCR erkannten Seiten

text

string

Auf den Seiten erkannter UTF-8-Text

DetectedBreak

Erkannter Anfang oder erkanntes Ende einer Strukturkomponente

Felder

type

BreakType

Erkannte Art der Unterbrechung

is_prefix

bool

Wahr, wenn die Unterbrechung vor dem Element steht

BreakType

Aufzählung zur Angabe der Art der erkannten Unterbrechung. Neue Zeile, Leerzeichen usw.

Enums
`UNKNOWN`	Unbekannte Art von Unterbrechungslabel
`SPACE`	Normales Leerzeichen
`SURE_SPACE`	Sichere Lücke (sehr breit)
`EOL_SURE_SPACE`	Zeilenumbruch
`HYPHEN`	Bindestrich am Ende der Zeile, der im Text nicht vorhanden ist; tritt nicht gleichzeitig mit `SPACE`, `LEADER_SPACE` oder `LINE_BREAK` auf.
`LINE_BREAK`	Zeilenumbruch, der einen Absatz beendet

DetectedLanguage

Erkannte Sprache für eine Strukturkomponente

Felder

language_code

string

Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“ Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

confidence

float

Die Konfidenz der erkannten Sprache. Bereich [0, 1].

TextProperty

Zusätzliche Informationen, die bei der Strukturkomponente erkannt wurden

Felder

detected_languages[]

DetectedLanguage

Eine Liste der erkannten Sprachen zusammen mit der Konfidenz

detected_break

DetectedBreak

Erkannter Anfang oder erkanntes Ende eines Textsegments

TextDetectionParams

Parameter für Texterkennungen. Wird verwendet, um die Funktionen TEXT_DETECTION und DOCUMENT_TEXT_DETECTION zu steuern.

Felder
`disable_orientation_detection`	`bool` Deaktiviert die Ausrichtungserkennung, sodass gedrehter Text nicht erkannt wird. Dies wird nur für DOCUMENT_TEXT_DETECTION unterstützt.
`disable_text_annotations`	`bool` Deaktiviert das alte Feld „text_annotations“. Es werden nur full_text_annotations zurückgegeben.
`page_filter`	`FieldMask` Steuert, welche Daten auf Seitenebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder sind enthalten.
`block_filter`	`FieldMask` Steuert, welche Daten auf Blockebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer `merged_text` sind enthalten.
`paragraph_filter`	`FieldMask` Steuert, welche Daten auf Absatzebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer `merged_text` sind enthalten.
`word_filter`	`FieldMask` Steuert, welche Daten auf Wortebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer `merged_text` sind enthalten.
`symbol_filter`	`FieldMask` Steuert, welche Daten auf Symbolebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer `bounding_box` sind enthalten.

UpdateProductRequest

Anfragenachricht für die Methode UpdateProduct.

Felder

product