Index
ImageAnnotator(Schnittstelle)ProductSearch(Schnittstelle)AddProductToProductSetRequest(Meldung)AnnotateFileRequest(Meldung)AnnotateFileResponse(Meldung)AnnotateImageRequest(Meldung)AnnotateImageResponse(Meldung)AsyncAnnotateFileRequest(Meldung)AsyncAnnotateFileResponse(Meldung)AsyncBatchAnnotateFilesRequest(Meldung)AsyncBatchAnnotateFilesResponse(Meldung)AsyncBatchAnnotateImagesRequest(Meldung)AsyncBatchAnnotateImagesResponse(Meldung)BatchAnnotateFilesRequest(Meldung)BatchAnnotateFilesResponse(Meldung)BatchAnnotateImagesRequest(Meldung)BatchAnnotateImagesResponse(Meldung)BatchOperationMetadata(Meldung)BatchOperationMetadata.State(Aufzählung)Block(Meldung)Block.BlockType(Aufzählung)BoundingPoly(Meldung)ColorInfo(Meldung)CreateProductRequest(Meldung)CreateProductSetRequest(Meldung)CreateReferenceImageRequest(Meldung)CropHint(Meldung)CropHintsAnnotation(Meldung)CropHintsParams(Meldung)CustomEntityAnnotation(Meldung)DeleteProductRequest(Meldung)DeleteProductSetRequest(Meldung)DeleteReferenceImageRequest(Meldung)DocumentParsingParams(Meldung)DominantColorsAnnotation(Meldung)EntityAnnotation(Meldung)FaceAnnotation(Meldung)FaceAnnotation.Landmark(Meldung)FaceAnnotation.Landmark.Type(Aufzählung)Feature(Meldung)Feature.Type(Aufzählung)GcsDestination(Meldung)GcsSource(Meldung)GetProductRequest(Meldung)GetProductSetRequest(Meldung)GetReferenceImageRequest(Meldung)Image(Meldung)ImageAnnotationContext(Meldung)ImageContext(Meldung)ImageProperties(Meldung)ImageQuality(Meldung)ImageSource(Meldung)ImportProductSetsGcsSource(Meldung)ImportProductSetsInputConfig(Meldung)ImportProductSetsRequest(Meldung)ImportProductSetsResponse(Meldung)InputConfig(Meldung)KeyValuePair(Meldung)LatLongRect(Meldung)Likelihood(Aufzählung)ListProductSetsRequest(Meldung)ListProductSetsResponse(Meldung)ListProductsInProductSetRequest(Meldung)ListProductsInProductSetResponse(Meldung)ListProductsRequest(Meldung)ListProductsResponse(Meldung)ListReferenceImagesRequest(Meldung)ListReferenceImagesResponse(Meldung)LocalizedBarcodeAnnotation(Meldung)LocalizedObjectAnnotation(Meldung)LocationInfo(Meldung)NormalizedVertex(Meldung)OperationMetadata(Meldung)OperationMetadata.State(Aufzählung)OutputConfig(Meldung)Page(Meldung)Paragraph(Meldung)Position(Meldung)Product(Meldung)Product.KeyValue(Meldung)ProductSearchParams(Meldung)ProductSearchResults(Meldung)ProductSearchResults.GroupedResult(Meldung)ProductSearchResults.ObjectAnnotation(Meldung)ProductSearchResults.Result(Meldung)ProductSet(Meldung)Property(Meldung)QualityOptimizationParams(Meldung)QualityOptimizationParams.CompressionConfig(Meldung)QualityOptimizationParams.EnhancementConfig(Meldung)QualityOptimizationParams.QualityScoreConfig(Meldung)QualityOptimizationParams.Type(Aufzählung)QualityOptimizationResult(Meldung)ReferenceImage(Meldung)RemoveProductFromProductSetRequest(Meldung)SafeSearchAnnotation(Meldung)Symbol(Meldung)Table(Meldung)Table.TableCell(Meldung)Table.TableRow(Meldung)TableBoundHint(Meldung)TableDetectionOptions(Meldung)TextAnnotation(Meldung)TextAnnotation.DetectedBreak(Meldung)TextAnnotation.DetectedBreak.BreakType(Aufzählung)TextAnnotation.DetectedLanguage(Meldung)TextAnnotation.TextProperty(Meldung)TextDetectionParams(Meldung)UpdateProductRequest(Meldung)UpdateProductSetRequest(Meldung)Vertex(Meldung)WebDetection(Meldung)WebDetection.WebEntity(Meldung)WebDetection.WebImage(Meldung)WebDetection.WebLabel(Meldung)WebDetection.WebPage(Meldung)WebDetectionParams(Meldung)Word(Meldung)
ImageAnnotator
Dienst, der Google Cloud Vision API-Erkennungsaufgaben für Kundenbilder durchführt, z. B. Gesichts-, Landmark-, Logo-, Label- und Texterkennung. Der ImageAnnotator-Dienst gibt erkannte Entitäten aus den Bildern zurück.
| AsyncBatchAnnotateFiles | |
|---|---|
|
Führt die asynchrone Bilderkennung und -annotation für eine Liste allgemeiner Dateien durch, z. B. PDF-Dateien, die mehrere Seiten und mehrere Bilder pro Seite enthalten können. Fortschritt und Ergebnisse können über die
|
|
| AsyncBatchAnnotateImages | |
|---|---|
|
Führt die asynchrone Bilderkennung und -annotation für eine Liste von Bildern aus. Fortschritt und Ergebnisse können über die Schnittstelle Dieser Dienst schreibt Ausgaben von Annotationsbildern in JSON-Dateien im Google Cloud Storage-Bucket des Kunden, und zwar jede JSON-Datei, die BatchAnnotateImagesResponse.proto enthält.
|
|
| BatchAnnotateFiles | |
|---|---|
|
Dienst, der für einen Batch von Dateien Bilderkennung und -annotation ausführt. Jetzt werden nur „application/pdf“, „image/tiff“ und „image/gif“ unterstützt. Dieser Dienst extrahiert maximal die ersten zehn Frames (gif) oder Seiten (PDF oder TIFF) aus jeder bereitgestellten Datei und führt für jedes extrahierte Bild eine Erkennung und Annotation durch.
|
|
| BatchAnnotateImages | |
|---|---|
|
Führt die Bilderkennung und -annotation für einen Satz von Bildern aus.
|
|
ProductSearch
Verwaltet Produkte und Produktgruppen von Referenzbildern für die Produktsuche. Dabei wird das folgende Ressourcenmodell verwendet:
- Die API verfügt über eine Sammlung von
ProductSet-Ressourcen mit dem Namenprojects/*/locations/*/productSets/*, mit denen verschiedene Produkte in Gruppen unterteilt werden können, um die Identifizierung einzuschränken.
Parallel dazu gilt:
Die API verfügt über eine Sammlung von
Product-Ressourcen mit dem Namenprojects/*/locations/*/products/*.Jedes
Producthat eine Sammlung vonReferenceImage-Ressourcen namensprojects/*/locations/*/products/*/referenceImages/*.
| AddProductToProductSet | |
|---|---|
|
Fügt ein Produkt zum angegebenen ProductSet hinzu. Wenn das Produkt bereits vorhanden ist, wird keine Änderung vorgenommen. Ein Produkt kann maximal 100 Produktgruppen hinzugefügt werden. Mögliche Fehler
|
|
| CreateProduct | |
|---|---|
|
Erstellt eine neue Produktressource und gibt diese zurück. Mögliche Fehler:
|
|
| CreateProductSet | |
|---|---|
|
Erstellt eine neue ProductSet-Ressource und gibt sie zurück. Mögliche Fehler:
|
|
| CreateReferenceImage | |
|---|---|
|
Erstellt eine neue ReferenceImage-Ressource und gibt diese zurück. Das Feld Beachten Sie, dass die Pipeline die Größe des Bilds ändert, wenn es zu groß ist, um es zu verarbeiten (über 50 MP). Mögliche Fehler:
|
|
| DeleteProduct | |
|---|---|
|
Löscht ein Produkt und seine Referenzbilder endgültig. Die Metadaten des Produkts und aller zugehörigen Bilder werden sofort gelöscht. Suchanfragen anhand von Produktgruppen, die das Produkt enthalten, funktionieren jedoch möglicherweise weiterhin, bis alle zugehörigen Caches aktualisiert wurden. Mögliche Fehler:
|
|
| DeleteProductSet | |
|---|---|
|
Löscht ein ProductSet endgültig. Produkte und Referenzbilder im ProductSet werden nicht gelöscht. Die tatsächlichen Bilddateien werden nicht aus Google Cloud Storage gelöscht. Mögliche Fehler:
|
|
| DeleteReferenceImage | |
|---|---|
|
Löscht ein Referenzbild endgültig. Die Metadaten des Bildes werden sofort gelöscht. Suchanfragen anhand von ProductSets, die das Bild enthalten, funktionieren jedoch möglicherweise weiterhin, bis alle zugehörigen Caches aktualisiert wurden. Die tatsächlichen Bilddateien werden nicht aus Google Cloud Storage gelöscht. Mögliche Fehler:
|
|
| GetProduct | |
|---|---|
|
Ruft Informationen zu einem Produkt ab. Mögliche Fehler:
|
|
| GetProductSet | |
|---|---|
|
Ruft Informationen zu einem ProductSet ab. Mögliche Fehler:
|
|
| GetReferenceImage | |
|---|---|
|
Ruft Informationen zu einem ReferenceImage ab. Mögliche Fehler:
|
|
| ImportProductSets | |
|---|---|
|
Asynchrone API, die basierend auf einer Liste von Bildinformationen eine Liste von Referenzbildern in bestimmte ProductSets importiert. Mit der Die Eingabequelle dieser Methode ist eine CSV-Datei in Google Cloud Storage. Das Format der CSV-Datei finden Sie unter
|
|
| ListProductSets | |
|---|---|
|
Listet ProductSets in einer nicht festgelegten Reihenfolge auf. Mögliche Fehler:
|
|
| ListProducts | |
|---|---|
|
Listet Produkte in nicht spezifizierter Reihenfolge auf. Mögliche Fehler:
|
|
| ListProductsInProductSet | |
|---|---|
|
Listet die Produkte in einem ProductSet in einer nicht definierten Reihenfolge auf. Wenn ProductSet nicht vorhanden ist, ist das Feld „products“ der Antwort leer. Mögliche Fehler:
|
|
| ListReferenceImages | |
|---|---|
|
Listet Referenzbilder auf. Mögliche Fehler:
|
|
| RemoveProductFromProductSet | |
|---|---|
|
Entfernt ein Produkt aus dem angegebenen ProductSet. Mögliche Fehler:
|
|
| UpdateProduct | |
|---|---|
|
Nimmt Änderungen an einer Product-Ressource vor. Derzeit können nur die Felder Wenn Labels aktualisiert werden, wird die Änderung erst nach der nächsten Indexzeit in Abfragen berücksichtigt. Mögliche Fehler:
|
|
| UpdateProductSet | |
|---|---|
|
Nimmt Änderungen an einer ProductSet-Ressource vor. Derzeit kann nur display_name aktualisiert werden. Mögliche Fehler:
|
|
AddProductToProductSetRequest
Anfragenachricht für die Methode AddProductToProductSet.
| Felder | |
|---|---|
name |
Der Ressourcenname des zu ändernden ProductSets. Das Format ist: |
product |
Der Ressourcenname des Produkts, das diesem ProductSet hinzugefügt werden soll. Das Format ist: |
AnnotateFileRequest
Eine Anfrage zum Annotieren einer einzelnen Datei, z. B. einer PDF-, TIFF- oder GIF-Datei.
| Felder | |
|---|---|
input_config |
Erforderlich. Informationen zur Eingabedatei. |
features[] |
Erforderlich. Die angeforderten Funktionen. |
image_context |
Zusätzlicher Kontext, der gegebenenfalls die Bilder in der Datei enthält. |
pages[] |
Seiten der Datei, für die die Bildannotation ausgeführt werden soll. Die Seiten beginnen bei 1. Wir gehen davon aus, dass die erste Seite der Datei Seite 1 ist. Pro Anfrage werden maximal 5 Seiten unterstützt. Seiten können negativ sein. Seite 1 steht für die erste Seite. Seite 2 steht für die zweite Seite. Seite -1 steht für die letzte Seite. Seite 2 steht für die vorletzte Seite. Wenn die Datei anstelle von PDF oder TIFF das GIF-Format hat, bezieht sich die Seite auf GIF-Frames. Wenn dieses Feld leer ist, führt der Dienst standardmäßig eine Bildannotation für die ersten fünf Seiten der Datei aus. |
AnnotateFileResponse
Antwort auf eine einzelne Dateiannotationsanfrage. Eine Datei kann ein oder mehrere Bilder enthalten, die jeweils eigene Antworten haben.
| Felder | |
|---|---|
input_config |
Informationen zur Datei, für die diese Antwort generiert wird. |
responses[] |
Einzelne Antworten auf Bilder in der Datei. |
AnnotateImageRequest
Anfrage zum Ausführen von Google Cloud Vision API-Aufgaben für ein von Nutzern bereitgestelltes Bild mit von Nutzern angeforderten Funktionen und Kontextinformationen.
| Felder | |
|---|---|
image |
Das zu verarbeitende Bild |
features[] |
Die angeforderten Funktionen. |
image_context |
Zusätzlicher Kontext, den das Bild umfassen kann |
custom_label_detection_models[] |
Wenn Sie eine Anfrage mit einem |
AnnotateImageResponse
Antworten auf eine Bildanmerkungsanfrage
| Felder | |
|---|---|
face_annotations[] |
Falls vorhanden, wurde die Gesichtserkennung erfolgreich abgeschlossen. |
landmark_annotations[] |
Falls vorhanden, wurde die Landmark-Erkennung erfolgreich abgeschlossen. |
logo_annotations[] |
Falls vorhanden, wurde die Logoerkennung erfolgreich abgeschlossen. |
label_annotations[] |
Falls vorhanden, wurde die Labelerkennung erfolgreich abgeschlossen. |
localized_object_annotations[] |
Falls vorhanden, wurde die Erkennung lokalisierter Objekte erfolgreich abgeschlossen. Diese Sortierung wird absteigend nach Konfidenzwert sortiert. |
custom_label_annotations[] |
Falls vorhanden, wurde die benutzerdefinierte Annotation erfolgreich abgeschlossen. |
text_annotations[] |
Falls vorhanden, wurde die Texterkennung (OCR) erfolgreich abgeschlossen. |
full_text_annotation |
Falls vorhanden, wurde die Erkennung von Text (OCR) oder Dokumenttext (OCR) erfolgreich abgeschlossen. Diese Anmerkung stellt die strukturelle Hierarchie für den OCR-Erkennungstext bereit. |
safe_search_annotation |
Falls vorhanden, wurde die SafeSearch-Anmerkung erfolgreich abgeschlossen. |
image_properties_annotation |
Falls vorhanden, wurden Bildeigenschaften erfolgreich extrahiert. |
crop_hints_annotation |
Falls vorhanden, wurden Zuschneidehinweise erfolgreich abgeschlossen. |
web_detection |
Falls vorhanden, wurde die Weberkennung erfolgreich abgeschlossen. |
product_search_results |
Falls vorhanden, wurde die Produktsuche erfolgreich abgeschlossen. |
error |
Die Fehlermeldung für den Vorgang, falls diese festgelegt ist. Beachten Sie, dass die eingetragenen Bildannotationen garantiert korrekt sind, auch wenn |
context |
Falls vorhanden, sind Kontextinformationen erforderlich, um zu verstehen, woher dieses Bild stammt. |
image_quality_annotation |
Falls vorhanden, wurde die Berechnung der Bildqualität erfolgreich abgeschlossen. |
object_attribute_annotations[] |
Falls vorhanden, wurde die Berechnung der Objektattribute erfolgreich abgeschlossen. Der Attributwert wird in EntityAnnotation.properties angegeben. Beispiel: object_attribute_annotations { properties { name: "color" value: "blue" confidence: 0.1 } properties { name: "color" value: "white" confidence: 0.2 } properties { name: "material" value: "silk" confidence: 0.3 } } |
quality_optimization_result |
Falls vorhanden, wurde die Optimierung der Bildqualität erfolgreich abgeschlossen. |
localized_barcode_annotations[] |
Falls vorhanden, wurde die Barcodeerkennung erfolgreich abgeschlossen. |
AsyncAnnotateFileRequest
Eine Anfrage für eine Offline-Dateiannotation.
| Felder | |
|---|---|
input_config |
Erforderlich. Informationen zur Eingabedatei. |
features[] |
Erforderlich. Die angeforderten Funktionen. |
image_context |
Zusätzlicher Kontext, der gegebenenfalls die Bilder in der Datei enthält. |
output_config |
Erforderlich. Der gewünschte Speicherort und die gewünschten Metadaten der Ausgabe (z. B. Format). |
AsyncAnnotateFileResponse
Die Antwort auf eine einzelne Annotation einer Offlinedatei.
| Felder | |
|---|---|
output_config |
Der Speicherort und die Metadaten der AsyncAnnotateFileRequest. |
AsyncBatchAnnotateFilesRequest
Mehrere Anfragen für asynchrone Dateiannotationen werden in einem einzigen Dienstaufruf zusammengefasst.
| Felder | |
|---|---|
requests[] |
Individuelle asynchrone Dateiannotationsanfragen für diesen Batch. |
AsyncBatchAnnotateFilesResponse
Antwort auf eine asynchrone Batchanfrage zur Annotation von Batchdateien.
| Felder | |
|---|---|
responses[] |
Die Liste der Antworten zur Dateiannotation, eine für jede Anfrage in AsyncBatchAnnotateFilesRequest. |
AsyncBatchAnnotateImagesRequest
Anfrage für die asynchrone Bildannotation für eine Liste von Bildern.
| Felder | |
|---|---|
requests[] |
Individuelle Bildannotationsanfragen für diesen Satz |
output_config |
Pflichtangabe. Der gewünschte Speicherort und die gewünschten Metadaten der Ausgabe (z. B. Format). |
AsyncBatchAnnotateImagesResponse
Antwort auf eine Anfrage zur asynchronen Batchannotation für Bilder
| Felder | |
|---|---|
output_config |
Der Speicherort und die Metadaten der AsyncBatchAnnotateImagesRequest. |
BatchAnnotateFilesRequest
Eine Liste mit Anfragen zum Annotieren von Dateien mithilfe der BatchAnnotateFiles API.
| Felder | |
|---|---|
requests[] |
Die Liste der Annotationsanfragen Derzeit unterstützen wir in BatchAnnotateFilesRequest nur eine AnnotateFileRequest. |
BatchAnnotateFilesResponse
Eine Liste von Antworten zu Dateiannotationen.
| Felder | |
|---|---|
responses[] |
Die Liste der Antworten zur Dateiannotation, wobei jede Antwort jeder AnnotateFileRequest in BatchAnnotateFilesRequest entspricht. |
BatchAnnotateImagesRequest
Mehrere Bildanmerkungsanfragen werden in einem einzelnen Dienstaufruf zusammengefasst.
| Felder | |
|---|---|
requests[] |
Individuelle Bildanmerkungsanfragen für diesen Satz |
BatchAnnotateImagesResponse
Antwort auf eine Anmerkungsanfrage für Sätze von Bildern
| Felder | |
|---|---|
responses[] |
Individuelle Antworten auf Bildannotationsanfragen innerhalb des Satzes. |
BatchOperationMetadata
Metadaten für Batchvorgänge wie den aktuellen Status.
Dies ist im Feld metadata von Operation enthalten, das durch den Aufruf GetOperation des google::longrunning::Operations-Dienstes zurückgegeben wird.
| Felder | |
|---|---|
state |
Der aktuelle Status des Batchvorgangs. |
submit_time |
Der Zeitpunkt, zu dem die Batchanfrage an den Server gesendet wurde. |
end_time |
Der Zeitpunkt, zu dem die Batchanfrage beendet und |
Status
Zählt die möglichen Statusangaben auf, die die Batchanfrage aufweisen kann.
| Enums | |
|---|---|
STATE_UNSPECIFIED |
Ungültig. |
PROCESSING |
Die Anfrage wird aktiv verarbeitet. |
SUCCESSFUL |
Die Anfrage ist abgeschlossen und mindestens ein Element wurde erfolgreich verarbeitet. |
FAILED |
Die Anfrage wurde abgeschlossen und es wurde kein Element erfolgreich verarbeitet. |
CANCELLED |
Die Anfrage wurde ausgeführt, nachdem der Nutzer longrunning.Operations.CancelOperation aufgerufen hat. Alle Datensätze, die vor dem Abbruchbefehl verarbeitet wurden, werden wie in der Anfrage angegeben ausgegeben. |
Block
Logisches Element auf der Seite
| Felder | |
|---|---|
property |
Zusätzliche für den Block erkannte Informationen |
bounding_box |
Der Begrenzungsrahmen für den Block. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel:
und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3). |
paragraphs[] |
Liste der Absätze in diesem Block (wenn der Block den Typ „Text“ hat) |
block_type |
Erkannter Blocktyp (Text, Bild usw.) für diesen Block |
confidence |
Die Konfidenz der OCR-Ergebnisse für den Block. Bereich [0, 1]. |
table |
Erkannte Tabelle für TABLE-block_type. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es über TextDetectionParams.table_detection_options aktiviert ist. Die |
key_value_pair |
Erkanntes Paar für KEY_VALUE_PAIR-block_type. Dieses Feld wird standardmäßig nur zurückgegeben, wenn DocumentType angegeben ist. |
merged_text |
Der gesamte in diesem Block erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.block_filter angegeben ist. |
BlockType
Typ eines Blocks (Text, Bild usw.), der durch OCR identifiziert wurde.
| Enums | |
|---|---|
UNKNOWN |
Unbekannter Blocktyp |
TEXT |
Normaler Textblock |
TABLE |
Tabellenblock |
PICTURE |
Bildblock |
RULER |
Feld mit horizontaler/vertikaler Linie |
BARCODE |
Barcodeblock |
KEY_VALUE_PAIR |
Ein Block von Schlüssel/Wert-Paaren |
BoundingPoly
Ein Begrenzungspolygon für die erkannte Bildanmerkung
| Felder | |
|---|---|
vertices[] |
Die Eckpunkte des Begrenzungspolygons. |
normalized_vertices[] |
Die normalisierten Eckpunkte des Eckpolygons. |
ColorInfo
Die Farbinformationen umfassen RGB-Kanäle, den Wert sowie den Anteil des Bildes, den die jeweilige Farbe einnimmt.
| Felder | |
|---|---|
color |
RGB-Komponenten der Farbe |
score |
Bildspezifischer Wert für diese Farbe. Wert im Bereich [0, 1]. |
pixel_fraction |
Der Anteil der Pixel, die die jeweilige Farbe im Bild belegt. Wert im Bereich [0, 1]. |
CreateProductRequest
Anfragenachricht für die Methode CreateProduct.
| Felder | |
|---|---|
parent |
Das Projekt, in dem das Produkt erstellt werden soll. Das Format ist |
product |
Das zu erstellende Produkt. |
product_id |
Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses Produkt. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen |
CreateProductSetRequest
Anfragenachricht für die Methode CreateProductSet.
| Felder | |
|---|---|
parent |
Das Projekt, in dem das ProductSet erstellt werden soll. Das Format ist |
product_set |
Das zu erstellende ProductSet. |
product_set_id |
Eine vom Nutzer bereitgestellte Ressourcen-ID für dieses ProductSet. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen |
CreateReferenceImageRequest
Anfragenachricht für die Methode CreateReferenceImage.
| Felder | |
|---|---|
parent |
Ressourcenname des Produkts, in dem das Referenzbild erstellt werden soll. Das Format ist |
reference_image |
Das zu erstellende Referenzbild. Wenn eine Bild-ID angegeben wird, wird sie ignoriert. |
reference_image_id |
Eine vom Nutzer bereitgestellte Ressourcen-ID für das ReferenceImage, das hinzugefügt werden soll. Wenn sie festgelegt ist, versucht der Server, diesen Wert als Ressourcen-ID zu verwenden. Wenn sie bereits verwendet wird, wird ein Fehler mit dem Code ALREADY_EXISTS zurückgegeben. Darf höchstens 128 Zeichen lang sein. Darf das Zeichen |
CropHint
Einzelner Zuschneidehinweis, der zum Generieren eines neuen Zuschneidevorgangs beim Verarbeiten eines Bildes verwendet wird.
| Felder | |
|---|---|
bounding_poly |
Das Begrenzungspolygon für den Zuschnittbereich. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds. |
confidence |
Die Konfidenz, dass dies ein wichtiger Bereich ist. Bereich [0, 1]. |
importance_fraction |
Anteil der Bedeutung dieses auffälligen Bereichs in Bezug auf das Originalbild. |
CropHintsAnnotation
Ein Satz von Zuschneidehinweisen, die zum Generieren neuer Zuschneidevorgänge beim Verarbeiten von Bildern verwendet werden.
| Felder | |
|---|---|
crop_hints[] |
Ergebnisse der Zuschneidehinweise |
CropHintsParams
Parameter für Annotationsanfragen zu Zuschneidehinweisen
| Felder | |
|---|---|
aspect_ratios[] |
Seitenverhältnisse in Gleitkommazahlen, die das Verhältnis von Breite zu Höhe des Bildes darstellen. Wenn das gewünschte Seitenverhältnis beispielsweise 4:3 ist, sollte der entsprechende Gleitkommawert 1,33333 betragen. Wenn nichts angegeben ist, wird der bestmögliche Zuschnitt geliefert. Die Anzahl der bereitgestellten Seitenverhältnisse ist auf maximal 16 begrenzt; alle nach dem 16. Seitenverhältnis angegebenen Seitenverhältnisse werden ignoriert. |
CustomEntityAnnotation
Eine CustomEntityAnnotation enthält Annotationen, die mit benutzerdefinierten Vision-Modellen vorhergesagt wurden.
| Felder | |
|---|---|
model |
Gibt das benutzerdefinierte Modell an, das zum Erstellen dieser Annotation verwendet wurde. Das Format des Modellnamens ist die Ressourcen-URL des benutzerdefinierten Modells, das abgefragt wurde: |
label |
Das vom benutzerdefinierten Modell vorhergesagte Label. |
score |
Der Konfidenzwert des Labels nach dem benutzerdefinierten Modell. |
DeleteProductRequest
Anfragenachricht für die Methode DeleteProduct.
| Felder | |
|---|---|
name |
Ressourcenname des zu löschenden Produkts. Das Format ist: |
DeleteProductSetRequest
Anfragenachricht für die Methode DeleteProductSet.
| Felder | |
|---|---|
name |
Ressourcenname des zu löschenden ProductSets. Das Format ist: |
DeleteReferenceImageRequest
Anfragenachricht für die Methode DeleteReferenceImage.
| Felder | |
|---|---|
name |
Der Ressourcenname des zu löschenden Referenzbilds. Format ist:
|
DocumentParsingParams
Parameter für die Funktion DOCUMENT_PARSING.
| Felder | |
|---|---|
disable_orientation_detection |
Deaktiviert die Ausrichtungserkennung, sodass gedrehter Text nicht erkannt wird. |
table_detection_options |
Steuert das Verhalten der Tabellenerkennung. Die Tabellenerkennung ist deaktiviert, wenn dieses Feld nicht festgelegt ist. |
document_type |
Geben Sie einen bekannten Dokumenttyp für eine tiefere Strukturerkennung an. Gültige Werte sind derzeit "invoice" oder "general". |
DominantColorsAnnotation
Satz dominierender Farben und ihre entsprechenden Werte
| Felder | |
|---|---|
colors[] |
RGB-Farbwerte mit ihren Werten und ihrem Pixelanteil |
EntityAnnotation
Satz erkannter Entitätsmerkmale
| Felder | |
|---|---|
mid |
Intransparente Entitäts-ID. Einige IDs sind möglicherweise in Google Knowledge Graph Search API verfügbar. |
locale |
Der Sprachcode für die Sprache, in der die textliche |
description |
Entitätstextbeschreibungen in ihrer |
score |
Gesamtwert des Ergebnisses. Bereich [0, 1]. |
confidence |
Eingestellt. Verwenden Sie stattdessen |
topicality |
Die Relevanz des ICA-Labels (Image Content Annotation) für das Bild. Zum Beispiel ist die Relevanz von "Turm" für ein Bild, das den erkannten "Eiffelturm" enthält, wahrscheinlich höher als für ein Bild, das ein erkanntes entferntes, hoch aufragendes Gebäude enthält. Dabei kann die Konfidenz, dass es in jedem Bild einen Turm gibt, gleich sein. Bereich [0, 1]. |
bounding_poly |
Bildbereich, zu dem diese Entität gehört. Nicht für |
locations[] |
Die Standortinformation für die erkannte Entität. Es können mehrere |
properties[] |
Einige Entitäten haben möglicherweise optionale, vom Nutzer angegebene |
FaceAnnotation
Ein Gesichtsannotationsobjekt enthält die Ergebnisse der Gesichtserkennung.
| Felder | |
|---|---|
bounding_poly |
Das Begrenzungspolygon um das Gesicht. Die Koordinaten des Begrenzungsrahmens haben den Maßstab des Originalbilds. Der Begrenzungsrahmen wird so berechnet, dass er das Gesicht entsprechend den menschlichen Erwartungen „einrahmt“. Es basiert auf den Ergebnissen für auffällige Stellen. Es kann sein, dass eine oder mehrere x- bzw. y-Koordinaten im |
fd_bounding_poly |
Das Begrenzungspolygon
(face detection, Gesichtserkennung). |
landmarks[] |
Erkannte markante Stellen im Gesicht (Landmarks). |
roll_angle |
Rollwinkel, der den Betrag der Drehung des Gesichts im Uhrzeigersinn/gegen den Uhrzeigersinn relativ zur senkrechten Achse des Bildes um die Achse senkrecht zum Gesicht angibt. Bereich [-180,180]. |
pan_angle |
Schiebewinkel, der den nach links/rechts gerichteten Winkel des Gesichts relativ zur vertikalen Ebene senkrecht zum Bild anzeigt. Bereich [-180,180]. |
tilt_angle |
Neigungswinkel, der den Aufwärts-/Abwärtswinkel des Gesichts relativ zur horizontalen Ebene des Bildes anzeigt. Bereich [-180,180]. |
detection_confidence |
Erkennungskonfidenz. Bereich [0, 1]. |
landmarking_confidence |
Gesichts-Landmark-Konfidenz. Bereich [0, 1]. |
joy_likelihood |
Wahrscheinlichkeit für Freude. |
sorrow_likelihood |
Wahrscheinlichkeit für Kummer. |
anger_likelihood |
Wahrscheinlichkeit für Wut. |
surprise_likelihood |
Wahrscheinlichkeit für Überraschung. |
under_exposed_likelihood |
Wahrscheinlichkeit für unterbelichtetes Foto. |
blurred_likelihood |
Wahrscheinlichkeit für unscharfes Foto. |
headwear_likelihood |
Wahrscheinlichkeit für Kopfbedeckung. |
Landmark
Eine gesichtsspezifische markante Stelle (z. B. ein Gesichtsmerkmal).
| Felder | |
|---|---|
type |
Gesichts-Landmark-Typ |
position |
Gesichts-Landmark-Position |
Typ
Gesichts-Landmark-Typ (Gesichtsmerkmaltyp). Links und rechts werden aus der Sicht des Betrachters des Bildes definiert, ohne Spiegelprojektionen zu berücksichtigen, die für Fotos typisch sind. Deshalb ist LEFT_EYE typischerweise das rechte Auge der Person.
| Enums | |
|---|---|
UNKNOWN_LANDMARK |
Unbekannte Gesichts-Landmark erkannt. Sollte nicht ausgefüllt sein. |
LEFT_EYE |
Linkes Auge |
RIGHT_EYE |
Rechtes Auge |
LEFT_OF_LEFT_EYEBROW |
Links von der linken Augenbraue |
RIGHT_OF_LEFT_EYEBROW |
Rechte von der linken Augenbraue |
LEFT_OF_RIGHT_EYEBROW |
Linke von der rechten Augenbraue |
RIGHT_OF_RIGHT_EYEBROW |
Rechts von der rechten Augenbraue |
MIDPOINT_BETWEEN_EYES |
Mittelpunkt zwischen den Augen |
NOSE_TIP |
Nasenspitze |
UPPER_LIP |
Oberlippe |
LOWER_LIP |
Unterlippe |
MOUTH_LEFT |
Mund links |
MOUTH_RIGHT |
Mund rechts |
MOUTH_CENTER |
Mundmitte |
NOSE_BOTTOM_RIGHT |
Nase, unten rechts |
NOSE_BOTTOM_LEFT |
Nase, unten links |
NOSE_BOTTOM_CENTER |
Nase, unten Mitte |
LEFT_EYE_TOP_BOUNDARY |
Linkes Auge, obere Begrenzung |
LEFT_EYE_RIGHT_CORNER |
Linkes Auge, rechte Ecke |
LEFT_EYE_BOTTOM_BOUNDARY |
Linkes Auge, untere Begrenzung |
LEFT_EYE_LEFT_CORNER |
Linkes Auge, linke Ecke |
RIGHT_EYE_TOP_BOUNDARY |
Rechtes Auge, obere Begrenzung |
RIGHT_EYE_RIGHT_CORNER |
Rechtes Auge, rechte Ecke |
RIGHT_EYE_BOTTOM_BOUNDARY |
Rechtes Auge, untere Begrenzung |
RIGHT_EYE_LEFT_CORNER |
Rechtes Auge, linke Ecke |
LEFT_EYEBROW_UPPER_MIDPOINT |
Linke Augenbraue, oberer Mittelpunkt |
RIGHT_EYEBROW_UPPER_MIDPOINT |
Rechte Augenbraue, oberer Mittelpunkt |
LEFT_EAR_TRAGION |
Tragion linkes Ohr |
RIGHT_EAR_TRAGION |
Tragion rechtes Ohr |
LEFT_EYE_PUPIL |
Pupille linkes Auge |
RIGHT_EYE_PUPIL |
Pupille rechtes Auge |
FOREHEAD_GLABELLA |
Glabella Stirn |
CHIN_GNATHION |
Gnathion Kinn |
CHIN_LEFT_GONION |
Kinn, linker Gonion |
CHIN_RIGHT_GONION |
Kinn, rechter Gonion |
Funktion
Der Typ der durchzuführenden Google Cloud Vision API-Erkennung und die maximale Anzahl von Ergebnissen, die für diesen Typ zurückgegeben werden sollen. In der Liste features können mehrere Feature-Objekte angegeben werden.
| Felder | |
|---|---|
type |
Funktionstyp |
max_results |
Maximale Anzahl von Ergebnissen dieses Typs Gilt nicht für |
model |
Das für das Feature zu verwendende Modell. Unterstützte Werte: "builtin/stable" (Standardeinstellung, wenn nicht festgelegt) und "builtin/latest". |
Typ
Typ der Google Cloud Vision API-Funktion, die extrahiert werden soll.
| Enums | |
|---|---|
TYPE_UNSPECIFIED |
Nicht angegebener Funktionstyp |
FACE_DETECTION |
Gesichtserkennung ausführen |
LANDMARK_DETECTION |
Sehenswürdigkeiten-Erkennung ausführen |
LOGO_DETECTION |
Logoerkennung ausführen |
LABEL_DETECTION |
Labelerkennung ausführen |
TEXT_DETECTION |
Texterkennung/optische Zeichenerkennung (OCR) ausführen. Die Texterkennung ist für Textbereiche in einem größeren Bild optimiert. Wenn das Bild ein Dokument ist, verwenden Sie stattdessen DOCUMENT_TEXT_DETECTION. |
DOCUMENT_TEXT_DETECTION |
OCR für Dokument mit dicht gesetztem Text ausführen. Hat Vorrang, wenn DOCUMENT_TEXT_DETECTION und TEXT_DETECTION vorhanden sind. |
SAFE_SEARCH_DETECTION |
SafeSearch ausführen, um potenziell unsichere oder unerwünschte Inhalte zu erkennen. |
IMAGE_PROPERTIES |
Eine Reihe von Bildeigenschaften berechnen, z. B. die dominanten Farben des Bildes. |
CROP_HINTS |
Zuschneidehinweise ausführen |
WEB_DETECTION |
Weberkennung ausführen |
PRODUCT_SEARCH |
Produktsuche ausführen |
CUSTOM_LABEL_DETECTION |
Die benutzerdefinierte Labelerkennung ausführen |
OBJECT_LOCALIZATION |
Führen Sie den Localizer für die Objekterkennung aus. |
IMAGE_QUALITY |
Quality Scorer ausführen. |
OBJECT_ATTRIBUTES |
Berechnet die Attribute der im Bild erkannten Objekte. Es werden vier Objektdomains unterstützt. Wählen Sie über Feature.model (erforderlich) aus: "builtin/apparel", "builtin/car", "builtin/food" oder "builtin/wildlife". |
QUALITY_OPTIMIZATION |
Führen Sie Algorithmen zur Qualitätsoptimierung aus. Es gibt drei Arten von Vorgängen: COMPRESSION, ENHANCEMENT und QUALITY_SCORE. Die Parameter COMPRESSION und ENHANCEMENT sowie die Modellauswahl für QUALITY_SCORE können in image_context.quality_optimization_params angegeben werden. |
BARCODE_DETECTION |
Barcodeerkennung ausführen |
DOCUMENT_PARSING |
Führen Sie Algorithmen zum Parsen von Dokumenten aus, um strukturierte Daten wie Tabellen und Formulare zu extrahieren. Die Ergebnisse finden Sie unter full_text_annotation -> page -> block mit dem Typ TABLE für Tabellen oder KEY_VALUE_PAIR für Schlüssel/Wert-Paare in Formularen. |
GcsDestination
Der Google Cloud Storage-Speicherort, in den die Ausgabe geschrieben wird.
| Felder | |
|---|---|
uri |
Der Google Cloud Storage-URI, unter dem die Ergebnisse gespeichert werden. Die Ergebnisse haben das JSON-Format und als Präfix den zugehörigen Eingabe-URI. Dieses Feld kann entweder eine einzelne Datei oder ein Präfix für mehrere Ausgaben darstellen. Präfixe müssen mit Beispiele:
Bei mehreren Ausgaben enthält jede Antwort immer noch AnnotateFileResponse, die jeweils einen Teil der vollständigen Liste von AnnotateImageResponse enthält. Mehrere Ausgaben können auftreten, wenn die JSON-Ausgabe beispielsweise zu groß ist und in mehrere fragmentierte Dateien überläuft. |
GcsSource
Der Google Cloud Storage-Speicherort, aus dem die Eingabe gelesen wird.
| Felder | |
|---|---|
uri |
Der Google Cloud Storage-URI für die Eingabedatei. Dies darf nur ein Google Cloud Storage-Objekt sein. Platzhalter werden derzeit nicht unterstützt. |
GetProductRequest
Anfragenachricht für die Methode GetProduct.
| Felder | |
|---|---|
name |
Ressourcenname des abzurufenden Produkts. Das Format ist: |
GetProductSetRequest
Anfragenachricht für die Methode GetProductSet.
| Felder | |
|---|---|
name |
Ressourcenname des abzurufenden ProductSets. Das Format ist: |
GetReferenceImageRequest
Anfragenachricht für die Methode GetReferenceImage.
| Felder | |
|---|---|
name |
Der Ressourcenname des abzurufenden ReferenceImage. Das Format ist:
|
Bild
Kundenbild, für das Google Cloud Vision API-Aufgaben ausgeführt werden sollen
| Felder | |
|---|---|
content |
Bildinhalt, dargestellt als ein Stream von Byte. Hinweis: Wie bei allen |
source |
Google Cloud Storage-Bildspeicherort oder öffentlich zugängliche Bild-URL Wenn sowohl |
ImageAnnotationContext
Wenn ein Bild aus einer Datei (z. B. einer PDF-Datei) erstellt wurde, enthält diese Nachricht Informationen zur Quelle des Bildes.
| Felder | |
|---|---|
uri |
Der URI der Datei, die zur Erstellung des Bildes verwendet wurde. |
page_number |
Falls es sich um eine PDF- oder TIFF-Datei handelt, gibt dieses Feld die Seitenzahl in der Datei an, die zum Erstellen des Bildes verwendet wurde. |
ImageContext
Bildkontext- bzw. funktionsspezifische Parameter
| Felder | |
|---|---|
lat_long_rect |
Nicht verwendet. |
language_hints[] |
Liste der Sprachen, die für TEXT_DETECTION verwendet werden sollen. Ein leerer Wert liefert in den meisten Fällen jedoch die besten Ergebnisse, weil dadurch die automatische Spracherkennung aktiviert wird. Bei Sprachen, die auf dem lateinischen Alphabet basieren, ist die Einstellung |
crop_hints_params |
Parameter für Annotationsanfragen zu Zuschneidehinweisen |
product_search_params |
Parameter für die Produktsuche |
web_detection_params |
Parameter für Weberkennung |
text_detection_params |
Parameter für die Texterkennung in Dokumenten |
quality_optimization_params |
Parameter für die Optimierung der Bildqualität |
document_parsing_params |
Parameter für das Parsen von Dokumenten |
ImageProperties
Speichert Bildeigenschaften, z. B. dominante Farben
| Felder | |
|---|---|
dominant_colors |
Falls vorhanden, wurden dominante Farben erfolgreich abgeschlossen. |
ImageQuality
Speichert die Bildqualitätsfaktoren, entweder als ästhetische oder technische Qualität.
| Felder | |
|---|---|
quality_score |
Wert, der die ästhetische/technische Qualität des Bilds angibt. Der Wert liegt im Bereich [0, 1]. Ein höherer Wert entspricht professionelleren Fotos. 0 bedeutet, dass das Bild sehr schlecht aussieht, 1 bedeutet, dass das Bild sehr hohe Qualität hat. |
ImageSource
Externe Bildquelle (Google Cloud Storage- oder Web-URL-Bildspeicherort)
| Felder | |
|---|---|
gcs_image_uri |
Verwenden Sie stattdessen Der Google Cloud Storage-URI der Form |
image_uri |
Der URI des Quellbilds. Es gibt folgende Möglichkeiten:
Wenn sowohl |
ImportProductSetsGcsSource
Der Google Cloud Storage-Speicherort für eine CSV-Datei, die in jeder Zeile eine Liste von ImportProductSetRequests enthält.
| Felder | |
|---|---|
csv_file_uri |
Der Google Cloud Storage-URI der CSV-Eingabedatei. Der URI muss mit Das Format der CSV-Eingabedatei sollte ein Bild pro Zeile sein. In jeder Zeile sind acht Spalten vorhanden.
Die Spalten Wenn die Die Spalte Die Spalte Wenn ein Die Spalte In der Spalte Pro Zeile ist maximal eine Spalte Die Spalte Die Größe des Bildes wird vom System angepasst, wenn das Bild zu groß für die Verarbeitung ist (größer als 20 MP). |
ImportProductSetsInputConfig
Der Eingabeinhalt für die Methode ImportProductSets.
| Felder | |
|---|---|
gcs_source |
Der Google Cloud Storage-Speicherort für eine CSV-Datei, die in jeder Zeile eine Liste von ImportProductSetRequests enthält. |
ImportProductSetsRequest
Anfragenachricht für die Methode ImportProductSets.
| Felder | |
|---|---|
parent |
Das Projekt, in das die ProductSets importiert werden sollen. Das Format ist |
input_config |
Der Eingabeinhalt für die Liste der Anfragen. |
ImportProductSetsResponse
Antwortnachricht für die ImportProductSets-Methode.
Diese Nachricht wird von der Methode google.longrunning.Operations.GetOperation im zurückgegebenen Feld google.longrunning.Operation.response zurückgegeben.
| Felder | |
|---|---|
reference_images[] |
Die Liste der erfolgreich importierten reference_images. |
statuses[] |
Der RPC-Status für jede ImportProductSet-Anfrage, einschließlich Erfolg und Fehler. Die Anzahl der Status hier stimmt mit der Anzahl der Zeilen in der CSV-Datei überein. Status[i] speichert den Erfolgs- oder Fehlerstatus der i-ten Zeile der CSV-Datei ab Zeile 0. |
InputConfig
Der gewünschte Eingabeort und die Metadaten.
| Felder | |
|---|---|
gcs_source |
Der Google Cloud Storage-Speicherort, aus dem die Eingabe gelesen werden soll. |
content |
Bildinhalt, dargestellt als ein Bytestream. Hinweis: Wie bei allen Derzeit funktioniert dieses Feld nur für BatchAnnotateFiles-Anfragen. Es funktioniert nicht bei AsyncBatchAnnotateFiles-Anfragen. |
mime_type |
Der Typ der Datei. Derzeit werden nur „application/pdf“ und „image/tiff“ unterstützt. Platzhalter werden nicht unterstützt. |
KeyValuePair
Proto für ein Schlüssel/Wert-Paar.
| Felder | |
|---|---|
key |
Der Schlüsselstring-Wert. |
key_block |
Schlüsselblock des Paars mit dem normalisierten Begrenzungsrahmen und dem Schlüsseltext. |
value_block |
Wertblock des Paars mit dem normalisierten Begrenzungsrahmen und dem normalisierten Werttext, einschließlich potenziell tieferer Strukturen innerhalb des Werttexts. |
value_type |
Typ des Werts. Gültige Strings sind: „generic“: für generischen Text, der einem Wert zugeordnet wird „number“: für numerische Typen „id“: für generische Kennungen „currency“: für Währungswerte „date“: für Datumsangaben „time“: für Zeit- und Dauerwerte „date_range“: für Zeiträume „address“: für Adresswerte (kann lang sein). „person“: für Namen von Personen oder andere persönliche Informationen „phone“: für Telefonnummern |
normalized_key |
(Optional) Der normalisierte Schlüsseltext, wenn der Text üblich und klassifiziert ist. Beispielsweise wird „TOTAL DUE“ auf „Gesamtbetrag“ normalisiert. |
LatLongRect
Durch LatLng-Paare (Min. und Max.) festgelegtes Rechteck
| Felder | |
|---|---|
min_lat_lng |
Breiten-/Längengradpaar (Min.) |
max_lat_lng |
Breiten-/Längengradpaar (Max.) |
Wahrscheinlichkeit
Eine "bucketisierte" Darstellung von Wahrscheinlichkeiten, die Kunden höchst stabile Ergebnisse bei Modellaktualisierungen liefern soll.
| Enums | |
|---|---|
UNKNOWN |
Unbekannte Wahrscheinlichkeit |
VERY_UNLIKELY |
Es ist sehr unwahrscheinlich, dass das Bild zur angegebenen Kategorie gehört. |
UNLIKELY |
Es ist unwahrscheinlich, dass das Bild zur angegebenen Kategorie gehört. |
POSSIBLE |
Es ist möglich, dass das Bild zur angegebenen Kategorie gehört. |
LIKELY |
Es ist wahrscheinlich, dass das Bild zur angegebenen Kategorie gehört. |
VERY_LIKELY |
Es ist sehr wahrscheinlich, dass das Bild zur angegebenen Kategorie gehört. |
ListProductSetsRequest
Anfragenachricht für die Methode ListProductSets.
| Felder | |
|---|---|
parent |
Das Projekt, aus dem ProductSets aufgelistet werden sollen. Das Format ist |
page_size |
Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100. |
page_token |
Der Wert „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben. |
ListProductSetsResponse
Antwortnachricht für die ListProductSets-Methode.
| Felder | |
|---|---|
product_sets[] |
Liste der ProductSets. |
next_page_token |
Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind. |
ListProductsInProductSetRequest
Anfragenachricht für die Methode ListProductsInProductSet.
| Felder | |
|---|---|
name |
Die ProductSet-Ressource, für die Produkte abgerufen werden sollen. Das Format ist: |
page_size |
Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100. |
page_token |
Der Wert „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben. |
ListProductsInProductSetResponse
Antwortnachricht für die Methode ListProductsInProductSet.
| Felder | |
|---|---|
products[] |
Die Liste der Produkte. |
next_page_token |
Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind. |
ListProductsRequest
Anfragenachricht für die Methode ListProducts.
| Felder | |
|---|---|
parent |
Das Projekt ODER ProductSet, aus dem Produkte aufgelistet werden sollen. Format: |
page_size |
Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100. |
page_token |
Der Wert „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben. |
ListProductsResponse
Antwortnachricht für die Methode ListProducts.
| Felder | |
|---|---|
products[] |
Liste der Produkte. |
next_page_token |
Token zum Abrufen der nächsten Ergebnisseite. Leer, wenn keine weiteren Ergebnisse in der Liste vorhanden sind. |
ListReferenceImagesRequest
Anfragenachricht für die Methode ListReferenceImages.
| Felder | |
|---|---|
parent |
Ressourcenname des Produkts, das die Referenzbilder enthält. Das Format ist |
page_size |
Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. Standardmäßig 10, maximal 100. |
page_token |
Ein Token, das eine Ergebnisseite identifiziert, die zurückgegeben werden soll. Dies ist der Wert von Wenn keine Angabe gemacht wird, wird standardmäßig die erste Seite verwendet. |
ListReferenceImagesResponse
Antwortnachricht für die Methode ListReferenceImages.
| Felder | |
|---|---|
reference_images[] |
Die Liste der Referenzbilder. |
page_size |
Die maximale Anzahl der Elemente, die zurückgegeben werden sollen. 10 (Standard), maximal 100. |
next_page_token |
Der „next_page_token“ wurde gegebenenfalls von einer vorherigen Listenanfrage zurückgegeben. |
LocalizedBarcodeAnnotation
Satz erkannter Barcodes mit Begrenzungsrahmen.
| Felder | |
|---|---|
format |
Das Barcodeformat beschreibt das Format eines Barcodes. Unterstützte Formate sind: CODE_128: Code 128-Typ. CODE_39: Code 39-Typ. CODE_93: Code 93-Typ. CODABAR: Codabar-Typ. DATA_MATRIX: 2D-Data-Matrix-Typ. ITF: ITF-Typ. EAN_13: EAN-13-Typ. EAN_8: EAN-8-Typ. QR_CODE: 2D-QR-Codetyp. UPC_A: UPC-A-Typ. UPC_E: UPC-E-Typ. PDF417: PDF417-Typ. AZTEC: 2D-Aztec-Codetyp. DATABAR: GS1-DataBar-Codetyp. |
value_format |
Das Barcode-Wertformat beschreibt das Format des Werts, den ein Barcode codiert. Unterstützte Wertformate sind: CONTACT_INFO: Kontaktdaten. EMAIL: E-Mail-Adresse. ISBN: ISBN-Kennung. PHONE: Telefonnummer. PRODUCT: Produkt. SMS: SMS-Nachricht. TEXT: Textstring. URL: URL-Adresse. WIFI: WLAN-Informationen. GEO: Geolokalisierung (Länge und Breite). CALENDAR_EVENT: Kalendertermin. DRIVER_LICENSE: Führerschein. |
value |
Barcodewert, also der im Barcode erfasste ASCII-Wert Barcode kann strukturierte Werte codieren, z. B. 'MEBKM:TITLE:Google;URL:https://www.google.com;;'. |
confidence |
Konfidenzwert des Ergebnisses. Bereich [0, 1]. |
bounding_poly |
Bildbereich, zu dem dieser Barcode gehört. Dies muss ausgefüllt werden. |
LocalizedObjectAnnotation
Satz erkannter Objekte mit Begrenzungsrahmen
| Felder | |
|---|---|
mid |
Objekt-ID, die mit EntityAnnotation mittig ausgerichtet werden soll. |
language_code |
Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“ Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
name |
Objektname, ausgedrückt in der Sprache |
score |
Punktzahl des Ergebnisses. Bereich [0, 1]. |
bounding_poly |
Bildbereich, zu dem diese Entität gehört. Darf nicht leer sein. |
LocationInfo
Erkannte Entitätsstandortinformationen
| Felder | |
|---|---|
lat_lng |
Breiten-/Längengradkoordinaten des Standorts |
NormalizedVertex
Ein Scheitelpunkt repräsentiert einen 2D-Punkt im Bild. HINWEIS: Die normalisierten Eckpunktkoordinaten sind relativ zum Originalbild und reichen von 0 bis 1.
| Felder | |
|---|---|
x |
X-Koordinate |
y |
Y-Koordinate |
OperationMetadata
Enthält Metadaten für den BatchAnnotateImages-Vorgang.
| Felder | |
|---|---|
state |
Aktueller Status des Batchvorgangs. |
create_time |
Die Uhrzeit, zu der die Batchanfrage empfangen wurde. |
update_time |
Die Uhrzeit, zu der das Ergebnis des Vorgangs zuletzt aktualisiert wurde. |
Status
Status für Batchvorgänge.
| Enums | |
|---|---|
STATE_UNSPECIFIED |
Ungültig. |
CREATED |
Anfrage ist eingegangen |
RUNNING |
Die Anfrage wird aktiv verarbeitet. |
DONE |
Die Batchverarbeitung ist abgeschlossen |
CANCELLED |
Die Batchverarbeitung wurde abgebrochen |
OutputConfig
Der gewünschte Ausgabeort und die gewünschten Metadaten.
| Felder | |
|---|---|
gcs_destination |
Der Google Cloud Storage-Speicherort, in den die Ausgabe geschrieben wird. |
batch_size |
Die maximale Anzahl von Antwort-Protos, die in jede JSON-Ausgabedatei in Google Cloud Storage eingefügt werden sollen. Der gültige Bereich ist [1, 100]. Wenn keine Angabe erfolgt, beträgt der Standardwert 20. Bei einer PDF-Datei mit 100 Seiten werden beispielsweise 100 Antwort-Proto-Dateien generiert. Bei Derzeit gilt batch_size nur für GcsDestination. Künftig werden möglicherweise auch andere Ausgabekonfigurationen unterstützt. |
Seite
Mit OCR erkannte Seite
| Felder | |
|---|---|
property |
Weitere auf der Seite erkannte Informationen. |
width |
Seitenbreite. Bei PDF-Dateien handelt es sich bei der Einheit um Punkte. Bei Bildern (einschließlich TIFFs) ist die Einheit Pixel. |
height |
Seitenhöhe. Bei PDF-Dateien handelt es sich bei der Einheit um Punkte. Bei Bildern (einschließlich TIFFs) ist die Einheit Pixel. |
blocks[] |
Liste von Textblöcken, Bildern usw. auf dieser Seite |
confidence |
Die Konfidenz der OCR-Ergebnisse auf der Seite. Bereich [0, 1]. |
merged_text |
Der gesamte auf dieser Seite erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.page_filter angegeben ist. |
Absatz
Strukturelle Texteinheit, die mehrere Wörter in einer bestimmten Reihenfolge darstellt
| Felder | |
|---|---|
property |
Zusätzliche für den Absatz erkannte Informationen |
bounding_box |
Der Begrenzungsrahmen für den Absatz. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 | | 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 | | 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3). |
words[] |
Liste der Wörter in diesem Absatz. |
confidence |
Die Konfidenz der OCR-Ergebnisse für den Absatz. Bereich [0, 1]. |
merged_text |
Der gesamte in diesem Absatz erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.paragraph_filter angegeben ist. |
Position
Eine 3D-Position im Bild, die hauptsächlich für Gesichtserkennungs-Landmarks verwendet wird. Eine gültige Position muss sowohl x- als auch y-Koordinaten haben. Die Positionskoordinaten haben den gleichen Maßstab wie das Originalbild.
| Felder | |
|---|---|
x |
X-Koordinate |
y |
Y-Koordinate |
z |
Z-Koordinate (oder Tiefe) |
Produkt
Ein Produkt enthält ReferenceImages.
| Felder | |
|---|---|
name |
Der Ressourcenname des Produkts. Das Format ist: Dieses Feld wird beim Erstellen eines Produkts ignoriert. |
display_name |
Der vom Nutzer bereitgestellte Name für dieses Produkt. Darf nicht leer sein. Darf höchstens 4.096 Zeichen lang sein. |
description |
Vom Nutzer bereitgestellte Metadaten, die mit diesem Produkt gespeichert werden sollen. Darf höchstens 4.096 Zeichen lang sein. |
product_category |
Die Kategorie des zum Referenzbild gehörenden Produkts. Sollte entweder „homegoods“, „apparel“ oder „toys“ sein. Dieses Feld ist unveränderlich. |
product_labels[] |
Schlüssel/Wert-Paare, die an ein Produkt angehängt werden können. Zum Zeitpunkt der Abfrage können Einschränkungen basierend auf den product_labels festgelegt werden. Ganzzahlwerte können als Strings bereitgestellt werden, z. B. „1199“. Nur Strings mit ganzzahligen Werten können einer bereichsbasierten Einschränkung entsprechen. Diese Funktion wird bald unterstützt. Einem Schlüssel können mehrere Werte zugewiesen werden. Ein Produkt kann bis zu 100 product_labels haben. |
KeyValue
Ein Produktlabel, das als Schlüssel/Wert-Paar dargestellt wird.
| Felder | |
|---|---|
key |
Der Schlüssel des Labels, das an das Produkt angehängt ist. Darf nicht leer sein und 128 Byte nicht überschreiten. |
value |
Der Wert des Labels, das an das Produkt angehängt wird. Darf nicht leer sein und 128 Byte nicht überschreiten. |
ProductSearchParams
Parameter für eine Anfrage für die Produktsuche.
| Felder | |
|---|---|
bounding_poly |
Das Begrenzungspolygon um den gewünschten Bereich im Bild. Optional. Ist er nicht angegeben, entscheidet das System. |
product_set |
Der Ressourcenname eines Das Format ist: |
product_categories[] |
Die Liste der Produktkategorien, in denen gesucht werden soll. Momentan berücksichtigen wir nur die erste Kategorie. Wir müssen entweder „homegoods“, „apparel“ oder „toys“ angeben. |
filter |
Der Filterausdruck. Damit können Suchergebnisse basierend auf Produktlabels beschränkt werden. Derzeit wird AND von OR von Schlüssel/Wert-Paar-Ausdrücken unterstützt, in denen jeder Ausdruck in einem OR denselben Schlüssel haben muss. Zum Beispiel ist „(color = red ODER color = blue) UND Marke = Google“ akzeptabel, aber „(color = red ODER Marke = Google)“ oder „color: red“ ist nicht zulässig. |
ProductSearchResults
Ergebnisse für eine Produktsuche
| Felder | |
|---|---|
index_time |
Zeitstempel des Index, der diese Ergebnisse bereitgestellt hat. Änderungen nach diesem Zeitpunkt werden in den aktuellen Ergebnissen nicht angezeigt. |
results[] |
Ergebnisliste, eine für jede Produktübereinstimmung. |
product_grouped_results[] |
Liste der Ergebnisse, die nach im Abfragebild erkannten Produkten gruppiert sind. Jeder Eintrag entspricht einem Begrenzungspolygon im Abfragebild und enthält die passenden Produkte für diese Region. Es kann zu Übereinstimmungen bei den Produkten kommen, die alle Produktergebnisse enthalten. |
GroupedResult
Informationen zu Produkten, die einem einzelnen Produkt in einem Abfragebild ähneln.
| Felder | |
|---|---|
bounding_poly |
Das Begrenzungspolygon um das im Abfragebild erkannte Produkt. |
results[] |
Ergebnisliste, eine für jede Produktübereinstimmung. |
object_annotations[] |
Liste der allgemeinen Vorhersagen für das Objekt im Begrenzungsrahmen. |
ObjectAnnotation
Vorhersage für das Objekt im Begrenzungsrahmen.
| Felder | |
|---|---|
mid |
Objekt-ID, die mit EntityAnnotation mittig ausgerichtet werden soll. |
language_code |
Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“ Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
name |
Objektname, ausgedrückt in der Sprache |
score |
Punktzahl des Ergebnisses. Bereich [0, 1]. |
Ergebnis
Informationen zu einem Produkt.
| Felder | |
|---|---|
product |
Produkt |
score |
Eine Konfidenzstufe der Übereinstimmung, zwischen 0 (keine Konfidenz) und 1 (hohe Konfidenz). |
image |
Der Ressourcenname des Bildes des Produkts, das der Abfrage am nächsten kommt. |
ProductSet
Ein ProductSet enthält Produkte. Ein ProductSet kann maximal 1 Million Referenzbilder enthalten. Wird diese Beschränkung überschritten, schlägt die regelmäßige Indexierung fehl.
| Felder | |
|---|---|
name |
Der Ressourcenname des ProductSets. Das Format ist: Dieses Feld wird beim Erstellen eines ProductSets ignoriert. |
display_name |
Der vom Nutzer bereitgestellte Name für dieses ProductSet. Darf nicht leer sein. Darf höchstens 4.096 Zeichen lang sein. |
index_time |
Nur Ausgabe. Der Zeitpunkt, zu dem dieses ProductSet zuletzt indexiert wurde. Die Abfrageergebnisse spiegeln alle Aktualisierungen vor diesem Zeitpunkt wider. Wenn dieses ProductSet nie indexiert wurde, ist dieser Zeitstempel der Standardwert „1970-01-01T00:00:00Z“. Dieses Feld wird beim Erstellen eines ProductSets ignoriert. |
index_error |
Nur Ausgabe. Wenn bei der Indexierung des ProductSets ein Fehler aufgetreten ist, wird das Feld ausgefüllt. Dieses Feld wird beim Erstellen eines ProductSets ignoriert. |
Attribut
Eine Property besteht aus einem vom Nutzer bereitgestellten Name-Wert-Paar.
| Felder | |
|---|---|
name |
Name der Eigenschaft |
value |
Wert der Eigenschaft |
uint64_value |
Wert von numerischen Eigenschaften |
confidence |
Wert im Bereich [0, 1]. Die Konfidenz dieses Attributwerts. |
mid |
Intransparente Attributwert-ID. Einige IDs sind möglicherweise in der Google Knowledge Graph Search API verfügbar. Ein Beispielattribut für einen blauen Mantel wäre: Property { name: 'color' value: 'blue' mid: '/m/01g5v' // For color blue } |
QualityOptimizationParams
Parameter für die Optimierung der Bildqualität
| Felder | |
|---|---|
type |
Wählen Sie einen Optimierungstyp aus. |
compression_config |
Geben Sie die Komprimierungskonfiguration an. |
enhancement_config |
Geben Sie die Konfiguration für die automatische Optimierung an. |
quality_score_config |
Legen Sie die Konfiguration für den Qualitätsfaktor fest. |
CompressionConfig
Konfiguration zur Komprimierung
| Felder | |
|---|---|
target_quality |
Im Bereich [0, 1]. Zielqualität nach Komprimierung. 1 bedeutet verlustfrei im Vergleich zum Eingabebild, 0 bedeutet, dass keine Mindestqualität erforderlich ist. |
EnhancementConfig
Konfiguration für ENHANCEMENT. Wenn Sie enhancement_config nicht angeben, werden die Standardwerte sharpening_level gleich 0,5, auto_hdr_level gleich 0,5 und upscale_ratio gleich 1 verwendet. Wenn Sie einen der drei Parameter anpassen möchten, müssen Sie die gesamte EnhancementConfig angeben. Wenn Sie beispielsweise einen höheren Wert für auto_hdr_level verwenden möchten, wodurch das Bild in der Regel heller wird, und das Level der Scharfstellung und das Skalierungsverhältnis in der Standardeinstellung beibehalten möchten, können Sie die Konfiguration so festlegen: enhancement_config { sharpening_level: 0.5 auto_hdr_level: 1.0 upscale_ratio: 1 }
| Felder | |
|---|---|
sharpening_level |
Im Bereich [0,1]. Level der Scharfstellung, 0 bedeutet keine Scharfstellung, 1 bedeutet größtmögliche Scharfstellung. Der Standardwert ist 0.5. |
auto_hdr_level |
Im Bereich [0,1]. Auto-HDR-Level, 0 bedeutet, dass keine automatische HDR vorliegt, 1 steht für größtmögliche AutoHDR. Der Standardwert ist 0.5. |
upscale_ratio |
Im Bereich [1, 2]. Der Standardwert ist 1, d. h. es wird keine Hochskalierung verwendet. Wenn dieser Wert angegeben ist, entspricht die Ausgabehöhe und -breite der ursprünglichen Höhe und Breite multipliziert mit dem Skalierungsverhältnis. |
QualityScoreConfig
Konfiguration für den Qualitätsfaktor
| Felder | |
|---|---|
quality_model |
Geben Sie an, welches Modell verwendet werden soll. Der Standardwert ist ein leerer String und der ästhetische Wert wird zurückgegeben. Ein weiteres unterstütztes Qualitätsmodell ist "builtin/technical-score". Damit wird die technische Qualität des Bilds zurückgegeben. |
Typ
Enum für Typ der Qualitätsoptimierung.
| Enums | |
|---|---|
TYPE_UNSPECIFIED |
Ungültig Der Kunde muss einen Typ auswählen. |
COMPRESSION |
Reduzieren Sie die Größe der Bilddatei. Detaillierte Parameter sind in CompressionConfig angegeben. Wenn der Kunde CompressionConfig nicht angibt, verringert er damit die Größe der Bilddatei, ohne die Bildqualität zu beeinträchtigen. Wenn der Kunde CompressionConfig angibt, reduzieren wir die Dateigröße, während CompressionParams-target_quality beibehalten wird. |
ENHANCEMENT |
Rauschreduktion, Scharfstellen, HDR und Skalierung Detaillierte Parameter, die in EnhancementConfig angegeben werden. Wenn der Kunde EnhancementConfig nicht angibt, wird eine Bildoptimierung mit Standardwerten durchgeführt. Wenn upscale_ratio nicht angegeben ist, hat das Ausgabebild dieselbe Auflösung wie das Eingabebild. |
QUALITY_SCORE |
Qualitätsfaktor für ein Bild abfragen Detaillierte Parameter, die in QualityScoreConfig angegeben werden. Wenn der Kunde QualityScoreConfig nicht angibt, wird der ästhetische Qualitätsfaktor des Bildes zurückgegeben. |
QualityOptimizationResult
Speichert optimierte Image-Bytes.
| Felder | |
|---|---|
quality_optimization_type |
Erforderlicher Optimierungstyp. |
image |
Optimierte Image-Bytes. |
mime_type |
MIME-Typ des Ausgabebilds. |
ReferenceImage
Ein ReferenceImage stellt ein Produktbild und die zugehörigen Metadaten wie Begrenzungsrahmen dar.
| Felder | |
|---|---|
name |
Der Ressourcenname des Referenzbildes. Das Format ist:
Dieses Feld wird beim Erstellen eines Referenzbildes ignoriert. |
uri |
Der Google Cloud Storage-URI des Referenzbildes. Der URI muss mit Erforderlich. |
bounding_polys[] |
Begrenzt Polygone an den relevanten Bereichen im Referenzbild. Optional. Wenn dieses Feld leer ist, versucht das System, Regionen von Interesse zu erkennen. Es werden maximal zehn Begrenzungspolygone verwendet. Die bereitgestellte Form wird in ein nicht gedrehtes Rechteck konvertiert. Nach der Umwandlung muss der kleine Rand des Rechtecks größer oder gleich 300 Pixel sein. Das Seitenverhältnis muss 1:4 oder niedriger sein, z. B. 1:3 ist zulässig, 1:5 nicht. |
RemoveProductFromProductSetRequest
Anfragenachricht für die Methode RemoveProductFromProductSet.
| Felder | |
|---|---|
name |
Der Ressourcenname des zu ändernden ProductSets. Das Format ist: |
product |
Der Ressourcenname des Produkts, das aus diesem ProductSet entfernt werden soll. Das Format ist: |
SafeSearchAnnotation
Eine Reihe von Merkmalen des Bildes, die durch Methoden für Computer Vision in Bezug auf SafeSearch-Kategorien berechnet wurden (z. B. nicht jugendfreie Inhalte, Spoofing, Medizin, Gewalt).
| Felder | |
|---|---|
adult |
Stellt die Wahrscheinlichkeit dar, dass das Bild Inhalte nur für Erwachsene enthält. Inhalte nur für Erwachsene können Elemente wie Nacktheit, pornografische Bilder oder Cartoons oder sexuelle Aktivitäten enthalten. |
spoof |
Wahrscheinlichkeit für Spoofing. Die Wahrscheinlichkeit, dass eine Änderung an der kanonischen Version des Bildes vorgenommen wurde, um es lustig oder anstößig erscheinen zu lassen. |
medical |
Wahrscheinlichkeit, dass dies ein medizinisches Bild ist. |
violence |
Wahrscheinlichkeit, dass dieses Bild gewalttätige Inhalte enthält. |
racy |
Wahrscheinlichkeit, dass das Anfragebild nicht jugendfreie Inhalte enthält. Nicht jugendfreie Inhalte können unter anderem knappe oder durchsichtige Bekleidung, strategisch verhüllte Nacktheit, anzügliche oder provozierende Posen oder Nahaufnahmen sensibler Körperpartien umfassen. |
Symbol
Eine einzelne Symboldarstellung
| Felder | |
|---|---|
property |
Zusätzliche für das Symbol erkannte Informationen |
bounding_box |
Der Begrenzungsrahmen für das Symbol. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 | | 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 | | 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3). |
text |
Die tatsächliche UTF-8-Darstellung des Symbols |
confidence |
Die Konfidenz der OCR-Ergebnisse für das Symbol. Bereich [0, 1]. |
Tabelle
Eine Tabellendarstellung, die der HTML-Tabellenstruktur ähnelt.
| Felder | |
|---|---|
header_rows[] |
Überschriftszeilen der Tabelle |
body_rows[] |
Textzeilen der Tabelle |
TableCell
Eine Zellendarstellung innerhalb von Tabellen.
| Felder | |
|---|---|
row_span |
Die Anzahl von Zeilen, die diese Zelle umfasst. |
col_span |
Die Anzahl von Spalten, die diese Zelle umfasst. |
text_block |
Textblock für diese Zelle, der auch den normalisierten Begrenzungsrahmen für die Zelle und gegebenenfalls tiefere Strukturen innerhalb einer Zelle enthält. |
text |
Der zusammengeführte Textwert dieser Zelle, wobei umfassendere strukturelle Informationen im Gegensatz zu |
TableRow
Eine Zeile mit Tabellenzellen.
| Felder | |
|---|---|
cells[] |
Zellen, aus denen diese Zeile besteht. |
TableBoundHint
Ein Hinweis für einen Tabellenbegrenzungsrahmen auf der Seite für das Parsen der Tabelle.
| Felder | |
|---|---|
page_number |
Optionale Seitennummer für mehrseitige Eingaben, für die dieser Hinweis gilt. Wenn nicht angegeben, gilt dieser Hinweis standardmäßig für alle Seiten. Dieser Wert ist 1-indexiert. |
bounding_box |
Hinweis zu einem Begrenzungsrahmen für eine Tabelle auf dieser Seite. Die Koordinaten müssen auf [0,1] normalisiert sein und der Begrenzungsrahmen muss ein Rechteck sein, das an den Achsen ausgerichtet ist. |
TableDetectionOptions
Optionen für die Tabellenerkennung
| Felder | |
|---|---|
table_bound_hints[] |
Optionale Hinweise für Tabellenbegrenzungsrahmen, die für komplexe Fälle bereitgestellt werden können, in denen der Algorithmus die Tabelle(n) nicht findet. |
TextAnnotation
TextAnnotation enthält eine strukturierte Darstellung von mit OCR extrahiertem Text. Die Hierarchie einer mit OCR extrahierten Textstruktur sieht folgendermaßen aus: TextAnnotation -> Seite -> Block -> Absatz -> Wort -> Symbol. Jede Strukturkomponente ab Seite kann außerdem eigene Eigenschaften haben. Attribute beschreiben erkannte Sprachen, Unterbrechungen usw. Weitere Informationen finden Sie in der TextAnnotation.TextProperty-Nachrichtendefinition unten.
| Felder | |
|---|---|
pages[] |
Liste der durch OCR erkannten Seiten |
text |
Auf den Seiten erkannter UTF-8-Text |
DetectedBreak
Erkannter Anfang oder erkanntes Ende einer Strukturkomponente
| Felder | |
|---|---|
type |
Erkannte Art der Unterbrechung |
is_prefix |
Wahr, wenn die Unterbrechung vor dem Element steht |
BreakType
Aufzählung zur Angabe der Art der erkannten Unterbrechung. Neue Zeile, Leerzeichen usw.
| Enums | |
|---|---|
UNKNOWN |
Unbekannte Art von Unterbrechungslabel |
SPACE |
Normales Leerzeichen |
SURE_SPACE |
Sichere Lücke (sehr breit) |
EOL_SURE_SPACE |
Zeilenumbruch |
HYPHEN |
Bindestrich am Ende der Zeile, der im Text nicht vorhanden ist; tritt nicht gleichzeitig mit SPACE, LEADER_SPACE oder LINE_BREAK auf. |
LINE_BREAK |
Zeilenumbruch, der einen Absatz beendet |
DetectedLanguage
Erkannte Sprache für eine Strukturkomponente
| Felder | |
|---|---|
language_code |
Der BCP-47-Sprachcode, z. B. „en-US“ oder „sr-Latn“ Weitere Informationen finden Sie unter http://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Die Konfidenz der erkannten Sprache. Bereich [0, 1]. |
TextProperty
Zusätzliche Informationen, die bei der Strukturkomponente erkannt wurden
| Felder | |
|---|---|
detected_languages[] |
Eine Liste der erkannten Sprachen zusammen mit der Konfidenz |
detected_break |
Erkannter Anfang oder erkanntes Ende eines Textsegments |
TextDetectionParams
Parameter für Texterkennungen. Wird verwendet, um die Funktionen TEXT_DETECTION und DOCUMENT_TEXT_DETECTION zu steuern.
| Felder | |
|---|---|
disable_orientation_detection |
Deaktiviert die Ausrichtungserkennung, sodass gedrehter Text nicht erkannt wird. Dies wird nur für DOCUMENT_TEXT_DETECTION unterstützt. |
disable_text_annotations |
Deaktiviert das alte Feld „text_annotations“. Es werden nur full_text_annotations zurückgegeben. |
page_filter |
Steuert, welche Daten auf Seitenebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder sind enthalten. |
block_filter |
Steuert, welche Daten auf Blockebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer |
paragraph_filter |
Steuert, welche Daten auf Absatzebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer |
word_filter |
Steuert, welche Daten auf Wortebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer |
symbol_filter |
Steuert, welche Daten auf Symbolebene in full_text_annotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer |
UpdateProductRequest
Anfragenachricht für die Methode UpdateProduct.
| Felder | |
|---|---|
product |
Die Produktressource, die die Ressource auf dem Server ersetzt. product.name ist unveränderlich. |
update_mask |
Der Wert |
UpdateProductSetRequest
Anfragenachricht für die Methode UpdateProductSet.
| Felder | |
|---|---|
product_set |
Die ProductSet-Ressource, die die Ressource auf dem Server ersetzt. |
update_mask |
Der Wert |
Vertex
Ein Scheitelpunkt repräsentiert einen 2D-Punkt im Bild. HINWEIS: Die Scheitelpunktkoordinaten haben den gleichen Maßstab wie das Originalbild.
| Felder | |
|---|---|
x |
X-Koordinate |
y |
Y-Koordinate |
WebDetection
Relevante Informationen für das Bild aus dem Internet
| Felder | |
|---|---|
web_entities[] |
Abgeleitete Entitäten aus ähnlichen Bildern im Internet |
full_matching_images[] |
Komplett übereinstimmende Bilder aus dem Internet. Können skalierte Kopien des Abfragebildes beinhalten. |
partial_matching_images[] |
Teilweise übereinstimmende Bilder aus dem Internet. Die Bilder sind so ähnlich, dass sie einige Hauptmerkmale teilen. Zum Beispiel wird ein Originalbild wahrscheinlich eine partielle Übereinstimmung mit seinen Zuschnitten haben. |
pages_with_matching_images[] |
Webseiten, die die den übereinstimmenden Bilder aus dem Internet enthalten |
visually_similar_images[] |
Die visuell ähnlichen Bildergebnisse |
best_guess_labels[] |
Die Vermutung des Dienstes zum Thema des Anfragebilds. Abgeleitet aus ähnlichen Bildern im öffentlichen Web |
WebEntity
Aus ähnlichen Bildern im Internet abgeleitete Entität
| Felder | |
|---|---|
entity_id |
Intransparente Entitäts-ID |
score |
Gesamtrelevanzbewertung für die Entität. Nicht normalisiert und nicht für verschiedene Bildabfragen vergleichbar. |
description |
Kanonische Beschreibung der Entität auf Englisch |
WebImage
Metadaten für Onlinebilder
| Felder | |
|---|---|
url |
Die Ergebnisbild-URL |
score |
(Verworfen) Gesamtrelevanzbewertung für das Bild |
WebLabel
Label, um zusätzliche Metadaten für die Weberkennung bereitzustellen
| Felder | |
|---|---|
label |
Label für zusätzliche Metadaten |
language_code |
Der BCP-47-Sprachcode für |
WebPage
Metadaten für Webseiten
| Felder | |
|---|---|
url |
Die URL der Ergebniswebseite |
score |
(Verworfen) Gesamtrelevanzbewertung für die Webseite |
page_title |
Titel der Webseite, kann HTML-Markups enthalten |
full_matching_images[] |
Komplett übereinstimmende Bilder auf der Seite. Können skalierte Kopien des Abfragebildes beinhalten. |
partial_matching_images[] |
Teilweise übereinstimmende Bilder auf der Seite. Die Bilder sind so ähnlich, dass sie einige Hauptmerkmale teilen. Zum Beispiel wird ein Originalbild wahrscheinlich eine partielle Übereinstimmung mit seinen Zuschnitten haben. |
WebDetectionParams
Parameter für die Weberkennungsanfrage
| Felder | |
|---|---|
include_geo_results |
Gibt an, ob Ergebnisse enthalten sein sollen, die aus den Geoinformationen im Bild abgeleitet wurden |
Wort
Darstellung eines Worts
| Felder | |
|---|---|
property |
Zusätzliche für das Wort erkannte Informationen |
bounding_box |
Der Begrenzungsrahmen für das Wort. Die Eckpunkte werden in der Reihenfolge von oben links, oben rechts, unten rechts und unten links angeordnet. Wenn eine Drehung des Begrenzungsrahmens erkannt wird, wird die Drehung als „um die obere linke Ecke“ dargestellt, gemäß der Definition, nach der der Text in „natürlicher“ Ausrichtung gelesen wird. Beispiel: * Wenn der Text horizontal ist, kann dies so aussehen: 0----1 | | 3----2 * Wenn er um 180 Grad um die obere linke Ecke gedreht wird, wird daraus 2----3 | | 1----0 und die Eckpunktreihenfolge ist weiterhin (0, 1, 2, 3). |
symbols[] |
Liste der Symbole im Wort. Die Reihenfolge der Symbole folgt der natürlichen Lesereihenfolge. |
confidence |
Die Konfidenz der OCR-Ergebnisse für das Wort. Bereich [0, 1]. |
merged_text |
Der gesamte in diesem Wort erkannte UTF-8-Text. Dieses Feld wird standardmäßig nur zurückgegeben, wenn es in TextDetectionParams.word_filter angegeben ist. |