ImageContext

Bildkontext- bzw. funktionsspezifische Parameter

JSON-Darstellung
{
  "latLongRect": {
    object(LatLongRect)
  },
  "languageHints": [
    string
  ],
  "cropHintsParams": {
    object(CropHintsParams)
  },
  "productSearchParams": {
    object(ProductSearchParams)
  },
  "webDetectionParams": {
    object(WebDetectionParams)
  },
  "textDetectionParams": {
    object(TextDetectionParams)
  },
  "qualityOptimizationParams": {
    object(QualityOptimizationParams)
  },
  "documentParsingParams": {
    object(DocumentParsingParams)
  }
}
Felder
latLongRect

object(LatLongRect)

Nicht verwendet.

languageHints[]

string

Liste der Sprachen, die für TEXT_DETECTION verwendet werden sollen. Ein leerer Wert liefert in den meisten Fällen jedoch die besten Ergebnisse, weil dadurch die automatische Spracherkennung aktiviert wird. Bei Sprachen, die auf dem lateinischen Alphabet basieren, ist die Einstellung languageHints nicht erforderlich. In seltenen Fällen werden durch das Festlegen eines Hinweises verbesserte Ergebnisse erzielt, wenn die Sprache des Bildtextes bekannt ist. Falls der Hinweis jedoch falsch ist, behindert er die Texterkennung erheblich. Wenn eine oder mehrere der angegebenen Sprachen nicht zu den unterstützten Sprachen zählen, gibt die Texterkennung einen Fehler zurück.

cropHintsParams

object(CropHintsParams)

Parameter für Annotationsanfragen zu Zuschneidehinweisen

productSearchParams

object(ProductSearchParams)

Parameter für die Produktsuche

webDetectionParams

object(WebDetectionParams)

Parameter für Weberkennung

textDetectionParams

object(TextDetectionParams)

Parameter für die Texterkennung in Dokumenten

qualityOptimizationParams

object(QualityOptimizationParams)

Parameter für die Optimierung der Bildqualität

documentParsingParams

object(DocumentParsingParams)

Parameter für das Parsen von Dokumenten

LatLongRect

Durch LatLng-Paare (Min. und Max.) festgelegtes Rechteck

JSON-Darstellung
{
  "minLatLng": {
    object(LatLng)
  },
  "maxLatLng": {
    object(LatLng)
  }
}
Felder
minLatLng

object(LatLng)

Breiten-/Längengradpaar (Min.)

maxLatLng

object(LatLng)

Breiten-/Längengradpaar (Max.)

CropHintsParams

Parameter für Annotationsanfragen zu Zuschneidehinweisen

JSON-Darstellung
{
  "aspectRatios": [
    number
  ]
}
Felder
aspectRatios[]

number

Seitenverhältnisse in Gleitkommazahlen, die das Verhältnis von Breite zu Höhe des Bildes darstellen. Wenn das gewünschte Seitenverhältnis beispielsweise 4:3 ist, sollte der entsprechende Gleitkommawert 1,33333 betragen. Wenn nichts angegeben ist, wird der bestmögliche Zuschnitt geliefert. Die Anzahl der bereitgestellten Seitenverhältnisse ist auf maximal 16 begrenzt. Alle nach dem 16. Seitenverhältnis angegebenen Seitenverhältnisse werden ignoriert.

ProductSearchParams

Parameter für eine Anfrage für die Produktsuche.

JSON-Darstellung
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "productSet": string,
  "productCategories": [
    string
  ],
  "filter": string
}
Felder
boundingPoly

object(BoundingPoly)

Das Begrenzungspolygon um den gewünschten Bereich im Bild. Optional. Ist er nicht angegeben, entscheidet das System.

productSet

string

Der Ressourcenname eines ProductSet, in dem nach ähnlichen Bildern gesucht werden soll.

Das Format ist: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID.

productCategories[]

string

Die Liste der Produktkategorien, in denen gesucht werden soll. Momentan berücksichtigen wir nur die erste Kategorie. Wir müssen entweder „homegoods“, „apparel“ oder „toys“ angeben.

filter

string

Der Filterausdruck. Damit können Suchergebnisse basierend auf Produktlabels beschränkt werden. Derzeit wird AND von OR von Schlüssel/Wert-Paar-Ausdrücken unterstützt, in denen jeder Ausdruck in einem OR denselben Schlüssel haben muss.

Zum Beispiel ist „(color = red ODER color = blue) UND Marke = Google“ akzeptabel, aber „(color = red ODER Marke = Google)“ oder „color: red“ ist nicht zulässig.

WebDetectionParams

Parameter für die Weberkennungsanfrage

JSON-Darstellung
{
  "includeGeoResults": boolean
}
Felder
includeGeoResults

boolean

Gibt an, ob Ergebnisse enthalten sein sollen, die aus den Geoinformationen im Bild abgeleitet wurden

TextDetectionParams

Parameter für Texterkennungen. Wird verwendet, um die Funktionen TEXT_DETECTION und DOCUMENT_TEXT_DETECTION zu steuern.

JSON-Darstellung
{
  "disableOrientationDetection": boolean,
  "disableTextAnnotations": boolean,
  "pageFilter": string,
  "blockFilter": string,
  "paragraphFilter": string,
  "wordFilter": string,
  "symbolFilter": string
}
Felder
disableOrientationDetection

boolean

Deaktiviert die Ausrichtungserkennung, sodass gedrehter Text nicht erkannt wird. Dies wird nur für DOCUMENT_TEXT_DETECTION unterstützt.

disableTextAnnotations

boolean

Deaktiviert das alte Feld „textAnnotations“. Es werden nur full_text_annotations zurückgegeben.

pageFilter

string (FieldMask format)

Steuert, welche Daten auf Seitenebene in fullTextAnnotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder sind enthalten.

Eine kommagetrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

blockFilter

string (FieldMask format)

Steuert, welche Daten auf Blockebene in fullTextAnnotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer mergedText sind enthalten.

Eine kommagetrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

paragraphFilter

string (FieldMask format)

Steuert, welche Daten auf Absatzebene in fullTextAnnotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer mergedText sind enthalten.

Eine kommagetrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

wordFilter

string (FieldMask format)

Steuert, welche Daten auf Wortebene in fullTextAnnotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer mergedText sind enthalten.

Eine kommagetrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

symbolFilter

string (FieldMask format)

Steuert, welche Daten auf Symbolebene in fullTextAnnotation zurückgegeben werden. Standardeinstellung, wenn nicht festgelegt: Alle Felder außer boundingBox sind enthalten.

Eine kommagetrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

QualityOptimizationParams

Parameter für die Optimierung der Bildqualität

JSON-Darstellung
{
  "type": enum(Type),
  "compressionConfig": {
    object(CompressionConfig)
  },
  "enhancementConfig": {
    object(EnhancementConfig)
  },
  "qualityScoreConfig": {
    object(QualityScoreConfig)
  }
}
Felder
type

enum(Type)

Wählen Sie einen Optimierungstyp aus.

compressionConfig

object(CompressionConfig)

Geben Sie die Komprimierungskonfiguration an.

enhancementConfig

object(EnhancementConfig)

Geben Sie die Konfiguration für die automatische Optimierung an.

qualityScoreConfig

object(QualityScoreConfig)

Legen Sie die Konfiguration für den Qualitätsfaktor fest.

CompressionConfig

Konfiguration zur Komprimierung

JSON-Darstellung
{
  "targetQuality": number
}
Felder
targetQuality

number

Im Bereich [0, 1]. Zielqualität nach Komprimierung. 1 bedeutet verlustfrei im Vergleich zum Eingabebild, 0 bedeutet, dass keine Mindestqualität erforderlich ist.

EnhancementConfig

Konfiguration zur Verbesserung Wenn Sie "enhancementConfig" nicht angeben, werden die Standardwerte "sharpeningLevel" gleich 0,5, "autoHdrLevel" gleich 0,5 und "upscaleRatio" gleich 1 verwendet. Wenn Sie einen der drei Parameter anpassen möchten, müssen Sie die gesamte EnhancementConfig angeben. Wenn Sie beispielsweise ein höheres autoHdrLevel verwenden möchten, wodurch das Bild in der Regel heller wird, und das Level der Scharfstellung und das Skalierungsverhältnis in der Standardeinstellung beibehalten möchten, können Sie die Konfiguration so festlegen: enhancementConfig { sharpeningLevel: 0.5 autoHdrLevel: 1.0 upscaleRatio: 1 }

JSON-Darstellung
{
  "sharpeningLevel": number,
  "autoHdrLevel": number,
  "upscaleRatio": number
}
Felder
sharpeningLevel

number

Im Bereich [0,1]. Level der Scharfstellung, 0 bedeutet keine Scharfstellung, 1 bedeutet größtmögliche Scharfstellung. Der Standardwert ist 0.5.

autoHdrLevel

number

Im Bereich [0,1]. Auto-HDR-Level, 0 bedeutet, dass keine automatische HDR vorliegt, 1 steht für größtmögliche AutoHDR. Der Standardwert ist 0.5.

upscaleRatio

number

Im Bereich [1, 2]. Der Standardwert ist 1, d. h. es wird keine Hochskalierung verwendet. Wenn dieser Wert angegeben ist, entspricht die Ausgabehöhe und -breite der ursprünglichen Höhe und der Breite mal dem Skalierungsverhältnis.

QualityScoreConfig

Konfiguration für den Qualitätsfaktor

JSON-Darstellung
{
  "qualityModel": string
}
Felder
qualityModel

string

Geben Sie an, welches Modell verwendet werden soll. Der Standardwert ist ein leerer String und der ästhetische Wert wird zurückgegeben. Ein weiteres unterstütztes Qualitätsmodell ist "builtin/technical-score". Damit wird die technische Qualität des Bilds zurückgegeben.

DocumentParsingParams

Parameter für die Funktion DOCUMENT_PARSING

JSON-Darstellung
{
  "disableOrientationDetection": boolean,
  "tableDetectionOptions": {
    object(TableDetectionOptions)
  },
  "documentType": string
}
Felder
disableOrientationDetection

boolean

Deaktiviert die Ausrichtungserkennung, sodass gedrehter Text nicht erkannt wird.

tableDetectionOptions

object(TableDetectionOptions)

Steuert das Verhalten der Tabellenerkennung. Die Tabellenerkennung ist deaktiviert, wenn dieses Feld nicht festgelegt ist.

documentType

string

Geben Sie einen bekannten Dokumenttyp für eine tiefere Strukturerkennung an. Gültige Werte sind derzeit "invoice" oder "general".

TableDetectionOptions

Optionen für die Tabellenerkennung

JSON-Darstellung
{
  "tableBoundHints": [
    {
      object(TableBoundHint)
    }
  ]
}
Felder
tableBoundHints[]

object(TableBoundHint)

Optionale Hinweise für Tabellenbegrenzungsrahmen, die für komplexe Fälle bereitgestellt werden können, in denen der Algorithmus die Tabelle(n) nicht findet.

TableBoundHint

Ein Hinweis für einen Tabellenbegrenzungsrahmen auf der Seite für das Parsen der Tabelle.

JSON-Darstellung
{
  "pageNumber": number,
  "boundingBox": {
    object(BoundingPoly)
  }
}
Felder
pageNumber

number

Optionale Seitennummer für mehrseitige Eingaben, für die dieser Hinweis gilt. Wenn nicht angegeben, gilt dieser Hinweis standardmäßig für alle Seiten. Dieser Wert ist 1-indexiert.

boundingBox

object(BoundingPoly)

Hinweis zu einem Begrenzungsrahmen für eine Tabelle auf dieser Seite. Die Koordinaten müssen auf [0,1] normalisiert sein und der Begrenzungsrahmen muss ein Rechteck sein, das an den Achsen ausgerichtet ist.