ImageContext

이미지 컨텍스트 또는 기능별 파라미터입니다.

JSON 표현
{
  "latLongRect": {
    object(LatLongRect)
  },
  "languageHints": [
    string
  ],
  "cropHintsParams": {
    object(CropHintsParams)
  },
  "productSearchParams": {
    object(ProductSearchParams)
  },
  "webDetectionParams": {
    object(WebDetectionParams)
  },
  "textDetectionParams": {
    object(TextDetectionParams)
  },
  "qualityOptimizationParams": {
    object(QualityOptimizationParams)
  },
  "documentParsingParams": {
    object(DocumentParsingParams)
  }
}
필드
latLongRect

object(LatLongRect)

사용되지 않음.

languageHints[]

string

TEXT_DETECTION에 사용할 언어 목록입니다. 대부분의 경우에는 빈 값으로 두면 자동 언어 감지가 사용되어 최상의 결과를 얻을 수 있습니다. 라틴 알파벳을 사용하는 언어라면 languageHints를 설정할 필요가 없습니다. 드문 경우지만, 이미지에 포함된 텍스트의 언어를 알고 있는 경우 힌트를 설정하면 결과가 나아지기도 합니다. 단, 힌트가 잘못되었다면 심각한 지장이 발생합니다. 지정한 언어 중 지원되는 언어가 아닌 언어가 하나라도 있으면 텍스트 감지 시 오류가 반환됩니다.

cropHintsParams

object(CropHintsParams)

자르기 힌트 주석 요청의 파라미터입니다.

productSearchParams

object(ProductSearchParams)

제품 검색을 위한 파라미터입니다.

webDetectionParams

object(WebDetectionParams)

웹 감지를 위한 매개변수입니다.

textDetectionParams

object(TextDetectionParams)

문서 텍스트 인식을 위한 매개변수입니다.

qualityOptimizationParams

object(QualityOptimizationParams)

이미지 품질 최적화를 위한 매개변수입니다.

documentParsingParams

object(DocumentParsingParams)

문서 파싱을 위한 매개변수입니다.

LatLongRect

최소 및 최대 LatLng 쌍으로 결정되는 직사각형입니다.

JSON 표현
{
  "minLatLng": {
    object(LatLng)
  },
  "maxLatLng": {
    object(LatLng)
  }
}
필드
minLatLng

object(LatLng)

최소 위도/경도 쌍입니다.

maxLatLng

object(LatLng)

최대 위도/경도 쌍입니다.

CropHintsParams

자르기 힌트 주석 요청의 파라미터입니다.

JSON 표현
{
  "aspectRatios": [
    number
  ]
}
필드
aspectRatios[]

number

부동 소수점 수 단위의 가로세로 비율로서 이미지 높이에 대한 너비의 비율을 나타냅니다. 예를 들어 원하는 가로세로 비율이 4/3인 경우 해당하는 부동 소수점 수 값은 1.33333이어야 합니다. 지정하지 않으면 가능한 최상의 자르기가 반환됩니다. 가로세로 비율 수는 최대 16개로 제한됩니다. 16개 이후에 제공되는 모든 가로세로 비율은 무시됩니다.

ProductSearchParams

제품 검색 요청의 파라미터입니다.

JSON 표현
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "productSet": string,
  "productCategories": [
    string
  ],
  "filter": string
}
필드
boundingPoly

object(BoundingPoly)

이미지의 관심 영역을 감싸는 경계 다각형입니다. (선택사항) 지정하지 않으면 시스템 재량에 따라 적용됩니다.

productSet

string

비슷한 이미지 검색에 사용할 ProductSet의 리소스 이름입니다.

형식: projects/PROJECT_ID/locations/LOC_ID/productSets/PRODUCT_SET_ID

productCategories[]

string

검색할 제품 카테고리의 목록입니다. 현재 첫 번째 카테고리만 고려되고, 'homegoods', 'apparel', 'toys'를 지정해야 합니다.

filter

string

필터링 표현식입니다. 제품 라벨을 기준으로 검색 결과를 제한하는 데 사용될 수 있습니다. 현재까지 키-값 표현식의 AND 또는 OR이 지원됩니다. OR 내의 각 표현식은 키가 동일해야 합니다.

예를 들어 '(color = red OR color = blue) AND brand = Google'은 허용되지만 '(color = red OR brand = Google)' 또는 'color: red'는 허용되지 않습니다.

WebDetectionParams

웹 감지 요청의 파라미터입니다.

JSON 표현
{
  "includeGeoResults": boolean
}
필드
includeGeoResults

boolean

이미지에 지리 정보에서 파생된 결과를 포함할지 여부입니다.

TextDetectionParams

텍스트 감지를 위한 매개변수입니다. TEXT_DETECTION 및 DOCUMENT_TEXT_DETECTION 기능을 제어하기 위해 사용됩니다.

JSON 표현
{
  "disableOrientationDetection": boolean,
  "disableTextAnnotations": boolean,
  "pageFilter": string,
  "blockFilter": string,
  "paragraphFilter": string,
  "wordFilter": string,
  "symbolFilter": string
}
필드
disableOrientationDetection

boolean

회전된 텍스트가 감지되지 않도록 방향 인식을 사용 중지합니다. DOCUMENT_TEXT_DETECTION에만 지원됩니다.

disableTextAnnotations

boolean

이전 textAnnotations 필드를 사용 중지합니다. full_text_annotations만 반환됩니다.

pageFilter

string (FieldMask format)

fullTextAnnotation의 페이지 수준에서 반환되는 데이터를 제어합니다. 설정되지 않은 경우 기본값: 모든 필드 포함

정규화된 필드 이름을 쉼표로 구분한 목록입니다. 예: "user.displayName,photo"

blockFilter

string (FieldMask format)

fullTextAnnotation의 블록 수준에서 반환되는 데이터를 제어합니다. 설정되지 않은 경우 기본값: mergedText를 제외한 모든 필드 포함

정규화된 필드 이름을 쉼표로 구분한 목록입니다. 예: "user.displayName,photo"

paragraphFilter

string (FieldMask format)

fullTextAnnotation의 단락 수준에서 반환되는 데이터를 제어합니다. 설정되지 않은 경우 기본값: mergedText를 제외한 모든 필드 포함

정규화된 필드 이름을 쉼표로 구분한 목록입니다. 예: "user.displayName,photo"

wordFilter

string (FieldMask format)

fullTextAnnotation의 단어 수준에서 반환되는 데이터를 제어합니다. 설정되지 않은 경우 기본값: mergedText를 제외한 모든 필드 포함

정규화된 필드 이름을 쉼표로 구분한 목록입니다. 예: "user.displayName,photo"

symbolFilter

string (FieldMask format)

fullTextAnnotation의 기호 수준에서 반환되는 데이터를 제어합니다. 설정되지 않은 경우 기본값: boundingBox를 제외한 모든 필드 포함

정규화된 필드 이름을 쉼표로 구분한 목록입니다. 예: "user.displayName,photo"

QualityOptimizationParams

이미지 품질 최적화를 위한 매개변수입니다.

JSON 표현
{
  "type": enum(Type),
  "compressionConfig": {
    object(CompressionConfig)
  },
  "enhancementConfig": {
    object(EnhancementConfig)
  },
  "qualityScoreConfig": {
    object(QualityScoreConfig)
  }
}
필드
type

enum(Type)

최적화 유형 하나를 선택합니다.

compressionConfig

object(CompressionConfig)

압축 구성을 지정합니다.

enhancementConfig

object(EnhancementConfig)

자동 보정 구성을 지정합니다.

qualityScoreConfig

object(QualityScoreConfig)

품질평가점수 구성을 지정합니다.

CompressionConfig

COMPRESSION 구성입니다.

JSON 표현
{
  "targetQuality": number
}
필드
targetQuality

number

범위 내[0~1]. 압축 후 대상 품질입니다. 1은 입력 이미지 대비 무손실을 의미하고 0은 최소 품질 요구사항 없음을 의미합니다.

EnhancementConfig

ENHANCMENT 구성입니다. enhancementConfig를 지정하지 않은 경우에는 sharpeningLevel이 0.5이고, autoHdrLevel이 0.5이고, upscaleRatio가 1에 해당하는 기본값이 사용됩니다. 3개 매개변수 중 하나라도 맞춤설정하려면 전체 EnhancementConfig를 지정해야 합니다. 예를 들어 일반적으로 이미지가 더 밝게 표시되는 더 높은 autoHdrLevel을 사용하고 sharpnening 레벨 및 upscale 비율을 기본값 그대로 유지하려면 enhancementConfig { sharpeningLevel: 0.5 autoHdrLevel: 1.0 upscaleRatio: 1 } 구성을 설정할 수 있습니다.

JSON 표현
{
  "sharpeningLevel": number,
  "autoHdrLevel": number,
  "upscaleRatio": number
}
필드
sharpeningLevel

number

범위 내[0~1]. 선명도 수준입니다. 0은 선명도가 없음을, 1은 가장 선명하게 함을 의미합니다. 기본값은 0.5입니다.

autoHdrLevel

number

범위 내[0~1]. Auto HDR의 수준으로 0은 자동 DLP 없음을, 1은 가장 큰 AutoHDR을 의미합니다. 기본값은 0.5입니다.

upscaleRatio

number

범위 내[1~2]. 수평 확장 여부와 관계없이 기본값은 1이며, 이는 수평 확장이 없음을 의미합니다. 지정된 경우 출력 높이와 너비는 원래 높이와 너비에 upscaleRatio를 곱한 값과 같습니다.

QualityScoreConfig

QUALITY_SCORE 구성입니다.

JSON 표현
{
  "qualityModel": string
}
필드
qualityModel

string

사용할 모델을 지정합니다. 기본값은 빈 문자열이고, 미적 점수가 반환됩니다. 지원되는 다른 품질 모델은 'builtin/technical-score'이며, 이미지 기술 품질을 반환합니다.

DocumentParsingParams

DOCUMENT_PARSING 기능의 매개변수입니다.

JSON 표현
{
  "disableOrientationDetection": boolean,
  "tableDetectionOptions": {
    object(TableDetectionOptions)
  },
  "documentType": string
}
필드
disableOrientationDetection

boolean

회전된 텍스트가 감지되지 않도록 방향 인식을 사용 중지합니다.

tableDetectionOptions

object(TableDetectionOptions)

테이블 감지 동작을 제어합니다. 이 필드가 설정되지 않은 경우 테이블 감지가 사용 중지됩니다.

documentType

string

더 깊은 구조 감지를 위해 알려진 문서 유형을 지정합니다. 유효한 값은 현재 'invoice' 또는 'general'입니다.

TableDetectionOptions

테이블 감지를 위한 옵션입니다.

JSON 표현
{
  "tableBoundHints": [
    {
      object(TableBoundHint)
    }
  ]
}
필드
tableBoundHints[]

object(TableBoundHint)

알고리즘이 테이블을 찾을 수 없는 복잡한 경우에 제공할 수 있는 선택적 테이블 경계 상자 힌트입니다.

TableBoundHint

테이블 파싱을 위한 페이지의 테이블 경계 상자에 대한 힌트입니다.

JSON 표현
{
  "pageNumber": number,
  "boundingBox": {
    object(BoundingPoly)
  }
}
필드
pageNumber

number

이 힌트가 적용되는 다중 페이지 입력에 대한 선택적인 페이지 번호입니다. 제공하지 않으면 이 힌트가 기본적으로 모든 페이지에 적용됩니다. 이 값은 1부터 색인이 생성됩니다.

boundingBox

object(BoundingPoly)

이 페이지의 테이블에 대한 경계 상자 힌트입니다. 좌표가 [0,1]로 정규화되어야 하고, 경계 상자는 축 정렬 직사각형이어야 합니다.