GcsSource

입력 콘텐츠의 Cloud Storage 위치입니다.

JSON 표현
{
  "inputUris": [
    string
  ],
  "dataSchema": string
}
필드
inputUris[]

string

필수 항목입니다. 입력 파일을 가리키는 Cloud Storage URI입니다. 각 URI는 최대 2,000자(영문 기준)일 수 있습니다. URI는 전체 객체 경로(예: gs://bucket/directory/object.json) 또는 하나 이상의 파일을 일치시키는 패턴(예: gs://bucket/directory/*.json)과 일치할 수 있습니다.

요청은 최대 100개의 파일을 포함할 수 있습니다 (dataSchemacontent인 경우 100,000개). 각 파일의 최대 크기는 2GB입니다 (dataSchemacontent인 경우 100MB).

dataSchema

string

소스에서 데이터를 파싱할 때 사용할 스키마입니다.

문서 가져오기에 지원되는 값:

  • document (기본값): 줄당 하나의 JSON Document입니다. 각 문서에는 유효한 Document.id가 있어야 합니다.
  • content: 구조화되지 않은 데이터 (예: PDF, HTML) inputUris와 일치하는 각 파일은 문서가 되며, ID는 16진수 문자열로 인코딩된 SHA256(URI)의 처음 128비트로 설정됩니다.
  • custom: 데이터 스토어의 정의된 Schema을 준수하는 임의 형식의 행당 맞춤 데이터 JSON 하나입니다. 일반 데이터 스토어 업종에서만 사용할 수 있습니다.
  • csv: 데이터 저장소의 정의된 Schema을 준수하는 헤더가 있는 CSV 파일입니다. 헤더 뒤의 각 항목은 문서로 가져옵니다. 일반 데이터 스토어 업종에서만 사용할 수 있습니다.

사용자 이벤트 가져오기에 지원되는 값:

  • user_event (기본값): 줄당 하나의 JSON UserEvent입니다.