GcsSource

輸入內容的 Cloud Storage 位置。

JSON 表示法
{
  "inputUris": [
    string
  ],
  "dataSchema": string
}
欄位
inputUris[]

string

這是必要旗標,輸入檔案的 Cloud Storage URI。每個 URI 的長度上限為 2000 個半形字元。URI 可以比對完整物件路徑 (例如 gs://bucket/directory/object.json),也可以比對符合一或多個檔案的模式,例如 gs://bucket/directory/*.json

每項要求最多可包含 100 個檔案 (如果 dataSchemacontent,則為 10 萬個檔案)。每個檔案的大小上限為 2 GB (如果 dataSchemacontent,則為 100 MB)。

dataSchema

string

從來源剖析資料時所用的結構定義。

支援的文件匯入值:

  • document (預設):每行一個 JSON Document。每份文件都必須有有效的 Document.id
  • content:非結構化資料 (例如 PDF、HTML)。inputUris 比對到的每個檔案都會成為文件,ID 則設為 SHA256(URI) 的前 128 位元,並編碼為十六進位字串。
  • custom:每列一個自訂資料 JSON,格式任意,但須符合資料存放區的定義 Schema。這項功能僅適用於「一般資料儲存庫」類別。
  • csv:包含標頭的 CSV 檔案,標頭符合資料存放區的定義 Schema。標題後的每個項目都會匯入為文件。這項功能僅適用於「一般」資料儲存庫類別。

使用者事件匯入作業支援的值:

  • user_event (預設):每行一個 JSON UserEvent