GcsSource

Percorso di Cloud Storage per i contenuti di input.

Rappresentazione JSON
{
  "inputUris": [
    string
  ],
  "dataSchema": string
}
Campi
inputUris[]

string

Obbligatorio. URI Cloud Storage dei file di input. Ogni URI può contenere fino a 2000 caratteri. Gli URI possono corrispondere al percorso completo dell'oggetto (ad esempio, gs://bucket/directory/object.json) o a un pattern che corrisponde a uno o più file, ad esempio gs://bucket/directory/*.json.

Una richiesta può contenere al massimo 100 file (o 100.000 file se dataSchema è content). Ogni file può avere dimensioni fino a 2 GB (o 100 MB se dataSchema è content).

dataSchema

string

Lo schema da utilizzare durante l'analisi dei dati dell'origine.

Valori supportati per le importazioni di documenti:

  • document (impostazione predefinita): un Document JSON per riga. Ogni documento deve avere un Document.id valido.
  • content: dati non strutturati (ad es. PDF, HTML). Ogni file corrispondente a inputUris diventa un documento, con l'ID impostato sui primi 128 bit di SHA256(URI) codificati come stringa esadecimale.
  • custom: un JSON di dati personalizzati per riga in formato arbitrario conforme al Schema definito dell'datastore. Può essere utilizzato solo dal verticale GENERIC Data Store.
  • csv: un file CSV con intestazione conforme al Schema del datastore. Ogni voce dopo l'intestazione viene importata come documento. Questo può essere utilizzato solo dalla verticale del datastore GENERIC.

Valori supportati per le importazioni di eventi utente:

  • user_event (impostazione predefinita): un UserEvent JSON per riga.