GcsSource

Percorso di Cloud Storage per i contenuti di input.

Rappresentazione JSON
{
  "inputUris": [
    string
  ],
  "dataSchema": string
}
Campi
inputUris[]

string

Obbligatorio. URI Cloud Storage dei file di input. Ogni URI può contenere fino a 2000 caratteri. Gli URI possono corrispondere al percorso completo dell'oggetto (ad esempio, gs://bucket/directory/object.json) o a un pattern che corrisponde a uno o più file, ad esempio gs://bucket/directory/*.json.

Una richiesta può contenere al massimo 100 file (o 100.000 file se dataSchema è content). Ogni file può avere dimensioni fino a 2 GB (o 100 MB se dataSchema è content).

dataSchema

string

Lo schema da utilizzare durante l'analisi dei dati dall'origine.

Valori supportati per le importazioni di documenti:

  • document (valore predefinito): un Document JSON per riga. Ogni documento deve avere un Document.id valido.
  • content: dati non strutturati (ad es. PDF, HTML). Ogni file corrispondente a inputUris diventa un documento, con l'ID impostato sui primi 128 bit di SHA256(URI) codificati come stringa esadecimale.
  • custom: un JSON di dati personalizzati per riga in formato arbitrario conforme al Schema definito del datastore. Può essere utilizzato solo dal verticale del datastore GENERIC.
  • csv: un file CSV con intestazione conforme al Schema definito del datastore. Ogni voce dopo l'intestazione viene importata come documento. Può essere utilizzato solo dal verticale del datastore GENERIC.

Valori supportati per le importazioni di eventi utente:

  • user_event (valore predefinito): un UserEvent JSON per riga.