Pipeline Process-with-Document-AI

La pipeline Process-with-Document AI consente agli utenti di elaborare i documenti esistenti con un processore Document AI e di aggiornare le proprietà dei documenti con le entità appena estratte.

Prerequisiti

Prima di iniziare, devi disporre di:

  1. Un processore Document AI pronto nello stesso Google Cloud progetto.

    • Se non hai un processore, segui i passaggi per crearne uno. Puoi scegliere di creare qualsiasi tipo, purché il tipo di processore corrisponda al tipo di documento.
  2. Cartelle Cloud Storage dedicate per l'archiviazione dei documenti esportati ed elaborati.

    • Assicurati che le cartelle siano vuote prima di avviare la pipeline.
  3. Uno schema con mappature tra le entità Document AI e le proprietà di Document AI Warehouse.

Esegui la pipeline

REST

curl --location --request POST 'https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION:runPipeline' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${AUTH_TOKEN}" \
--data '{
    "name": "projects/PROJECT_NUMBER/locations/LOCATION",
    "process_with_doc_ai_pipeline": {
        "documents": [
          "projects/PROJECT_NUMBER/locations/LOCATION/documents/DOCUMENT"
        ],
        "export_folder_path": "gs://EXPORT_FOLDER",
        "processor_info": {
          "processor_name": "projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR"
        },
        "processor_results_folder_path": "gs://PROCESS_FOLDER"
    },
    "request_metadata": {
        "user_info": {
            "id": "user:USER EMAIL ADDRESS"
        }
    }
}'

L'elenco documents contiene i nomi delle risorse dei documenti da elaborare. Il percorso della cartella Cloud Storage export_folder_path viene utilizzato per archiviare i documenti esportati prima di inviarli al processore. Per ulteriori informazioni sui campi del corpo della richiesta, consulta la documentazione dell'API.

Questo comando restituisce il nome di una risorsa per un'operazione a lunga esecuzione. Con questo nome di risorsa, puoi monitorare l'avanzamento della pipeline seguendo il passaggio successivo.

Ottieni il risultato dell'operazione a lunga esecuzione

REST

curl --location --request GET 'https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/operations/OPERATION' \
--header "Authorization: Bearer ${AUTH_TOKEN}"

Passaggi successivi

Vai all'interfaccia utente di Document AI Warehouse o chiama l' API document:get per verificare se i documenti sono stati aggiornati correttamente.