Pipeline Process-with-Document-AI

La pipeline Elabora con Document AI consente agli utenti di elaborare i documenti esistenti con un processore Document AI e aggiornare le proprietà dei documenti con le entità appena estratte.

Prerequisiti

Prima di iniziare, devi disporre di quanto segue:

  1. Un processore Document AI pronto nello stesso progetto Google Cloud.

    • Se non ne hai uno, segui i passaggi per crearne uno. Puoi scegliere di creare qualsiasi tipo, purché il tipo di processore corrisponda al tipo di documento.
  2. Cartelle Cloud Storage dedicate per l'archiviazione dei documenti esportati e di quelli elaborati.

    • Assicurati che le cartelle siano vuote prima di avviare la pipeline.
  3. Uno schema con mappature tra le entità Document AI e le proprietà di Document AI Warehouse.

    • Le entità appena estratte potrebbero non essere convertite correttamente in entità Document AI Warehouse senza un mapping di questo tipo.

    • Per aggiungere mappature allo schema, segui la procedura descritta in Impostare schemi con mappatura.

esegui la pipeline.

REST

curl --location --request POST 'https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION:runPipeline' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${AUTH_TOKEN}" \
--data '{
    "name": "projects/PROJECT_NUMBER/locations/LOCATION",
    "process_with_doc_ai_pipeline": {
        "documents": [
          "projects/PROJECT_NUMBER/locations/LOCATION/documents/DOCUMENT"
        ],
        "export_folder_path": "gs://EXPORT_FOLDER",
        "processor_info": {
          "processor_name": "projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR"
        },
        "processor_results_folder_path": "gs://PROCESS_FOLDER"
    },
    "request_metadata": {
        "user_info": {
            "id": "user:USER EMAIL ADDRESS"
        }
    }
}'

L'elenco documents contiene i nomi delle risorse dei documenti da elaborare. Il percorso della cartella Cloud Storage export_folder_path viene utilizzato per archiviare i documenti esportati prima di inviarli al processore. Per saperne di più sui campi del corpo della richiesta, consulta la documentazione dell'API.

Questo comando restituisce il nome di una risorsa per un'operazione a lunga esecuzione. Con questo nome risorsa, puoi monitorare l'avanzamento della pipeline seguendo il passaggio successivo.

Ottieni il risultato dell'operazione a lunga esecuzione

REST

curl --location --request GET 'https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/operations/OPERATION' \
--header "Authorization: Bearer ${AUTH_TOKEN}"

Passaggi successivi

Vai alla UI di Document AI Warehouse o chiama l'API document:get per verificare se i documenti sono stati aggiornati correttamente.