Pipeline Proses dengan Document-AI

Pipeline Proses dengan Document AI memungkinkan pengguna memproses dokumen yang ada dengan prosesor Document AI dan memperbarui properti dokumen dengan entity yang baru diekstrak.

Prasyarat

Sebelum memulai, Anda memerlukan hal berikut:

  1. Pemroses Document AI yang siap di project Google Cloud yang sama.

    • Jika Anda tidak memiliki prosesor, ikuti langkah-langkah untuk membuatnya. Anda dapat memilih untuk membuat jenis apa pun selama jenis pemroses cocok dengan jenis dokumen.
  2. Folder Cloud Storage khusus untuk menyimpan dokumen yang diekspor dan dokumen yang diproses.

    • Pastikan folder kosong sebelum Anda memulai pipeline.
  3. Skema dengan pemetaan antara entity Document AI dan properti Document AI Warehouse.

    • Entitas yang baru diekstrak mungkin tidak dikonversi dengan benar menjadi entitas Document AI Warehouse tanpa pemetaan tersebut.

    • Untuk menambahkan pemetaan ke skema, ikuti menetapkan skema dengan pemetaan.

Menjalankan pipeline

REST

curl --location --request POST 'https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION:runPipeline' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${AUTH_TOKEN}" \
--data '{
    "name": "projects/PROJECT_NUMBER/locations/LOCATION",
    "process_with_doc_ai_pipeline": {
        "documents": [
          "projects/PROJECT_NUMBER/locations/LOCATION/documents/DOCUMENT"
        ],
        "export_folder_path": "gs://EXPORT_FOLDER",
        "processor_info": {
          "processor_name": "projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR"
        },
        "processor_results_folder_path": "gs://PROCESS_FOLDER"
    },
    "request_metadata": {
        "user_info": {
            "id": "user:USER EMAIL ADDRESS"
        }
    }
}'

Daftar documents adalah nama resource dokumen yang akan diproses. Jalur folder Cloud Storage export_folder_path digunakan untuk menyimpan dokumen yang diekspor sebelum dikirim ke pemroses. Untuk mengetahui informasi selengkapnya tentang kolom isi permintaan, lihat dokumentasi API.

Perintah ini menampilkan nama resource untuk operasi yang berjalan lama. Dengan nama resource ini, Anda dapat melacak progres pipeline dengan mengikuti langkah berikutnya.

Mendapatkan hasil operasi yang berjalan lama

REST

curl --location --request GET 'https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/operations/OPERATION' \
--header "Authorization: Bearer ${AUTH_TOKEN}"

Langkah berikutnya

Buka UI Document AI Warehouse atau panggil API document:get untuk memeriksa apakah dokumen berhasil diperbarui.