快速入門導覽課程:完成審查任務
每個處理器都會建立「HITL 工作」,並指派給一組標籤人員 (稱為「標籤人員集區」),由他們審查處理器處理的文件。處理完畢後,這些文件會排入工作佇列,由指派的標籤加註者集區進行 HITL 審查。
事前準備
請先完成先前的「快速入門:設定人工審查作業」,再繼續操作。新增標籤人員
- 完成設定人工審查後,您應該會收到類似以下的電子郵件:
From: AI Platform <noreply-aiplatform@google.com>\
Subject: Added to AI Platform SpecialistPool Test Labeler Group
Hello AI Platform Customer,
You are added as a manager to specialist pool
cloudml_data_specialists_us_central1_785484070008756xxxx.
To view details, visit Manager console
https://datacompute.google.com/cm/
Sincerely,
The Google Cloud AI Team
按一下電子郵件中的連結 (或剪下並貼到瀏覽器中),前往「管理員」頁面:
新建立的處理器所建立的工作與處理器同名 (例如「部門 A 發票」),並列在「工作」分頁中。
按一下「標記者」分頁標籤
按一下「新增標註者」,並新增至少一位標註者 (電子郵件地址)。管理員可以擔任標籤者,因此你可以新增自己。
如果是新建立的標註者集區,必須在「指派」分頁中,將工作明確指派給個別標註者。也就是說,加入標註者集區後,系統不會自動將工作指派給這些新標註者。如果標籤員集區已佈建標籤員,系統會自動將集區指派給工作。
發布初始文件以供審查
透過建立的處理器傳送要擷取的文件。視需要參閱使用指南。目前,線上 (同步) 和批次 (非同步) 呼叫都支援將支援的處理器導向人工審查。
為進行測試,您可以採用已知的低品質擷取結果,讓信心指數低於門檻,進而觸發人工審查,也可以將門檻設為 100%。文件限制通常為最多 5 頁,大小上限為 20 MB,但請查看特定處理器的限制。
您可以透過 API 追蹤送交人工審查的每份文件。在處理器回應中,有一個
humanReviewOperation字串是人工審查中文件的作業 ID (工作名稱)。您可以查詢這項長時間執行的作業 (也稱為 LRO) 的狀態。如要查詢已送交人工審查的文件狀態,請使用
projects.locations.operations.get方法。您可以使用
reviewDocument方法強制將文件送交人工審查 (請注意,這項方法適用於特定處理器):使用
reviewDocument方法時,必須勾選「啟用人工審查」核取方塊。使用這項 API 不會覆寫設定。如要使用這個方法,請參閱「要求人工審查」指南。
查看文件
如果文件觸發人工審查程序,但集區中沒有標註員,管理員就會收到電子郵件。
> Hello AI Platform Customer, > > There is a running task for Project with Job ID 404298342016955xxxx,\ > Labeling Task ID cloudml_data_us_central1_prod_11b273b4dabdxxxx,\ > Display name \ > datalabeling-job-8005676103232389120-for-hitl-340697311810578xxxx,\ > replication count 1\ > Please see attachment for instruction.\ > Please add labelers and have them finish the task at Labeler console \ > [https://datacompute.google.com/w/cloudml_data_specialists_us_central1_7854840700087566336](https://datacompute.google.com/w/cloudml_data_specialists_us_central1_7854840700087566336){: target="external" class="external" track-type="quickstart" track-name="externalLink" track-metadata-position="body" }.\ > To view details, visit Manager console \ > [https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_7854840700087566336/tasks](https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_7854840700087566336/tasks){: target="external" class="external" track-type="quickstart" track-name="externalLink" track-metadata-position="body" }. > > Sincerely,\ The Google Cloud AI Team
標籤管理員可透過這些連結指派標籤工作。
如果標註者未加入標註群組,且是新加入的成員,標註管理員必須傳送類似的電子郵件,向新加入的標註者提供操作說明。
標籤人員步驟
標籤人員程序
標籤人員電子郵件地址
如果標記者已在步驟 2e 中加入標記群組,系統會自動分配工作,並向標記者傳送類似下方的電子郵件:

這封電子郵件中的連結,是所選標註者在文件上進行標註工作的機制。
標籤動作:
標註者點選連結進行標註時,會看到下方的互動式 AI 人工審查使用者介面。以黃色醒目顯示的資料列表示驗證失敗的資料列 (即低於設定的信賴分數門檻),需要審查。

檢查:將游標懸停在系統辨識的文字欄位上,即可查看辨識的文字和欄位名稱 (結構定義),欄位名稱會以較小的字型顯示在文字下方。左側面板也會醒目顯示該列。
使用者可以透過工具列左上方的放大鏡圖示放大/縮小畫面。

變更欄位
按一下欄位 (左鍵) 即可編輯:
您可以在左側面板中變更值或標籤。然後點選「套用」。
或者,按一下文件圖片上的其中一個調整大小的角落圖示,即可調整文件文字周圍的方塊大小:
如圖所示,如果選取不同文字,左側面板中欄位的「值」就會隨之變更。如有需要,可以進一步編輯這段文字。然後點選「套用」。
請務必使用右上角的頁面控制項,查看所有頁面。
完成所有必要的標籤變更後,按一下左下方的「提交」。結果 JSON 會儲存至「結果位置」資料夾。
如果無法順利標記文件,可以按一下「拒絕」 (位於左下方),然後選取拒絕文件的原因: - 選取原因,然後按一下「拒絕文件」。
標註者也可以點選右上角的下列圖示:
- 數據分析 - 顯示審查的文件數量 (答案) 和總時間。
- 通知:顯示他們收到的所有通知。
- 更多 (3 個圓點):略過文件、尋找答案或提供意見回饋 (如已啟用)。
- 切換標題列 (對角箭頭) - 隱藏 (或顯示) DataCompute 標題列,爭取更多空間。
標籤管理工具
從 Cloud Storage 檢閱文件
如要查看文件,有以下兩種方法:
選項 1:
- 從先前設定的位置找出 Cloud Storage
- 擷取並下載文件
選項 2:
- 請記住 URI,以便從預測回應中擷取文件
- 呼叫 URI 來擷取審查過的文件