AML AI 詞彙

本詞彙表定義反洗錢 AI 專用的術語。如需一般機器學習術語,請參閱機器學習詞彙表

A

ADC

每個 API 用戶端程式庫都提供使用本機應用程式預設憑證 (ADC) 的方法

如要瞭解本機 ADC 憑證與 gcloud CLI 憑證的差異,請參閱「gcloud CLI 憑證和 ADC 憑證」。

B

回溯測試
回溯測試會使用歷來資料評估模型成效 (觀察到的召回率),方法是比較模型產生的風險分數與歷來調查的實際結果。
回測結果
系統會建立 AML AI BacktestResult 資源 (也稱為「回溯測試結果」),用於測試模型資料集上的成效。
詳情請參閱「評估模型」。

C

核心銀行資料
核心銀行資料包括當事人、交易和帳戶持有人的資料。這有助於 AML AI 瞭解客戶及其銀行活動,進而偵測出風險特徵和行為。

D

資料驗證
建立資料集、引擎設定、模型、回溯測試結果或預測結果時,AML AI 會進行資料驗證檢查。如果指定的資料集未通過資料驗證,系統就不會建立資源,並產生資料驗證錯誤 (指出問題的性質)。
詳情請參閱「資料驗證錯誤」。
資料集

AML AI 資料集資源 (或簡稱「資料集」) 用於指定資料,這些資料符合 AML 輸入資料模型,可用於生成模型、評估模型效能,以及為各方生成風險分數和可解釋性。

詳情請參閱「瞭解 AML 資料模型和規定」。

E

結束時間

AML AI 作業 (例如模型訓練、評估範例和模型輸出) 會使用資料集,這些資料集是由銀行在幾個月內收集的資料範例組成。執行這些作業時,您必須指定結束時間,也就是資料集時間範圍內的日期。根據這個結束時間,作業會使用結束時間前最後一個完整曆月做為作業中使用的最終資料月份。

作業的結束時間和所有月份都必須在相關聯資料集的日期範圍內。

舉例來說,模型訓練作業會使用 15 個週期,最長回溯期為 13 個月。資料集的日期範圍為 2020 年 10 月 15 日至 2023 年 5 月 21 日。訓練結束時間為 2023 年 4 月 12 日。訓練會使用 2021 年 1 月 1 日至 2023 年 3 月 31 日的範例,也就是結束時間前 27 個完整的日曆月。這個時間範圍在資料集的日期範圍內。

引擎設定

AML AI EngineConfig 資源 (也稱為「引擎設定」) 會指定生成及評估 AML AI 模型,以及生成風險分數和可解釋性的參數。

其中部分參數會在 API 呼叫中指定,用於建立引擎設定,例如引擎版本和預期調查量。AML AI 會使用指定的資料集自動產生其他參數,例如調整過的超參數。

詳情請參閱「設定引擎」。

引擎版本

AML AI EngineVersion 資源 (也稱為「引擎版本」) 定義 AML AI 偵測風險的方式,包括模型調整、訓練和評估,以及整體 AML 資料模型和特徵系列。

設定 AML AI 引擎時,您必須指定要使用的引擎版本。接著,系統會使用引擎版本,根據引擎設定訓練及評估模型,並產生風險分數和可解釋性。

引擎版本命名結構如下,引擎類型表示支援的業務線,引擎子類型、微調、主要版本和次要版本則會在實作新行為時更新。

例如:

  • aml-retail.default.v004.008.202411-001
  • aml-commercial.default.v004.008.202411-001
引擎版本管理

如要進一步瞭解如何管理引擎版本,請參閱「管理引擎版本」。

評估

另請參閱「回溯測試」。

可解釋性

AML AI 模型可用於識別具有洗錢高風險行為或特徵的當事人。可解釋性會指出哪些行為或特徵對特定對象的高風險分數影響最大。

詳情請參閱「瞭解預測輸出內容」。

另請參閱「預測」。

匯出中繼資料

多項 AML AI 資源會儲存與效能和資料品質相關的其他資訊,可透過匯出中繼資料作業存取。

詳情請參閱 AML 輸出資料模型

F

功能系列
特徵組合是相關機器學習特徵的集合,提供簡單易懂的分類,供調查人員和內部稽核團隊參考。

I

不可變動的實體

AML AI 必須能夠在不同時間點重新建立資料檢視畫面,以進行調整、訓練和回溯測試。為此,AML AI 會區分可變動實體 (值會隨時間變更) 和不可變動實體 (值不會變更)。

舉例來說,可變動的實體可能是支票帳戶餘額,這會隨時間變動;但不可變動的實體可能是事件,例如 2024 年 7 月 2 日 12:00:00 從支票帳戶提領 $50 美元,這不會變動,因為這是當時的快照。

AML 輸入資料模型中,代表不可變動實體的資料表沒有 validity_start_timeis_entity_deleted 欄位。包括 RiskCaseEvent 資料表。

詳情請參閱「瞭解資料隨時間的變化」。

另請參閱「可變動的實體」。

執行個體

AML AI Instance 資源 (也稱為「執行個體」) 位於所有其他 AML AI 資源的根層級,您必須先建立這個資源,才能使用其他 AML AI 資源。您可以在專案的同一區域中建立多個執行個體。

詳情請參閱「建立 AML AI 執行個體」。

調查程序

調查程序涵蓋由快訊觸發的整個調查或一連串調查。調查程序會在調查的第一部分開始時啟動,並在預期不會有進一步結果時結束。

詳情請參閱「風險案件生命週期」。

L

LOB
業務線 (LOB) 可區分 AML AI 中的零售和商業銀行客戶。資料集、引擎版本和參與者註冊資訊會連結至特定業務、零售或商業。
回溯期

對於微調、訓練、預測或回溯測試作業使用的每個週期,AML AI 都需要資料集涵蓋回溯視窗,才能產生追蹤一段時間內行為的特徵。回溯期取決於引擎版本。

詳情請參閱「瞭解資料範圍和時間長度」。

LRO

多項 AML AI 作業 (包括引擎設定、訓練、回溯測試和預測) 都會啟動長時間執行的作業 (LRO)。

詳情請參閱「管理長時間執行的作業」。

M

遺漏

建立下列 AML AI 資源時,系統會為所有特徵系列計算缺失值指標:引擎設定、模型、回溯測試結果和預測結果。

這項指標會顯示特徵系列中所有特徵的遺漏值比例。如果任何特徵系列的缺失值在微調、訓練、評估和預測之間出現重大變化,可能表示所用資料集不一致。

model

AML AI 模型資源 (也稱為「模型」) 代表經過訓練的模型,可用於生成風險分數和可解釋性。

可變動的實體

AML AI 必須能夠在不同時間點重新建立資料檢視畫面,以進行調整、訓練和回溯測試。為此,AML AI 會區分可變動的實體 (值會隨時間改變) 和不可變動的實體 (值不會改變)。

舉例來說,可變動的實體可能是您的支票帳戶餘額,這會隨時間改變;但不可變動的實體可能是事件,例如 2024 年 7 月 2 日 12:00:00 從支票帳戶提領 $50 美元,這不會改變,因為這是當時的快照。

AML 輸入資料模型中,代表可變動實體的資料表含有 validity_start_timeis_entity_deleted 欄位。包括「Party」、「AccountPartyLink」AccountPartyLink、「Transaction」和「PartySupplementaryData」PartySupplementaryData 資料表。

詳情請參閱「瞭解資料隨時間的變化」。

另請參閱「不可變動的實體」。

O

observed-recall

AML AI 會使用「觀察到的召回率」指標,評估模型在歷史資料上的成效。

這項指標會顯示在所選期間內,模型評估為高風險的可疑活動期間中,正向標記的當事人 (例如顧客退出) 所占比例。

P

party

AML 輸入資料模型中,當事人代表銀行的客戶。當事人可以是自然人或法人。

詳情請參閱「Party」資料表。

另請參閱「已註冊的當事人」。

預測

預測是使用模型產生風險分數可解釋性,可用於反洗錢調查程序

預測結果

AML AI PredictionResult 資源 (也稱為「預測結果」) 是使用模型建立預測的結果。

如要進一步瞭解如何產生風險分數和可解釋性,以及如何在調查程序中使用這些資訊,請參閱「產生風險分數和可解釋性」一節中的頁面。

R

註冊方
如要使用當事人建立預測結果 (例如當事人層級的風險分數和可解釋性),當事人必須先註冊相應的業務線
風險案例

風險案件涵蓋調查程序,或不同當事人的相關調查程序群組。

請參閱 RiskCaseEvent 資料表。

風險調查資料

反洗錢 AI 會使用風險調查資料,瞭解您的風險調查程序和結果,並生成訓練標籤。

風險分數

AML AI 模型可用於識別具有洗錢高風險行為或特徵的當事人。這項作業是透過風險分數完成。

風險分數介於 0 到 1 之間,分數越高,表示風險越高。不過,風險分數不應直接解讀為洗錢活動的機率。

詳情請參閱「瞭解預測輸出內容」。

風險類型

AML AI 可識別與交易監控相關的五種核心 AML 風險類型,藉此找出洗錢風險。

經過充分調查並提供補充第三方資料 (請參閱「補充資料」表格) 後,AML AI 就能涵蓋更多類型。

S

補充資料

補充資料是指 AML AI 結構定義中核心銀行資料風險調查資料以外的額外資料,可用於預測洗錢風險。

舉例來說,您可能會找出並新增風險指標,協助模型更準確地預測其他未涵蓋的風險類型。

您可以使用「PartySupplementaryData」PartySupplementaryData資料表,將補充資料新增至資料集。

可疑活動期間

可疑活動期間是指您認為受查對象出現可疑行為的時間範圍。這項指標可用於模型評估 (例如回溯測試結果的召回率指標),確認系統在可疑活動發生月份,是否能識別出高風險顧客。模型會根據可疑活動期間,在正確的時間點 (例如可疑活動發生期間或之後不久) 識別風險。可疑活動期間會用於驗證,以進行調整和訓練,也會用於回溯測試中的召回率指標。

詳情請參閱「風險案件生命週期」。

T

訓練
AML AI 會使用指定引擎設定中的超參數 (請參閱調整),在建立模型時進行訓練。
微調
調整是最佳化模型超參數的過程。AML AI 會在建立引擎設定時進行微調。

V

效期開始時間

AML AI 會使用可變動實體的有效開始時間,建構銀行在特定時間點所知資訊的檢視畫面。這有助於 AML AI 準確訓練模型,並在最新資料 (即銀行所知的資訊) 上重複使用,產生高準確度的風險分數。

特定資料列的有效開始時間,代表銀行得知該資料列中資料的時間,且該資料正確無誤。

詳情請參閱「瞭解資料隨時間變化的情形」。