Glossar zu AML AI

In diesem Glossar werden Begriffe definiert, die speziell für AML AI gelten. Allgemeine Begriffe zum maschinellen Lernen finden Sie im Glossar zum maschinellen Lernen.

A

ADC

Jede der API-Clientbibliotheken bietet eine Möglichkeit, lokale Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) zu verwenden.

Informationen zum Unterschied zwischen Ihren lokalen ADC-Anmeldedaten und Ihren gcloud CLI-Anmeldedaten finden Sie unter gcloud CLI-Anmeldedaten und ADC-Anmeldedaten.

B

Backtesting
Beim Backtesting werden Verlaufsdaten verwendet, um die Leistung (beobachteter Recall) eines Modells zu bewerten. Dazu wird der vom Modell generierte Risikoindex mit den tatsächlichen Ergebnissen früherer Untersuchungen verglichen.
Backtest-Ergebnisse
Eine AML AI-Ressource vom Typ BacktestResult (auch als „Backtestergebnisse“ bezeichnet) wird erstellt, um die Leistung eines Modells anhand eines Datasets zu testen.
Weitere Informationen finden Sie unter Modell bewerten.

C

Core-Banking-Daten
Core-Banking-Daten umfassen Daten zu Parteien, Transaktionen und Kontoguthaben. So kann AML AI Ihre Kunden und deren Banking-Aktivitäten besser verstehen, um riskante Merkmale und Verhaltensweisen zu erkennen.

D

Datenvalidierung
AML AI führt Datenvalidierungsprüfungen durch, wenn ein Dataset, eine Engine-Konfiguration, ein Modell, Backtest-Ergebnisse oder Vorhersageergebnisse erstellt werden. Wenn das angegebene Dataset die Datenvalidierung nicht besteht, wird die Ressource nicht erstellt und es werden Datenvalidierungsfehler ausgegeben, die auf die Art des Problems hinweisen.
Weitere Informationen finden Sie unter Datenvalidierungsfehler.
Dataset

Eine AML AI-Dataset-Ressource (oder einfach „Dataset“) wird verwendet, um Daten anzugeben, die dem AML-Eingabedatenmodell entsprechen und zum Generieren eines Modells, zum Bewerten der Leistung eines Modells und zum Generieren von Risikobewertungen und Erklärbarkeit pro Partei verwendet werden können.

Weitere Informationen finden Sie unter AML-Datenmodell und ‑Anforderungen.

E

Endzeit

Für AML AI-Vorgänge (z. B. Modelltraining, Bewertungsbeispiele und Modellausgaben) werden Datasets verwendet, die aus Beispielen aus den Daten der Bank bestehen, die über einen Zeitraum von Monaten erfasst wurden. Für diese Vorgänge müssen Sie eine Endzeit angeben, die ein Datum innerhalb des Zeitraums des Datasets ist. Anhand dieser Endzeit wird für den Vorgang der letzte vollständige Kalendermonat vor der Endzeit als letzter Monat mit Daten verwendet.

Die Endzeit und alle Monate, die für einen Vorgang verwendet werden, müssen innerhalb des Datumsbereichs des zugehörigen Datasets liegen.

Bei einem Modelltrainingsvorgang werden beispielsweise 15 Zeiträume mit einem maximalen Rückblickszeitraum von 13 Monaten verwendet. Der Datensatz umfasst den Zeitraum vom 15. Oktober 2020 bis zum 21. Mai 2023. Das Training endet am 12. April 2023. Für das Training werden Beispiele vom 1. Januar 2021 bis zum 31. März 2023 verwendet. Das sind 27 volle Kalendermonate vor dem Endzeitpunkt. Dieser Zeitraum liegt innerhalb des Zeitraums des Datasets.

Engine-Konfiguration

Eine AML AI-EngineConfig-Ressource (auch als „Engine-Konfiguration“ bezeichnet) gibt Parameter für das Generieren und Bewerten eines AML AI-Modells sowie für das Generieren von Risikobewertungen und Erklärbarkeit an.

Einige dieser Parameter werden im API-Aufruf zum Erstellen einer Engine-Konfiguration angegeben, z. B. die Engine-Version und das erwartete Untersuchungsvolumen. Andere Parameter werden automatisch von AML AI mithilfe eines angegebenen Datasets generiert, z. B. abgestimmte Hyperparameter.

Weitere Informationen finden Sie unter Engine konfigurieren.

Engine-Version

Eine AML AI-EngineVersion-Ressource (auch als „Engine-Version“ bezeichnet) definiert Aspekte der Risikoerkennung durch AML AI, einschließlich Modellabstimmung, Training und Bewertung sowie des allgemeinen AML-Datenmodells und der Feature-Familien.

Zum Konfigurieren einer AML AI-Engine müssen Sie eine zu verwendende Engine-Version angeben. Die Engine-Version wird dann verwendet, um Modelle mit dieser Engine-Konfiguration zu trainieren und zu bewerten und um Risikobewertungen und Erklärbarkeit zu generieren.

Die Benennung der Engine-Version ist wie folgt strukturiert. Der Engine-Typ gibt die unterstützte Branche an. Der Engine-Subtyp, die Optimierung, die Hauptversion und die Nebenversion werden aktualisiert, wenn neue Verhaltensweisen implementiert werden.

Beispielversionen:

  • aml-retail.default.v004.008.202411-001
  • aml-commercial.default.v004.008.202411-001
Versionsverwaltung für Engines

Weitere Informationen zum Verwalten von Engine-Versionen finden Sie unter Engine-Versionen verwalten.

Bewertung

Siehe auch Backtesting.

Erklärbarkeit

AML AI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit einem hohen Risiko für Geldwäsche aufweisen. Die Erklärbarkeit gibt an, welche Verhaltensweisen oder Merkmale am meisten zu einem hohen Risikowert für eine bestimmte Partei beigetragen haben.

Weitere Informationen finden Sie unter Vorhersageausgaben.

Siehe auch Vorhersage.

Metadaten exportieren

In mehreren AML AI-Ressourcen werden zusätzliche Informationen zu Leistung und Datenqualität gespeichert, auf die mit dem Vorgang „Metadaten exportieren“ zugegriffen werden kann.

Weitere Informationen finden Sie unter AML-Ausgabedatenmodell.

F

Funktionsfamilie
Feature-Familien sind Sammlungen verwandter ML-Features, die eine einfache, für Menschen verständliche Kategorisierung bieten, um Ermittler und interne Prüfungsteams zu informieren.

I

Unveränderliche Entität

AML AI muss Ansichten der Daten zu verschiedenen Zeitpunkten für die Optimierung, das Training und das Backtesting erstellen können. Dazu unterscheidet AML AI zwischen veränderlichen (deren Werte sich im Laufe der Zeit ändern können) und unveränderlichen (deren Werte sich nicht ändern) Einheiten.

Ein Beispiel für eine veränderliche Einheit ist Ihr Girokontostand, der sich im Laufe der Zeit ändern kann. Eine unveränderliche Einheit ist dagegen ein Ereignis, z. B. die Abbuchung von 50 € am 2. Juli 2024 um 12:00:00 Uhr von Ihrem Girokonto. Dieses Ereignis ändert sich nicht, da es eine Momentaufnahme zu einem bestimmten Zeitpunkt ist.

Im AML-Eingabedatenmodell haben Tabellen, die unveränderliche Einheiten darstellen, nicht die Felder validity_start_time und is_entity_deleted. Dazu gehört auch die Tabelle RiskCaseEvent.

Weitere Informationen finden Sie unter Änderungen an Daten im Zeitverlauf.

Siehe auch veränderbare Einheit.

instance

Eine AML AI-Instanzressource (auch als „Instanz“ bezeichnet) befindet sich am Stamm aller anderen AML AI-Ressourcen und muss erstellt werden, bevor Sie mit anderen AML AI-Ressourcen arbeiten können. Es können mehrere Instanzen in derselben Region innerhalb eines Projekts erstellt werden.

Weitere Informationen finden Sie unter AML AI-Instanz erstellen.

Untersuchungsverfahren

Ein Untersuchungsverfahren umfasst die gesamte Untersuchung oder Abfolge von Untersuchungen, die durch eine Benachrichtigung ausgelöst werden. Der Prozess beginnt mit dem ersten Teil einer Untersuchung und endet, wenn keine weiteren Ergebnisse aus dieser Untersuchung erwartet werden.

Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.

L

LOB
Die Geschäftssparte (Line of Business, LOB) unterscheidet Einzelhandels- und Geschäftsbankkunden in AML AI. Datasets, Engine-Versionen und die Registrierung von Rechtssubjekten sind mit einem bestimmten Geschäftsbereich, Einzelhandel oder Unternehmen verknüpft.
Lookback-Window

Für jeden Zeitraum, der von einem Vorgang zum Abstimmen, Trainieren, Vorhersagen oder Backtesten verwendet wird, sind in AML AI Datasets erforderlich, die ein Rückblickfenster abdecken, damit Features generiert werden können, die das Verhalten im Zeitverlauf nachvollziehen. Dieses Lookback-Window hängt von der Engine-Version ab.

Weitere Informationen finden Sie unter Datenbereich und ‑zeitraum.

LRO

Bei mehreren AML AI-Vorgängen, einschließlich der Engine-Konfiguration, des Trainings, des Backtestings und der Vorhersage, wird ein Vorgang mit langer Ausführungszeit (Long-Running Operation, LRO) initiiert.

Weitere Informationen finden Sie unter Vorgänge mit langer Ausführungszeit verwalten.

M

Fehlende Werte

Der Messwert für fehlende Werte wird für alle Feature-Familien berechnet, wenn die folgenden AML AI-Ressourcen erstellt werden: Engine-Konfiguration, Modell, Backtest-Ergebnisse und Vorhersageergebnisse.

Dieser Messwert gibt den Anteil der fehlenden Werte für alle Funktionen in einer Funktionsgruppe an. Eine signifikante Änderung der Anzahl fehlender Werte für eine beliebige Attributgruppe zwischen Optimierung, Training, Auswertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datasets hinweisen.

model

Eine AML AI-Modellressource (auch als „Modell“ bezeichnet) stellt ein trainiertes Modell dar, mit dem Risikobewertungen und Erklärbarkeit generiert werden können.

veränderliche Entität

AML AI muss Ansichten der Daten zu verschiedenen Zeitpunkten für die Optimierung, das Training und das Backtesting erstellen können. Dazu unterscheidet AML AI zwischen veränderlichen (deren Werte sich im Laufe der Zeit ändern können) und unveränderlichen (deren Werte sich nicht ändern) Einheiten.

Ein Beispiel für eine veränderliche Entität ist Ihr Girokontostand, der sich im Laufe der Zeit ändern kann. Eine unveränderliche Entität ist beispielsweise ein Ereignis wie die Abbuchung von 50 € am 2. Juli 2024 um 12:00:00 Uhr von Ihrem Girokonto. Dieses Ereignis ändert sich nicht, da es eine Momentaufnahme zu einem bestimmten Zeitpunkt ist.

Im AML-Eingabedatenmodell haben Tabellen, die veränderliche Einheiten darstellen, die Felder validity_start_time und is_entity_deleted. Dazu gehören die Tabellen Party, AccountPartyLink, Transaction und PartySupplementaryData.

Weitere Informationen finden Sie unter Änderungen an Daten im Zeitverlauf.

Siehe auch unveränderliche Einheit.

O

Beobachteter Recall

AML AI misst die Modellleistung anhand von Verlaufsdaten mit dem Messwert „Beobachteter Recall“.

Dieser Messwert gibt den Anteil der positiv gekennzeichneten Einheiten (z. B. Kundenabgänge) aus einem ausgewählten Zeitraum an, die während eines Zeitraums mit verdächtigen Aktivitäten vom zu bewertenden Modell als risikoreich eingestuft worden wären.

P

party

Im AML-Eingabedatenmodell stellt eine Partei einen Kunden der Bank dar. Eine Partei kann eine natürliche oder eine juristische Person sein.

Weitere Informationen finden Sie in der Tabelle Party.

Siehe auch registrierte Partei.

Vorhersage

Bei der Vorhersage wird ein Modell verwendet, um Risikobewertungen und Erklärbarkeit zu generieren, die in Ihrem AML-Prüfprozess verwendet werden können.

Vorhersageergebnisse

Eine AML AI-PredictionResult-Ressource (auch als „Vorhersageergebnisse“ bezeichnet) ist das Ergebnis der Verwendung eines Modells zum Erstellen von Vorhersagen.

Weitere Informationen zum Generieren von Risikobewertungen und Erklärbarkeit sowie zur Verwendung dieser Informationen bei der Untersuchung finden Sie auf den Seiten im Abschnitt Risikobewertungen und Erklärbarkeit generieren.

R

registrierte Partei
Bevor eine Partei zum Erstellen von Vorhersageergebnissen (z. B. Risikobewertungen auf Parteiebene und Erklärbarkeit) verwendet werden kann, muss die Partei für die entsprechende Branche registriert sein.
Risikofall

Ein Risikofall umfasst einen Untersuchungsprozess oder eine Gruppe von zusammenhängenden Untersuchungsprozessen für verschiedene Parteien.

Weitere Informationen finden Sie in der Tabelle RiskCaseEvent.

Daten zur Risikoprüfung

AML AI verwendet Daten zur Risikoprüfung, um Ihren Prozess und Ihre Ergebnisse bei der Risikoprüfung zu verstehen und Trainingslabels zu generieren.

Risikowert

AML AI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit einem hohen Risiko für Geldwäsche aufweisen. Dies geschieht anhand einer Risikobewertung.

Die Risikobewertungen liegen zwischen 0 und 1. Ein höherer Wert weist auf ein höheres Risiko hin. Risikobewertungen sollten jedoch nicht direkt als Wahrscheinlichkeit für Geldwäscheaktivitäten interpretiert werden.

Weitere Informationen finden Sie unter Vorhersageausgaben.

Risikotypologie

Mit AML AI lässt sich das Geldwäscherisiko in fünf wichtigen AML-Risikotypologien im Zusammenhang mit der Transaktionsüberwachung erkennen.

Mit ausreichenden Untersuchungen und zusätzlichen Daten von Dritten (siehe Tabellen unter Zusätzliche Daten) kann AML AI mehr Typologien abdecken.

S

Zusatzdaten

Zusätzliche Daten sind zusätzliche Daten, die über die Bereiche Core Banking Data und Risk Investigation Data des AML AI-Schemas hinausgehen und für die Vorhersage des Risikos von Geldwäsche relevant sind.

So können Sie beispielsweise einen Risikoindikator identifizieren und hinzufügen, mit dem Modelle eine Risikotypologie, die ansonsten nicht gut abgedeckt ist, besser vorhersagen können.

Mit der Tabelle PartySupplementaryData können einem Datensatz zusätzliche Daten hinzugefügt werden.

Zeitraum für verdächtige Aktivitäten

Ein Zeitraum mit verdächtigen Aktivitäten ist ein Zeitraum, in dem Sie glauben, dass eine untersuchte Partei verdächtiges Verhalten gezeigt hat. Dieser Wert wird bei der Modellbewertung verwendet, z. B. für den Recall-Messwert für Backtest-Ergebnisse. So lässt sich bestätigen, dass Kunden mit hohem Risiko in Monaten identifiziert werden, in denen sie verdächtige Aktivitäten hatten. Der Zeitraum für verdächtige Aktivitäten hilft Modellen, das Risiko zum richtigen Zeitpunkt zu erkennen, z. B. während oder kurz nach dem Zeitraum, in dem die verdächtige Aktivität aufgetreten ist. Der Zeitraum für verdächtige Aktivitäten wird bei der Validierung zum Optimieren und Trainieren sowie für die Recall-Messwerte beim Backtesting verwendet.

Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.

T

Training
AML AI führt das Training im Rahmen der Erstellung eines Modells mit Hyperparametern (siehe Abstimmung) aus einer angegebenen Engine-Konfiguration durch.
tuning
Die Abstimmung ist die Optimierung von Modellhyperparametern. AML AI führt das Tuning im Rahmen der Erstellung einer Engine-Konfiguration durch.

V

Beginn des Gültigkeitszeitraums

Die Gültigkeitsbeginnzeit für eine änderbare Einheit wird von AML AI verwendet, um eine Ansicht dessen zu erstellen, was der Bank zu einem bestimmten Zeitpunkt bekannt war. So kann AML AI Modelle genau trainieren, die mit den neuesten Daten (d. h. den Daten, die der Bank bekannt sind) wiederverwendet werden können, um Risikobewertungen mit hoher Genauigkeit zu erstellen.

Die Gültigkeitsstartzeit für eine bestimmte Zeile gibt den frühesten Zeitpunkt an, zu dem die Daten in dieser Zeile der Bank bekannt und korrekt waren.

Weitere Informationen finden Sie unter Änderungen an Daten im Zeitverlauf.