Ce glossaire définit les termes spécifiques à l'IA pour la lutte contre le blanchiment d'argent. Pour les termes généraux du machine learning, consultez le Glossaire du machine learning.
A
- ADC
Chacune des bibliothèques clientes de l'API permet d'utiliser les identifiants par défaut de l'application (ADC) locaux.
Pour en savoir plus sur la différence entre vos identifiants ADC locaux et vos identifiants gcloud CLI, consultez Identifiants gcloud CLI et identifiants ADC.
B
- Backtesting
- Le backtesting utilise des données historiques pour évaluer les performances (rappel observé) d'un modèle en comparant le score de risque qu'il génère aux résultats réels des enquêtes historiques.
- résultats du backtest
- Une ressource BacktestResult d'AML AI (également appelée "résultats de backtest") est créée pour tester les performances d'un modèle sur un ensemble de données.
- Pour en savoir plus, consultez Évaluer un modèle.
C
- Données bancaires de base Les données bancaires de base incluent des données sur les parties, les transactions et les avoirs des comptes.
- Elle aide l'IA AML à comprendre vos clients et leur activité bancaire pour détecter les caractéristiques et les comportements à risque.
D
- Validation des données
- L'IA AML effectue des vérifications de validation des données lors de la création d'un ensemble de données, d'une configuration du moteur, d'un modèle, de résultats de backtest ou de résultats de prédiction. Si l'ensemble de données spécifié ne réussit pas la validation des données, la ressource n'est pas créée et des erreurs de validation des données sont générées (indiquant la nature du problème).
- Pour en savoir plus, consultez Erreurs de validation des données.
- ensemble de données
Une ressource d'ensemble de données d'IA AML (ou simplement "ensemble de données") est utilisée pour spécifier des données conformes au modèle de données d'entrée AML, qui peuvent être utilisées pour générer un modèle, évaluer les performances d'un modèle et générer des scores de risque et une explication par partie.
Pour en savoir plus, consultez Comprendre le modèle de données et les exigences de l'AML.
E
- Heure de fin
Les opérations d'AML AI (comme l'entraînement de modèles, les exemples d'évaluation et les sorties de modèles) utilisent des ensembles de données composés d'exemples issus des données de la banque collectées sur plusieurs mois. Ces opérations nécessitent que vous spécifiiez une heure de fin, qui correspond à une date dans la période de l'ensemble de données. En fonction de cette heure de fin, l'opération utilisera le dernier mois calendaire complet avant l'heure de fin comme dernier mois de données utilisé dans l'opération.
L'heure de fin et tous les mois utilisés pour une opération doivent se trouver dans la plage de dates de l'ensemble de données associé.
Par exemple, une opération d'entraînement de modèle utilise 15 périodes avec une période d'analyse maximale de 13 mois. L'ensemble de données couvre la période allant du 15 octobre 2020 au 21 mai 2023. La date de fin de la formation est le 12 avril 2023. L'entraînement utilise des exemples du 1er janvier 2021 au 31 mars 2023, soit 27 mois calendaires complets avant l'heure de fin. Cette période est comprise dans la plage de dates du jeu de données.
- Configuration du moteur
Une ressource EngineConfig d'AML AI (également appelée "configuration du moteur") spécifie les paramètres de génération et d'évaluation d'un modèle AML AI, ainsi que de génération de scores de risque et d'explicabilité.
Certains de ces paramètres sont spécifiés dans l'appel d'API permettant de créer une configuration de moteur, comme la version du moteur et le volume d'investigation attendu. D'autres paramètres sont générés automatiquement par AML AI à l'aide d'un ensemble de données spécifié (par exemple, des hyperparamètres ajustés).
Pour en savoir plus, consultez Configurer un moteur.
- version du moteur
Une ressource EngineVersion AML AI (également appelée "version du moteur") définit les aspects de la façon dont AML AI détecte les risques, ce qui englobe l'ajustement, l'entraînement et l'évaluation des modèles, ainsi que le modèle de données AML global et les familles de caractéristiques.
Pour configurer un moteur d'IA AML, vous devez spécifier une version de moteur à utiliser. La version du moteur est ensuite utilisée pour entraîner et évaluer les modèles avec cette configuration de moteur, et pour générer des scores de risque et de l'explicabilité.
La dénomination des versions du moteur est structurée comme suit : le type de moteur indique la gamme d'activités compatible, tandis que le sous-type de moteur, le réglage, la version majeure et la version mineure sont mis à jour à mesure que de nouveaux comportements sont implémentés.
Voici quelques exemples de versions :
aml-retail.default.v004.008.202411-001aml-commercial.default.v004.008.202411-001
Pour en savoir plus sur la gestion des versions du moteur, consultez Gérer les versions du moteur.
- évaluation
Voir aussi backtesting.
- explicabilité
Les modèles AML AI sont utilisés pour identifier les parties présentant des comportements ou des caractéristiques à risque élevé de blanchiment d'argent. L'explicabilité indique les comportements ou les caractéristiques qui ont le plus contribué à un score de risque élevé pour une partie donnée.
Pour en savoir plus, consultez Comprendre les résultats de prédiction.
Voir aussi prédiction.
- Exporter les métadonnées
Plusieurs ressources d'IA AML stockent des informations supplémentaires sur les performances et la qualité des données, auxquelles vous pouvez accéder à l'aide de l'opération d'exportation des métadonnées.
Pour en savoir plus, consultez Modèle de données de sortie AML.
F
- famille de fonctionnalités Les familles de caractéristiques
- sont des ensembles de caractéristiques de ML associées. Elles fournissent une catégorisation simple et compréhensible par l'homme pour informer les équipes d'enquête et d'audit interne.
I
- entité immuable
L'IA AML doit pouvoir recréer des vues des données à différents moments pour l'ajustement, l'entraînement et le backtesting. Pour ce faire, l'IA AML fait la distinction entre les entités modifiables (dont les valeurs peuvent changer au fil du temps) et les entités immuables (qui ne changent pas).
Par exemple, une entité mutable peut être le solde de votre compte courant, qui peut changer au fil du temps. En revanche, une entité immuable peut être un événement, comme le retrait de 50 € le 2 juillet 2024 à 12h00 de votre compte courant, qui ne change pas puisqu'il s'agit d'un instantané dans le temps.
Dans le modèle de données d'entrée pour la lutte contre le blanchiment d'argent, les tables représentant des entités immuables ne comportent pas les champs
validity_start_timeetis_entity_deleted. Cela inclut la table RiskCaseEvent.Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.
Voir aussi entité modifiable.
- instance
Une ressource d'instance AML AI (également appelée "instance") se trouve à la racine de toutes les autres ressources AML AI et doit être créée avant que vous puissiez travailler avec d'autres ressources AML AI. Vous pouvez créer plusieurs instances dans la même région au sein d'un projet.
Pour en savoir plus, consultez Créer une instance AML AI.
- procédure d'enquête
Une procédure d'investigation couvre l'intégralité de l'investigation ou de la séquence d'investigations déclenchées par une alerte. Le processus commence lorsque la première partie d'une investigation démarre et se termine lorsqu'aucun autre résultat n'est attendu de cette investigation.
Pour en savoir plus, consultez Cycle de vie d'une demande liée à un risque.
L
- LOB
- La gamme de produits (LOB, line of business) permet de distinguer les clients des banques commerciales et de détail dans l'IA AML. Les ensembles de données, les versions du moteur et l'enregistrement des tiers sont associés à un secteur d'activité, un commerce ou une activité commerciale spécifiques.
- période d'analyse
Pour chaque période utilisée par une opération de réglage, d'entraînement, de prédiction ou de backtest, l'IA AML exige que les ensembles de données couvrent une période d'analyse rétrospective afin de permettre la génération de caractéristiques qui suivent le comportement au fil du temps. Cette période dépend de la version du moteur.
Pour en savoir plus, consultez Comprendre le champ d'application et la durée des données.
- LRO
Plusieurs opérations d'IA AML, y compris la configuration du moteur, l'entraînement, le backtesting et la prédiction, lancent une opération de longue durée (LRO).
Pour en savoir plus, consultez Gérer les opérations de longue durée.
M
- missingness
La métrique de données manquantes est calculée pour toutes les familles de caractéristiques lors de la création des ressources d'IA AML suivantes : configuration du moteur, modèle, résultats de backtest et résultats de prédiction.
Cette métrique indique la part des valeurs manquantes pour toutes les caractéristiques d'une famille de caractéristiques. Une variation importante du nombre de valeurs manquantes pour une famille de caractéristiques entre le réglage, l'entraînement, l'évaluation et la prédiction peut indiquer une incohérence dans les ensembles de données utilisés.
- model
Une ressource de modèle d'IA AML (également appelée "modèle") représente un modèle entraîné qui peut être utilisé pour générer des scores de risque et de l'explicabilité.
- entité modifiable
L'IA AML doit pouvoir recréer des vues des données à différents moments pour l'ajustement, l'entraînement et le backtesting. Pour ce faire, l'IA AML fait la distinction entre les entités mutables (dont les valeurs peuvent changer au fil du temps) et les entités immuables (dont les valeurs ne changent pas).
Par exemple, une entité mutable peut être le solde de votre compte courant, qui peut changer au fil du temps. En revanche, une entité immuable peut être un événement, comme le retrait de 50 € le 2 juillet 2024 à 12h00 de votre compte courant, qui ne change pas puisqu'il s'agit d'un instantané dans le temps.
Dans le modèle de données d'entrée pour la lutte contre le blanchiment d'argent, les tables représentant des entités modifiables comportent les champs
validity_start_timeetis_entity_deleted. Cela inclut les tables Party, AccountPartyLink, Transaction et PartySupplementaryData.Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.
Voir aussi entité immuable.
O
- observed-recall
L'IA AML mesure les performances du modèle sur les données historiques à l'aide de la métrique "Rappel observé".
Cette métrique indique la proportion de parties positives (par exemple, les résiliations de clients) d'une période sélectionnée qui auraient été identifiées comme présentant un risque élevé pendant une période d'activité suspecte par le modèle en cours d'évaluation.
P
- fête
Dans le modèle de données d'entrée pour la lutte contre le blanchiment d'argent, une partie représente un client de la banque. Une partie peut être une personne physique ou une entité juridique.
Pour en savoir plus, consultez la table Party.
Voir aussi partie enregistrée.
- prédiction
La prédiction utilise un modèle pour générer des scores de risque et une explication qui peuvent être utilisés dans votre processus d'investigation sur la LBC.
- Résultats de prédiction
Une ressource PredictionResult d'AML AI (également appelée "résultats de prédiction") est le résultat de l'utilisation d'un modèle pour créer des prédictions.
Pour en savoir plus sur la façon de générer des scores de risque et des explications, ainsi que sur la façon de les utiliser dans votre processus d'investigation, consultez les pages de la section Générer des scores de risque et des explications.
R
- partie enregistrée
- Avant qu'une partie puisse être utilisée pour créer des résultats de prédiction (par exemple, des scores de risque et des explications au niveau de la partie), elle doit être enregistrée pour le secteur d'activité correspondant.
- cas de risque
Un cas de risque couvre un processus d'enquête ou un groupe de processus d'enquête associés pour différentes parties.
Consultez la table RiskCaseEvent.
- Données d'investigation des risques
Les données d'investigation des risques sont utilisées par l'IA de lutte contre le blanchiment d'argent pour comprendre votre processus et vos résultats d'investigation des risques, et pour générer des libellés d'entraînement.
- score de risque
Les modèles AML AI sont utilisés pour identifier les parties présentant des comportements ou des caractéristiques à risque élevé de blanchiment d'argent. Pour ce faire, un score de risque est attribué.
Les scores de risque varient de 0 à 1. Plus le score est élevé, plus le risque est élevé. Toutefois, les scores de risque ne doivent pas être interprétés directement comme une probabilité d'activité de blanchiment d'argent.
Pour en savoir plus, consultez Comprendre les résultats de prédiction.
- typologie des risques
AML AI peut identifier les risques de blanchiment d'argent dans cinq typologies de risques AML liés à la surveillance des transactions.
Grâce à des investigations suffisantes et à des données supplémentaires sur les tiers (voir les tableaux Données supplémentaires), l'IA pour l'AML peut couvrir davantage de typologies.
S
- données supplémentaires
Les données supplémentaires sont des données qui s'ajoutent à celles contenues dans les zones données bancaires de base et données d'investigation sur les risques du schéma AML AI. Elles sont utiles pour prédire le risque de blanchiment d'argent.
Par exemple, vous pouvez identifier et ajouter un indicateur de risque qui aide les modèles à mieux prédire une typologie de risque qui n'est pas bien couverte.
Vous pouvez ajouter des données supplémentaires à un ensemble de données à l'aide de la table PartySupplementaryData.
- période d'activité suspecte
Une période d'activité suspecte est une période pendant laquelle vous pensez qu'une partie faisant l'objet d'une enquête a eu un comportement suspect. Cette métrique est utilisée dans l'évaluation du modèle (par exemple, la métrique de rappel pour les résultats des backtests) afin de confirmer que les clients à haut risque sont identifiés au cours des mois où ils ont enregistré une activité suspecte. La période d'activité suspecte aide les modèles à identifier les risques au bon moment, par exemple pendant ou peu après la période où l'activité suspecte s'est produite. La période d'activité suspecte est utilisée dans la validation pour l'ajustement et l'entraînement, ainsi que pour la métrique de rappel dans le backtesting.
Pour en savoir plus, consultez Cycle de vie d'une demande liée à un risque.
T
- formation
- L'IA AML effectue l'entraînement dans le cadre de la création d'un modèle à l'aide d'hyperparamètres (voir Réglage) à partir d'une configuration de moteur spécifiée.
- tuning
- Le réglage consiste à optimiser les hyperparamètres du modèle. L'IA AML effectue un réglage lors de la création d'une configuration de moteur.
V
- validity start time (heure de début de la période de validité)
L'heure de début de validité d'une entité mutable est utilisée par AML AI pour construire une vue de ce que la banque savait à un moment donné. Cela permet à AML AI d'entraîner précisément des modèles réutilisables sur les données les plus récentes (c'est-à-dire celles connues par la banque) pour générer des scores de risque de haute qualité.
L'heure de début de validité d'une ligne donnée représente la date et l'heure les plus anciennes auxquelles les données de cette ligne étaient connues de la banque et correctes.
Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.