La IA de AML está configurada para evaluar el riesgo de lavado de dinero para una línea de negocios a la vez con conjuntos de datos, versiones de motor y modelos separados para la banca minorista y la banca comercial.
Cuando crees un conjunto de datos para usarlo con una LOB, deberás incluir varias tablas. Cada tabla debe abarcar un período suficiente. En esta página, se proporciona una descripción general de las tablas que necesitarás y se muestra cómo determinar el período que debe abarcar cada una.
Tablas para usar
El conjunto de datos de BigQuery que se usa con la IA de AML debe contener las siguientes tablas:
- Parte: Todas las partes pertinentes para esa LOB.
- Línea de negocio de venta minorista: Son todos los clientes de banca minorista que tuvieron cuentas en algún momento del período requerido.
- Línea de productos comerciales: Todos los clientes de banca comercial (entidades legales y físicas) que hayan tenido cuentas en cualquier momento del período requerido
- Ten en cuenta que algunos clientes pueden estar representados en ambos conjuntos de datos. Por ejemplo, las personas que trabajan por cuenta propia pueden tener cuentas comerciales y minoristas.
- AccountPartyLink: Historial completo de las cuentas que pertenecieron a cada parte. Esto debería abarcar todas las cuentas de productos y servicios cuando cualquier parte de la tabla de partes fue el titular principal de la cuenta en cualquier momento del período requerido.
- Transacción: Todas las transacciones de las cuentas en la tabla AccountPartyLink para el período requerido.
- RiskCaseEvent: Todos los eventos de casos de riesgo (consulta los valores de tipo de evento) para cualquier caso de riesgo y tercero en la tabla Party con un AML_PROCESS_START (inicio de la investigación) en el período requerido. Esta tabla puede incluir eventos que tienen una hora de evento anterior o posterior al intervalo de tiempo requerido.
- PartySupplementaryData: (Si se usa) Para entre 0 y 100 valores únicos de party_supplementary_data_id, incluye un historial completo de los valores de estos campos para todas las partes en la tabla Party durante el período requerido.
Uso de datos adicionales
Consulta Datos complementarios si tienes datos adicionales sobre las partes (que no se incluyen en el esquema) que sean relevantes para identificar el riesgo de lavado de dinero.
Período del conjunto de datos
El período que debe abarcar cualquier tabla de un conjunto de datos se puede calcular de la siguiente manera para cualquier operación determinada. Deberás saber lo siguiente:
- Es la hora de finalización. Esta es la fecha y hora más recientes a partir de las cuales se usan las etiquetas y los datos para generar atributos para el ajuste.
- Es la versión del motor (consulta la lista de versiones del motor) que usarás.
- Operación que realizarás: ajuste, entrenamiento, predicción o prueba retrospectiva.
- Para las operaciones de predicción o de prueba retrospectiva, es la cantidad de períodos para los que realizarás la operación, que se debe especificar en la llamada a la API.
Primero, debes calcular la cantidad de períodos que usará la operación. Es la cantidad de meses consecutivos que finalizan en el último mes calendario completo anterior a la fecha y hora de finalización especificadas, para los que la IA de AML evaluará las características del modelo.
- Para las operaciones de predicción y de prueba retrospectiva, esta es la cantidad de períodos de predicción o de prueba retrospectiva especificados en la llamada a la API.
- Para otras operaciones, esto depende de la versión del motor y de la operación. Por ejemplo, las versiones del motor v004.010 usan 18 períodos para el ajuste y 15 para el entrenamiento.
A continuación, debes calcular el período de observación de cada tabla. Es la cantidad máxima de meses de datos que se necesitan de esa tabla para que la IA de AML calcule las características del modelo para un período determinado.
- Por ejemplo, para las versiones del motor v004.010, son 13 meses para las tablas Transaction y AccountPartyLink, 12 meses para la tabla RiskCaseEvent y 0 meses para las tablas Party y PartySupplementaryData.
El conjunto de datos deberá abarcar el período de observación de todos los períodos que utilice la operación elegida. Esto puede variar según la versión del motor, pero suele ser de 18 para el ajuste, 15 para el entrenamiento y configurable para la predicción o la prueba retrospectiva. Puedes calcular la cantidad de meses calendario completos de datos anteriores a la hora de finalización que necesitarás para una operación determinada con la siguiente fórmula:
- cantidad de períodos + ventana de visualización - 1
Basándonos en el ejemplo anterior de las versiones del motor v004.010, necesitarás hasta 30 meses de datos para cualquier operación de IA de AML.
- 18 + 13 - 1 = 30 meses de datos de las tablas Transaction y AccountPartyLink
- 18 + 12 - 1 = 29 meses de datos de la tabla Risk Case Events, así como cualquier evento más reciente para los casos de riesgo en la tabla
- Y 18 + 0 - 1 = 17 meses de datos de las tablas Party y PartySupplementaryData.
Recomendamos tener un solo conjunto de datos que abarque al menos 36 meses cuando se realice una primera prueba de muestra de la IA de AML. Esto permite realizar todas las operaciones anteriores y tener algunos meses adicionales para evaluar el modelo más allá de los 3 meses mínimos para la prueba retrospectiva.