Información sobre el alcance y la duración de los datos

AML AI se configura para evaluar el riesgo de blanqueo de capitales de una línea de negocio a la vez con conjuntos de datos, versiones de motor y modelos independientes para la banca minorista y la banca comercial.

Cuando crees un conjunto de datos para usarlo con una línea de negocio, tendrás que incluir varias tablas. Cada tabla debe abarcar un periodo suficiente. En esta página se ofrece una descripción general de las tablas que necesitará y se muestra cómo determinar el intervalo de tiempo que debe cubrir cada una.

Tablas que se deben usar

El conjunto de datos de BigQuery que se usa con la IA de AML debe contener las siguientes tablas:

  • Parte: todas las partes relevantes para esa línea de negocio.
    • Línea de negocio de banca minorista: todos los clientes de banca minorista que hayan tenido cuentas en cualquier momento del periodo obligatorio.
    • Línea de negocio comercial: todos los clientes de banca comercial (personas físicas y jurídicas) que hayan tenido cuentas en cualquier momento del periodo requerido.
    • Ten en cuenta que algunos clientes pueden estar representados en ambos conjuntos de datos. Por ejemplo, los autónomos pueden tener cuentas tanto minoristas como comerciales.
  • AccountPartyLink historial completo de las cuentas que han tenido cada una de las partes. Debe incluir todas las cuentas de productos y servicios cuando cualquier parte de la tabla Party haya sido el titular principal de la cuenta en cualquier momento del periodo requerido.
  • Transacción: todas las transacciones de las cuentas de la tabla AccountPartyLink del periodo requerido.
  • RiskCaseEvent: todos los eventos de caso de riesgo (consulte los valores de tipo de evento) de cualquier caso de riesgo y tercero de la tabla Party con un valor AML_PROCESS_START (inicio de la investigación) en el periodo obligatorio. Esta tabla puede incluir eventos que tengan una hora anterior o posterior al intervalo de tiempo requerido.
  • PartySupplementaryData: (si se usa) para entre 0 y 100 valores únicos de party_supplementary_data_id, incluya un historial completo de los valores de estos campos de todas las partes de la tabla Party durante el periodo requerido.

Usar datos adicionales

Consulte Datos complementarios si tiene datos adicionales sobre las partes (que no se incluyen en el esquema) que sean relevantes para identificar el riesgo de blanqueo de capitales.

Intervalo de tiempo del conjunto de datos

El periodo que debe abarcar cualquier tabla de un conjunto de datos se puede calcular de la siguiente manera para cualquier operación. Debes saber lo siguiente:

  • La hora de finalización. Esta es la última hora a partir de la cual se usan las etiquetas y los datos para generar funciones de ajuste.
  • La versión del motor que vas a usar (consulta la lista de versiones del motor).
  • La operación que vas a realizar: ajuste, entrenamiento, predicción o prueba retrospectiva.
  • En el caso de las operaciones de predicción o de prueba retrospectiva, el número de periodos durante los que se llevará a cabo la operación, que se debe especificar en la llamada a la API.

Acerca de la duración del periodo de los datos

Primero, debes calcular el número de periodos que se utilizarán en la operación. Es el número de meses consecutivos que terminan en el último mes natural completo anterior a la hora de finalización especificada, durante los cuales la IA de AML evaluará las características del modelo.

  • En el caso de las operaciones de predicción y de prueba retrospectiva, se trata del número de periodos de predicción o de prueba retrospectiva especificados en la llamada a la API.
  • En el resto de las operaciones, depende de la versión del motor y de la operación en cuestión. Por ejemplo, las versiones de motor v004.010 usan 18 periodos para la optimización y 15 para el entrenamiento.

A continuación, debes calcular la ventana retrospectiva de cada tabla. Es el número máximo de meses de datos que necesita de esa tabla la IA de AML para calcular las características del modelo de un periodo determinado.

  • Por ejemplo, en el caso de las versiones de motor v004.010, el periodo es de 13 meses para las tablas Transaction y AccountPartyLink, de 12 meses para la tabla RiskCaseEvent y de 0 meses para las tablas Party y PartySupplementaryData.

El conjunto de datos deberá cubrir la ventana retrospectiva de todos los periodos utilizados por la operación elegida. Puede variar según la versión del motor, pero suele ser 18 para la optimización, 15 para el entrenamiento y configurable para la predicción o las pruebas retrospectivas. Puede calcular el número de meses naturales completos de datos anteriores a la hora de finalización que necesitará para una operación determinada con la siguiente fórmula:

  • número de periodos + ventana retrospectiva - 1

Siguiendo el ejemplo anterior de las versiones de motor v004.010, necesitarás hasta 30 meses de datos para cualquier operación de IA de AML.

  • 18 + 13 - 1 = 30 meses de datos de las tablas Transaction y AccountPartyLink.
  • 18 + 12 - 1 = 29 meses de datos de la tabla Risk Case Events, así como los eventos más recientes de casos de riesgo de la tabla.
  • Y 18 + 0 - 1 = 17 meses de datos de las tablas Party y PartySupplementaryData.

Recomendamos tener un único conjunto de datos que abarque al menos 36 meses al realizar una primera prueba de la IA de lucha contra el blanqueo de capitales. De este modo, se podrán llevar a cabo todas las operaciones anteriores y se dispondrá de algunos meses adicionales para evaluar el modelo más allá de los 3 meses mínimos para las pruebas retrospectivas.