Compreenda o âmbito e a duração dos dados

A IA de AML está configurada para avaliar o risco de branqueamento de capitais para uma linha de negócio de cada vez com conjuntos de dados, versões do motor e modelos separados para serviços bancários de retalho e para serviços bancários comerciais.

Quando cria um conjunto de dados para utilização com uma LoB, tem de incluir várias tabelas. Cada tabela deve abranger um intervalo de tempo suficiente. Esta página oferece uma vista geral das tabelas de que precisa e mostra como determinar o intervalo de tempo que cada uma deve abranger.

Tabelas a usar

O conjunto de dados do BigQuery usado com a IA de AML deve conter as seguintes tabelas:

  • Parte: todas as partes relevantes para essa LoB.
    • Linha de negócio de retalho: todos os clientes de serviços bancários de retalho que tiveram contas em qualquer momento no intervalo de tempo necessário.
    • Linha de negócio comercial: todos os clientes de serviços bancários comerciais (entidades legais e individuais) que tiveram contas em qualquer momento no intervalo de tempo necessário
    • Tenha em atenção que alguns clientes podem estar representados em ambos os conjuntos de dados. Por exemplo, as pessoas independentes podem ter contas de retalho e comerciais.
  • AccountPartyLink: histórico completo das contas detidas por cada parte. Isto deve abranger todas as contas de produtos e serviços quando qualquer parte na tabela de partes foi o titular da conta principal em qualquer momento no intervalo de tempo necessário.
  • Transação: todas as transações de contas na tabela AccountPartyLink para o intervalo de tempo necessário.
  • RiskCaseEvent: todos os eventos de registo de risco (consulte os valores do tipo de evento) para qualquer registo de risco e parte na tabela Party com um AML_PROCESS_START (início da investigação) no intervalo de tempo necessário. Esta tabela pode incluir eventos com uma data/hora do evento anterior ou posterior ao intervalo de tempo necessário.
  • PartySupplementaryData: (se usado) para 0 a 100 valores de party_supplementary_data_id únicos, inclua um histórico completo dos valores destes campos para todas as partes na tabela Party para o intervalo de tempo necessário.

Usar dados adicionais

Consulte Dados suplementares se tiver dados adicionais sobre partes (não abrangidos de outra forma no esquema) relevantes para identificar o risco de branqueamento de capitais.

Intervalo de tempo do conjunto de dados

O intervalo de tempo que qualquer tabela num conjunto de dados deve abranger pode ser calculado da seguinte forma para qualquer operação específica. Tem de saber:

  • A hora de fim. Esta é a hora mais recente a partir da qual as etiquetas são usadas e a partir da qual os dados são usados para gerar funcionalidades de otimização.
  • A versão do motor (consulte a lista de versões do motor) que vai usar.
  • A operação que vai realizar: ajustar, preparar, prever ou testar retroativamente.
  • Para operações de previsão ou teste retrospetivo, o número de períodos para os quais vai realizar a operação, a especificar na chamada da API.

Compreenda a duração do âmbito dos dados

Primeiro, deve calcular o número de períodos que a operação vai usar. Este é o número de meses consecutivos que terminam no último mês civil completo antes da hora de fim especificada, para os quais a IA de AML vai avaliar as caraterísticas do modelo.

  • Para operações de previsão e teste retrospetivo, este é o número de períodos de previsão ou períodos de teste retrospetivo especificados na chamada da API.
  • Para outras operações, isto depende da versão do motor e da operação. Por exemplo, as versões do motor v004.010 usam 18 períodos para a otimização e 15 para a preparação.

Em seguida, deve determinar o período de análise para cada tabela. Este é o número máximo de meses de dados necessários dessa tabela para que a IA da AML calcule as caraterísticas do modelo para um determinado período.

  • Por exemplo, para as versões do motor v004.010, são 13 meses para as tabelas Transaction e AccountPartyLink, 12 meses para a tabela RiskCaseEvent e 0 meses para as tabelas Party e PartySupplementaryData.

O conjunto de dados tem de abranger o período de análise de todos os períodos usados pela operação escolhida. Isto pode variar consoante a versão do motor, mas é normalmente 18 para o ajuste, 15 para a preparação e configurável para a previsão ou o teste retrospetivo. Pode calcular o número de meses de calendário completos de dados anteriores à hora de fim de que precisa para uma determinada operação com a seguinte fórmula:

  • number of periods + lookback window -1

Com base no exemplo acima para as versões do motor v004.010, precisa de até 30 meses de dados para qualquer operação de IA de AML.

  • 18 + 13 - 1 = 30 meses de dados das tabelas Transaction e AccountPartyLink,
  • 18 + 12 – 1 = 29 meses de dados da tabela de eventos de registos de risco, bem como quaisquer eventos mais recentes para registos de risco na tabela,
  • E 18 + 0 - 1 = 17 meses de dados das tabelas Party e PartySupplementaryData.

Recomendamos que tenha um único conjunto de dados que abranja, pelo menos, 36 meses quando realizar um primeiro teste de amostra da IA de AML. Isto destina-se a permitir todas as operações acima e alguns meses adicionais para avaliar o modelo além do mínimo de 3 para testes retroativos.