Glossário da AML AI

Este glossário define termos específicos da IA de AML. Para termos gerais de machine learning, consulte o Glossário de machine learning.

A

ADC

Cada uma das bibliotecas de cliente da API oferece uma maneira de usar credenciais padrão do aplicativo (ADC) locais.

Para saber mais sobre a diferença entre as credenciais locais do ADC e as da CLI gcloud, consulte Credenciais da CLI gcloud e credenciais do ADC.

B

Backtesting
O backtesting usa dados históricos para avaliar a performance (recall observado) de um modelo comparando a pontuação de risco gerada com os resultados reais de investigações históricas.
resultados do backtest
Um recurso BacktestResult de IA de AML (também conhecido como "resultados de backtest") é criado para testar a performance de um modelo em um conjunto de dados.
Para mais informações, consulte Avaliar um modelo.

C

dados bancários principais
Os dados bancários principais incluem dados sobre partes, transações e participações em contas. Isso ajuda a IA de AML a entender seus clientes e a atividade bancária deles para detectar características e comportamentos de risco.

D

validação de dados
A IA de AML realiza verificações de validação de dados ao criar um conjunto de dados, uma configuração de mecanismo, um modelo, resultados de backtest ou resultados de previsão. Se o conjunto de dados especificado não passar na validação, o recurso não será criado e erros de validação de dados serão gerados, indicando a natureza do problema.
Para mais informações, consulte Erros de validação de dados.
dataset

Um recurso de conjunto de dados de IA de AML (ou apenas "conjunto de dados") é usado para especificar dados, de acordo com o modelo de dados de entrada de AML, que pode ser usado para gerar um modelo, avaliar o desempenho de um modelo e gerar pontuações de risco e capacidade de explicação por parte.

Para mais informações, consulte Entender o modelo de dados e os requisitos de AML.

E

horário de término

As operações de IA de AML (como treinamento de modelo, exemplos de avaliação e saídas de modelos) usam conjuntos de dados compostos por exemplos dos dados do banco coletados ao longo de meses. Essas operações exigem que você especifique um horário de término, que é uma data dentro do período do conjunto de dados. Com base nesse horário de término, a operação vai usar o último mês civil completo antes do horário de término como o mês final de dados usados na operação.

O horário de término e todos os meses usados em uma operação precisam estar dentro do período do conjunto de dados associado.

Por exemplo, uma operação de treinamento de modelo usa 15 períodos com uma janela de retorno máxima de 13 meses. O período do conjunto de dados é de 15 de outubro de 2020 a 21 de maio de 2023. O horário de término do treinamento é 12 de abril de 2023. O treinamento usa exemplos de 1º de janeiro de 2021 a 31 de março de 2023, que são 27 meses civis completos antes do horário de término. Esse período está dentro do intervalo de datas do conjunto de dados.

configuração do mecanismo

Um recurso EngineConfig de IA de AML (também conhecido como "configuração do mecanismo") especifica parâmetros na geração e avaliação de um modelo de IA de AML e na geração de pontuações de risco e capacidade de explicação.

Alguns desses parâmetros são especificados na chamada de API para criar uma configuração de mecanismo, como a versão do mecanismo e o volume de investigação esperado. Outros parâmetros são gerados automaticamente pela IA do AML usando um conjunto de dados especificado, por exemplo, hiperparâmetros ajustados.

Para mais informações, consulte Configurar um mecanismo.

versão do mecanismo

Um recurso EngineVersion da AML AI (também conhecido como "versão do mecanismo") define aspectos de como a AML AI detecta riscos, que abrangem ajuste, treinamento e avaliação de modelos, bem como o modelo de dados geral da AML e as famílias de recursos.

Configurar um mecanismo de IA de AML exige que você especifique uma versão do mecanismo a ser usada. A versão do mecanismo é usada para treinar e avaliar modelos com essa configuração, além de gerar pontuações de risco e capacidade de explicação.

A nomenclatura da versão do mecanismo é estruturada da seguinte forma: o tipo de mecanismo expressa a linha de negócios compatível, e o subtipo, o ajuste, a versão principal e a versão secundária do mecanismo são atualizados à medida que novos comportamentos são implementados.

Exemplos de versões:

  • aml-retail.default.v004.008.202411-001
  • aml-commercial.default.v004.008.202411-001
Controle de versões do mecanismo

Para mais informações sobre como gerenciar versões do mecanismo, consulte Gerenciar versões do mecanismo.

avaliação

Consulte também backtesting.

explicabilidade

Os modelos de IA antilavagem de dinheiro são usados para identificar partes que apresentam comportamentos ou características com alto risco de lavagem de dinheiro. A capacidade de explicação indica quais comportamentos ou características contribuíram mais para uma pontuação de alto risco de uma determinada parte.

Para mais informações, consulte Entender as saídas de previsão.

Consulte também previsão.

exportar metadados

Vários recursos de IA de AML armazenam informações adicionais relacionadas à performance e à qualidade dos dados, que podem ser acessadas usando a operação de metadados de exportação.

Para mais informações, consulte Modelo de dados de saída da AML.

F

família de recursos
As famílias de recursos são coleções de recursos de ML relacionados, fornecendo uma categorização simples e compreensível para humanos que informa investigadores e equipes de auditoria interna.

I

entidade imutável

A IA de AML precisa recriar visualizações dos dados em diferentes pontos no tempo para ajuste, treinamento e backtesting. Para isso, a IA de AML diferencia entre entidades mutáveis (que podem mudar de valor com o tempo) e imutáveis (que não mudam).

Por exemplo, uma entidade mutável pode ser o saldo da sua conta corrente, que pode mudar com o tempo. Já uma entidade imutável pode ser um evento, como sacar R $50 em 2 de julho de 2024 às 12:00:00 da sua conta corrente, que não muda porque foi um snapshot no tempo.

No modelo de dados de entrada para AML, as tabelas que representam entidades imutáveis não têm os campos validity_start_time e is_entity_deleted. Isso inclui a tabela RiskCaseEvent.

Para mais informações, consulte Entenda como os dados mudam com o tempo.

Consulte também entidade mutável.

instance

Um recurso de instância de IA antilavagem de dinheiro (também conhecido como "instância") fica na raiz de todos os outros recursos de IA antilavagem de dinheiro e precisa ser criado antes que você possa trabalhar com outros recursos de IA antilavagem de dinheiro. É possível criar várias instâncias na mesma região em um projeto.

Para mais informações, consulte Criar uma instância da IA de AML.

processo de investigação

Um processo de investigação abrange toda a investigação ou sequência de investigações acionadas por um alerta. O processo começa quando a primeira parte de uma investigação é iniciada e termina quando não são esperados mais resultados dela.

Para mais informações, consulte Ciclo de vida de um caso de risco.

L

LOB
A linha de negócios (LOB) distingue os clientes de bancos de varejo e comerciais na IA de AML. Os conjuntos de dados, as versões do mecanismo e o registro de terceiros estão vinculados a uma linha de negócios, varejo ou comercial específica.
janela de lookback

Para cada período usado por uma operação de ajuste, treinamento, previsão ou backtest, a AML AI exige que os conjuntos de dados cubram uma janela de lookback para permitir a geração de recursos que rastreiam o comportamento ao longo do tempo. Esse período depende da versão do mecanismo.

Para mais informações, consulte Entender o escopo e a duração dos dados.

LRO

Várias operações de IA de AML, incluindo configuração do mecanismo, treinamento, backtesting e previsão, iniciam uma operação de longa duração (LRO).

Para mais informações, consulte Gerenciar operações de longa duração.

M

missingness

A métrica de ausência é calculada para todas as famílias de recursos ao criar os seguintes recursos de IA de AML: configuração do mecanismo, modelo, resultados de backtest e resultados de previsão.

Essa métrica mostra a proporção de valores ausentes em todos os recursos de uma família de recursos. Uma mudança significativa na falta de dados de qualquer família de recursos entre ajuste, treinamento, avaliação e previsão pode indicar inconsistência nos conjuntos de dados usados.

model

Um recurso de modelo de IA de AML (também conhecido como "modelo") representa um modelo treinado que pode ser usado para gerar pontuações de risco e capacidade de explicação.

entidade mutável

A IA de AML precisa recriar visualizações dos dados em diferentes pontos no tempo para ajuste, treinamento e backtesting. Para isso, a IA de AML diferencia entre entidades mutáveis (que podem mudar de valor com o tempo) e imutáveis (que não mudam).

Por exemplo, uma entidade mutável pode ser o saldo da sua conta corrente, que pode mudar com o tempo. Já uma entidade imutável pode ser um evento, como sacar R $50 em 2 de julho de 2024 às 12:00:00 da sua conta corrente, que não muda porque foi um snapshot no tempo.

No modelo de dados de entrada para AML, as tabelas que representam entidades mutáveis têm os campos validity_start_time e is_entity_deleted. Isso inclui as tabelas Party, AccountPartyLink, Transaction e PartySupplementaryData.

Para mais informações, consulte Entenda como os dados mudam com o tempo.

Consulte também entidade imutável.

O

observed-recall

A IA de AML mede a performance do modelo em dados históricos usando a métrica de recall observado.

Essa métrica mostra a proporção de partes rotuladas como positivas (por exemplo, saídas de clientes) de um período selecionado que teriam sido identificadas como de alto risco durante um período de atividade suspeita pelo modelo em avaliação.

P

party

No modelo de dados de entrada para AML, uma parte representa um cliente do banco. Uma parte pode ser uma pessoa física ou jurídica.

Para mais informações, consulte a tabela Party.

Consulte também parte registrada.

previsão

Prediction usa um modelo para gerar pontuações de risco e explicabilidade, que podem ser usadas no seu processo de investigação de AML.

resultados da previsão

Um recurso PredictionResult de IA de AML (também conhecido como "resultados de previsão") é o resultado do uso de um modelo para criar previsões.

Para mais detalhes sobre como gerar pontuações de risco e capacidade de explicação, além de como usar esses recursos no processo de investigação, consulte as páginas na seção Gerar pontuações de risco e capacidade de explicação.

R

parte registrada
Antes que uma parte possa ser usada para criar resultados de previsão (por exemplo, pontuações de risco e capacidade de explicação no nível da parte), ela precisa ser registrada na linha de negócios correspondente.
caso de risco

Um caso de risco abrange um processo de investigação ou um grupo de processos relacionados para diferentes partes.

Consulte a tabela RiskCaseEvent.

dados de investigação de risco

Os dados de investigação de risco são usados pela IA de AML para entender seu processo e resultados de investigação de risco e gerar rótulos de treinamento.

pontuação de risco

Os modelos de IA antilavagem de dinheiro são usados para identificar partes que apresentam comportamentos ou características com alto risco de lavagem de dinheiro. Isso é feito com uma pontuação de risco.

As pontuações de risco variam de 0 a 1. Uma pontuação mais alta indica maior risco. No entanto, as pontuações de risco não devem ser interpretadas diretamente como uma probabilidade de atividade de lavagem de dinheiro.

Para mais informações, consulte Entender as saídas de previsão.

tipologia de risco

A IA antilavagem de dinheiro pode identificar o risco de lavagem de dinheiro em cinco tipologias principais de risco de AML relacionadas ao monitoramento de transações.

Com investigação suficiente e dados complementares de terceiros (consulte as tabelas de Dados complementares), a IA antilavagem de dinheiro pode abranger mais tipologias.

S

dados complementares

Os dados complementares são informações adicionais, além do que está contido nas áreas de dados bancários principais e dados de investigação de risco do esquema da IA antilavagem de dinheiro, que são relevantes para prever o risco de lavagem de dinheiro.

Por exemplo, você pode identificar e adicionar um indicador de risco que ajude os modelos a prever melhor uma tipologia de risco que não seja bem coberta.

É possível adicionar dados complementares a um conjunto de dados usando a tabela PartySupplementaryData.

período de atividade suspeita

Um período de atividade suspeita é um período em que você acredita que uma parte investigada exibiu comportamento suspeito. Isso é usado na avaliação do modelo (por exemplo, a métrica de recall para resultados de backtest) para confirmar que os clientes de alto risco são identificados durante os meses em que tiveram atividades suspeitas. O período de atividade suspeita ajuda os modelos a identificar o risco no momento certo, por exemplo, durante ou logo após o período em que a atividade suspeita ocorreu. O período de atividade suspeita é usado na validação para ajuste e treinamento, além da métrica de recall no backtesting.

Para mais informações, consulte Ciclo de vida de um caso de risco.

T

treinamento
A IA antilavagem de dinheiro faz o treinamento como parte da criação de um modelo usando hiperparâmetros (consulte ajuste) de uma configuração de mecanismo especificada.
ajuste
O ajuste é a otimização dos hiperparâmetros do modelo. A IA de AML faz o ajuste como parte da criação de uma configuração de mecanismo.

V

validity start time

O horário de início da validade de uma entidade mutável é usado pela IA de AML para construir uma visão do que o banco sabia em um determinado momento. Isso permite que a IA de AML treine com precisão modelos que podem ser reutilizados nos dados mais recentes (ou seja, o que o banco sabe) para produzir pontuações de risco de alta fidelidade.

O horário de início da validade de uma determinada linha representa o momento mais antigo em que os dados dessa linha eram conhecidos e estavam corretos para o banco.

Para mais informações, consulte Entenda como os dados mudam com o tempo.