Memahami cakupan dan durasi data

AML AI disiapkan untuk menilai risiko pencucian uang untuk satu lini bisnis dalam satu waktu dengan set data, versi mesin, dan model terpisah untuk perbankan retail dan perbankan komersial.

Saat membuat set data untuk digunakan dengan LoB, Anda harus menyertakan beberapa tabel. Setiap tabel harus mencakup rentang waktu yang memadai. Halaman ini memberikan ringkasan tabel yang akan Anda butuhkan dan menunjukkan cara menentukan rentang waktu yang harus dicakup oleh setiap tabel.

Tabel yang akan digunakan

Set data BigQuery yang digunakan dengan AML AI harus berisi tabel berikut:

  • Pihak: Semua pihak yang relevan dengan LoB tersebut.
    • LoB Retail: Semua nasabah perbankan retail yang telah memiliki akun pada waktu tertentu dalam rentang waktu yang diperlukan.
    • LoB Komersial: Semua pelanggan perbankan komersial (entitas hukum dan perorangan) yang pernah memiliki akun dalam rentang waktu yang diperlukan
    • Perhatikan bahwa beberapa pelanggan dapat diwakili dalam kedua set data. Misalnya, wiraswastawan mungkin memiliki akun retail dan komersial.
  • AccountPartyLink: Histori lengkap akun mana yang dimiliki oleh pihak mana. Hal ini harus mencakup semua akun untuk produk dan layanan jika pihak mana pun dalam tabel Pihak adalah pemegang akun utama pada titik mana pun dalam rentang waktu yang diperlukan.
  • Transaksi: Semua transaksi untuk akun dalam tabel AccountPartyLink untuk rentang waktu yang diperlukan.
  • RiskCaseEvent: Semua peristiwa kasus risiko (lihat nilai jenis peristiwa) untuk kasus risiko dan pihak mana pun dalam tabel Pihak dengan AML_PROCESS_START (mulai penyelidikan) dalam rentang waktu yang diperlukan. Tabel ini dapat mencakup peristiwa yang memiliki waktu peristiwa lebih awal atau lebih lambat daripada rentang waktu yang diperlukan.
  • PartySupplementaryData: (Jika digunakan) Untuk 0 hingga 100 nilai party_supplementary_data_id unik, sertakan histori lengkap nilai kolom ini untuk semua pihak dalam tabel Party selama rentang waktu yang diperlukan.

Menggunakan data tambahan

Lihat Data tambahan jika Anda memiliki data tambahan tentang pihak-pihak (yang tidak tercakup dalam skema) yang relevan untuk mengidentifikasi risiko pencucian uang.

Rentang waktu set data

Rentang waktu yang harus dicakup oleh tabel apa pun dalam set data dapat dihitung sebagai berikut untuk setiap operasi tertentu. Anda perlu mengetahui:

  • Waktu berakhir. Ini adalah waktu terbaru saat label digunakan dan saat data digunakan untuk menghasilkan fitur untuk penyesuaian.
  • Versi Engine (Lihat daftar versi engine) yang akan Anda gunakan.
  • Operasi yang akan Anda lakukan: sesuaikan, latih, prediksi, atau uji ulang.
  • Untuk operasi prediksi atau pengujian ulang, jumlah periode yang akan Anda lakukan untuk operasi tersebut, yang akan ditentukan dalam panggilan API.

Memahami Durasi Cakupan Data

Pertama, Anda harus menghitung jumlah periode yang akan digunakan operasi. Ini adalah jumlah bulan berturut-turut yang berakhir pada bulan kalender penuh terakhir sebelum waktu berakhir yang ditentukan, yang akan digunakan AML AI untuk mengevaluasi fitur model.

  • Untuk operasi prediksi dan pengujian ulang, ini adalah jumlah periode prediksi atau periode pengujian ulang yang ditentukan dalam panggilan API.
  • Untuk operasi lainnya, hal ini bergantung pada Versi Engine dan operasi. Misalnya, Versi Mesin v004.010 menggunakan 18 periode untuk penyesuaian dan 15 periode untuk pelatihan.

Selanjutnya, Anda harus menentukan periode lihat kembali untuk setiap tabel. Ini adalah jumlah maksimum bulan data yang diperlukan dari tabel tersebut agar AI AML dapat menghitung fitur model untuk jangka waktu tertentu.

  • Misalnya, untuk Versi Engine v004.010, periode ini adalah 13 bulan untuk tabel Transaction dan AccountPartyLink, 12 bulan untuk tabel RiskCaseEvent, dan 0 bulan untuk tabel Party dan PartySupplementaryData.

Kumpulan data harus mencakup periode lihat balik untuk semua periode yang digunakan oleh operasi yang dipilih. Hal ini dapat bervariasi menurut versi mesin, tetapi biasanya 18 untuk penyesuaian, 15 untuk pelatihan, dan dapat dikonfigurasi untuk prediksi atau pengujian ulang. Anda dapat menghitung jumlah bulan kalender penuh data sebelum waktu berakhir yang akan Anda perlukan untuk operasi tertentu dengan formula berikut:

  • jumlah periode + periode lihat balik -1

Berdasarkan contoh di atas untuk Versi Mesin v004.010, Anda akan memerlukan data hingga 30 bulan untuk operasi AI AML apa pun.

  • 18 + 13 - 1 = 30 bulan data dari tabel Transaction dan AccountPartyLink
  • 18 + 12 - 1 = 29 bulan data dari tabel Peristiwa Kasus Risiko serta peristiwa yang lebih baru untuk kasus risiko dalam tabel,
  • Dan 18 + 0 - 1 = 17 bulan data dari tabel Party dan PartySupplementaryData.

Sebaiknya miliki satu set data yang mencakup setidaknya 36 bulan saat melakukan pengujian sampel pertama AI AML. Hal ini untuk memungkinkan semua operasi di atas dan beberapa bulan tambahan untuk mengevaluasi model di luar 3 bulan minimum untuk pengujian ulang.