Dokumen dalam Google Cloud Well-Architected Framework: Perspektif layanan keuangan (FS) ini memberikan ringkasan prinsip dan rekomendasi untuk mengoptimalkan performa workload FS Anda di Google Cloud. Rekomendasi dalam dokumen ini selaras dengan pilar pengoptimalan performa Well-Architected Framework.
Pengoptimalan performa memiliki sejarah panjang dalam layanan keuangan. Pengoptimalan performa telah membantu organisasi FS mengatasi tantangan teknis dan hampir selalu menjadi pendorong atau akselerator untuk pembuatan model bisnis baru. Misalnya, ATM (diperkenalkan pada tahun 1967) mengotomatiskan proses pengeluaran uang tunai dan membantu bank mengurangi biaya bisnis inti mereka. Teknik seperti melewati kernel OS dan menyematkan thread aplikasi ke core komputasi membantu mencapai latensi rendah dan deterministik untuk aplikasi perdagangan. Pengurangan latensi memfasilitasi likuiditas yang lebih tinggi dan lebih kuat dengan spread yang lebih ketat di pasar keuangan.
Cloud menciptakan peluang baru untuk pengoptimalan performa. Cloud juga menantang beberapa pola pengoptimalan yang diterima secara historis. Secara khusus, pertukaran berikut lebih transparan dan dapat dikontrol di cloud:
- Waktu penyiapan produk versus biaya.
- Performa end-to-end di tingkat sistem versus performa di tingkat node.
- Ketersediaan talenta versus kelincahan pengambilan keputusan terkait teknologi.
Misalnya, menyesuaikan hardware dan resource IT dengan persyaratan keterampilan tertentu adalah tugas yang mudah di cloud. Untuk mendukung pemrograman GPU, Anda dapat membuat VM berbasis GPU. Anda dapat menskalakan kapasitas di cloud untuk mengakomodasi lonjakan permintaan tanpa melakukan over-provisioning resource. Kemampuan ini membantu memastikan bahwa workload Anda dapat menangani beban puncak, seperti pada hari penggajian non-pertanian dan saat volume perdagangan jauh lebih besar daripada tingkat historis. Daripada menghabiskan waktu untuk menulis kode yang sangat dioptimalkan di tingkat server individual (seperti kode yang sangat disesuaikan dalam bahasa C) atau menulis kode untuk lingkungan komputasi berperforma tinggi (HPC) konvensional, Anda dapat melakukan penskalaan secara optimal dengan menggunakan sistem terdistribusi berbasis Kubernetes yang dirancang dengan baik.
Rekomendasi pengoptimalan performa dalam dokumen ini dipetakan ke prinsip inti berikut:
- Menyelaraskan metrik performa teknologi dengan indikator bisnis utama
- Memprioritaskan keamanan tanpa mengorbankan performa untuk risiko yang belum terbukti
- Memikirkan kembali arsitektur Anda untuk beradaptasi dengan peluang dan persyaratan baru
- Menyiapkan teknologi Anda untuk masa mendatang guna memenuhi kebutuhan bisnis saat ini dan di masa mendatang
Menyelaraskan metrik performa teknologi dengan indikator bisnis utama
Anda dapat memetakan pengoptimalan performa ke hasil nilai bisnis dalam beberapa cara. Misalnya, di meja riset sisi pembelian, sasaran bisnis dapat berupa mengoptimalkan output per jam riset atau memprioritaskan eksperimen dari tim yang memiliki rekam jejak terbukti, seperti rasio Sharpe yang lebih tinggi. Di sisi penjualan, Anda dapat menggunakan analisis untuk melacak minat klien dan memprioritaskan throughput ke model AI yang mendukung riset paling menarik.
Menghubungkan sasaran performa dengan indikator performa utama (KPI) bisnis juga penting untuk mendanai peningkatan performa. Inisiatif transformasi dan inovasi bisnis (terkadang disebut upaya change-the-bank) memiliki anggaran yang berbeda dan berpotensi memiliki tingkat akses yang berbeda ke resource jika dibandingkan dengan operasi bisnis seperti biasa (BAU) atau run-the-bank. Misalnya, Google Cloud membantu tim manajemen risiko dan teknologi G-SIFI berkolaborasi dengan analis kuantitatif front-office dalam solusi untuk melakukan penghitungan analisis risiko (seperti XVA) dalam hitungan menit, bukan jam atau hari. Solusi ini membantu organisasi memenuhi persyaratan kepatuhan yang relevan. Solusi ini juga memungkinkan trader melakukan percakapan berkualitas lebih tinggi dengan klien mereka, yang berpotensi menawarkan spread yang lebih ketat, likuiditas yang lebih kuat, dan lindung nilai yang lebih hemat biaya.
Saat menyelaraskan metrik performa dengan indikator bisnis, pertimbangkan rekomendasi berikut:
- Hubungkan setiap inisiatif teknologi dengan sasaran bisnis dan hasil utama (OKR) yang relevan, seperti meningkatkan pendapatan atau keuntungan, mengurangi biaya, dan mengurangi risiko secara lebih efisien atau holistik.
- Fokus pada pengoptimalan performa di tingkat sistem. Lihat di luar pemisahan change-the-bank versus run-the-bank konvensional dan silo front-office versus back-office.
Memprioritaskan keamanan tanpa mengorbankan performa untuk risiko yang belum terbukti
Kepatuhan terhadap peraturan dan keamanan di organisasi FS harus memiliki standar yang tinggi. Mempertahankan standar yang tinggi sangat penting untuk menghindari kehilangan klien dan mencegah kerusakan yang tidak dapat diperbaiki pada merek organisasi. Sering kali, nilai tertinggi diperoleh melalui inovasi teknologi seperti AI generatif dan layanan terkelola yang unik seperti Spanner. Jangan otomatis membuang opsi teknologi tersebut karena kesalahpahaman umum tentang risiko operasional yang mahal atau postur kepatuhan terhadap peraturan yang tidak memadai.
Google Cloud telah bekerja sama dengan G-SIFI untuk memastikan bahwa pendekatan berbasis AI untuk Anti-Pencucian Uang (AML) dapat digunakan di seluruh yurisdiksi tempat lembaga melayani pelanggan. Misalnya, HSBC meningkatkan performa unit kejahatan keuangan (Fincrime) secara signifikan dengan hasil berikut:
- Hampir dua hingga empat kali lebih banyak aktivitas mencurigakan yang terkonfirmasi.
- Biaya operasional yang lebih rendah karena penghapusan lebih dari 60% positif palsu dan waktu investigasi yang difokuskan hanya pada peringatan berisiko tinggi yang dapat ditindaklanjuti.
- Output yang dapat diaudit dan dapat dijelaskan untuk mendukung kepatuhan terhadap peraturan.
Pertimbangkan rekomendasi berikut:
- Konfirmasi bahwa produk yang ingin Anda gunakan dapat membantu memenuhi persyaratan keamanan, ketahanan, dan kepatuhan untuk yurisdiksi tempat Anda beroperasi. Untuk mencapai sasaran ini, bekerja samalah dengan Google Cloud tim akun, tim risiko, dan tim produk.
- Buat model yang lebih canggih dan berikan transparansi kepada pelanggan dengan memanfaatkan kemampuan penjelasan AI (misalnya, atribusi nilai Shapley). Teknik seperti atribusi nilai Shapley dapat mengaitkan keputusan model dengan fitur tertentu di tingkat input.
Capai transparansi untuk workload AI generatif dengan menggunakan teknik seperti kutipan ke sumber, grounding, dan RAG.
Jika kemampuan penjelasan tidak cukup, pisahkan langkah-langkah pengambilan keputusan dalam aliran nilai Anda dan gunakan AI untuk mengotomatiskan langkah-langkah non-pengambilan keputusan saja. Dalam beberapa kasus, AI yang dapat dijelaskan mungkin tidak cukup atau proses mungkin memerlukan intervensi manusia karena masalah peraturan (misalnya, GDPR, Pasal 22). Dalam kasus tersebut, sajikan semua informasi yang dibutuhkan agen manusia untuk pengambilan keputusan dalam satu panel kontrol, tetapi otomatiskan tugas pengumpulan, penyerapan, manipulasi, dan ringkasan data.
Memikirkan kembali arsitektur Anda untuk beradaptasi dengan peluang dan persyaratan baru
Meningkatkan arsitektur saat ini dengan kemampuan berbasis cloud dapat memberikan nilai yang signifikan. Untuk mencapai hasil yang lebih transformatif, Anda perlu memikirkan kembali arsitektur secara berkala dengan menggunakan pendekatan cloud-first.
Pertimbangkan rekomendasi berikut untuk memikirkan kembali arsitektur workload Anda secara berkala guna mengoptimalkan performa lebih lanjut.
Menggunakan alternatif berbasis cloud untuk sistem dan penjadwal HPC lokal
Untuk memanfaatkan elastisitas yang lebih tinggi, postur keamanan yang ditingkatkan, serta kemampuan pemantauan dan tata kelola yang ekstensif, Anda dapat menjalankan workload HPC di cloud atau melakukan bursting workload lokal ke cloud. Namun, untuk kasus penggunaan pemodelan numerik tertentu seperti simulasi strategi investasi atau pemodelan XVA, menggabungkan Kubernetes dengan Kueue mungkin menawarkan solusi yang lebih canggih.
Beralih ke pemrograman berbasis grafik untuk simulasi
Simulasi Monte Carlo mungkin jauh lebih berperforma dalam sistem eksekusi berbasis grafik seperti Dataflow. Misalnya, HSBC menggunakan Dataflow untuk menjalankan penghitungan risiko 16 kali lebih cepat dibandingkan dengan pendekatan sebelumnya.
Menjalankan platform perdagangan dan pertukaran berbasis cloud
Percakapan dengan Google Cloud pelanggan mengungkapkan bahwa prinsip Pareto 80/20 berlaku untuk persyaratan performa pasar dan aplikasi perdagangan.
- Lebih dari 80% aplikasi perdagangan tidak memerlukan latensi yang sangat rendah. Namun, aplikasi tersebut mendapatkan manfaat signifikan dari kemampuan ketahanan, keamanan, dan elastisitas cloud. Misalnya, BidFX, platform multi-dealer valuta asing menggunakan cloud untuk meluncurkan produk baru dengan cepat dan meningkatkan ketersediaan serta jangkauan secara signifikan tanpa menambah resource.
- Aplikasi yang tersisa (kurang dari 20%) memerlukan latensi rendah (kurang dari milidetik), determinisme, dan keadilan dalam pengiriman pesan. Secara konvensional, sistem ini berjalan di fasilitas kolokasi yang kaku dan mahal. Semakin banyak, bahkan kategori aplikasi ini di- replatform di cloud, baik di edge maupun sebagai aplikasi cloud-first.
Menyiapkan teknologi Anda untuk masa mendatang guna memenuhi kebutuhan bisnis saat ini dan di masa mendatang
Secara historis, banyak organisasi FS membangun teknologi eksklusif untuk mendapatkan keunggulan kompetitif. Misalnya, pada awal tahun 2000-an, bank investasi dan perusahaan perdagangan yang sukses memiliki implementasi teknologi dasar mereka sendiri seperti sistem pub-sub dan message broker. Dengan evolusi teknologi open source dan cloud, teknologi tersebut telah menjadi komoditas dan tidak menawarkan nilai bisnis tambahan.
Pertimbangkan rekomendasi berikut untuk menyiapkan teknologi Anda untuk masa mendatang.
Mengadopsi pendekatan data-as-a-service (DaaS) untuk waktu penyiapan produk yang lebih cepat dan transparansi biaya
Organisasi FS sering kali berkembang melalui kombinasi pertumbuhan organik dan merger serta akuisisi (M&A). Akibatnya, organisasi perlu mengintegrasikan teknologi yang berbeda. Mereka juga perlu mengelola resource duplikat, seperti vendor data, lisensi data, dan titik integrasi. Google Cloud memberikan peluang untuk menciptakan nilai yang berbeda dalam integrasi pasca-merger.
Misalnya, Anda dapat menggunakan layanan seperti berbagi BigQuery untuk membangun platform data-as-a-service (DaaS) yang siap analisis. Platform ini dapat menyediakan data pasar dan input dari sumber alternatif. Pendekatan ini menghilangkan kebutuhan untuk membangun pipeline data redundan dan memungkinkan Anda berfokus pada inisiatif yang lebih berharga. Selain itu, perusahaan yang dimerger atau diakuisisi dapat dengan cepat dan efisien merasionalisasi kebutuhan infrastruktur dan lisensi data pasca-merger. Daripada menghabiskan upaya untuk mengadaptasi dan menggabungkan operasi dan aset data lama, bisnis gabungan dapat berfokus pada peluang bisnis baru.
Membangun lapisan abstraksi untuk mengisolasi sistem yang ada dan menangani model bisnis yang muncul
Semakin banyak, keunggulan kompetitif untuk bank bukanlah sistem perbankan inti, tetapi lapisan pengalaman pelanggan. Namun, sistem perbankan lama sering kali menggunakan aplikasi monolitik yang dikembangkan dalam bahasa seperti Cobol dan terintegrasi di seluruh rantai nilai perbankan. Integrasi ini menyulitkan pemisahan lapisan rantai nilai, sehingga hampir tidak mungkin untuk mengupgrade dan memodernisasi sistem tersebut.
Salah satu solusi untuk mengatasi tantangan ini adalah menggunakan lapisan isolasi seperti sistem pengelolaan API atau lapisan staging seperti Spanner yang menduplikasi buku catatan dan memfasilitasi modernisasi layanan dengan analisis dan AI tingkat lanjut. Misalnya, Deutsche Bank menggunakan Spanner untuk mengisolasi aset perbankan inti lama dan memulai perjalanan inovasi mereka.