Efisiensi Model AI di Keuangan Lewat Active Learning
- Mutiara Aisyah
- •
- 09 Apr 2025 23.04 WIB

Ilustrasi Active Learning
Dalam dunia keuangan yang semakin terotomatisasi dan didorong oleh data, tantangan terbesar bukan lagi terletak pada keterbatasan data. Institusi keuangan menghasilkan jutaan baris data setiap harinya, mulai dari transaksi perbankan, laporan keuangan, hingga interaksi pelanggan. Namun, dari sekian banyak data yang tersedia, hanya sebagian kecil yang disertai label yang dapat digunakan untuk melatih model pembelajaran mesin. Dan di sektor ini, pelabelan bukan hanya mahal dan memakan waktu, tetapi juga membutuhkan keahlian domain yang mendalam.
Proses pelabelan data untuk mendeteksi penipuan, menilai risiko kredit, atau mengidentifikasi transaksi mencurigakan tidak bisa dilakukan oleh sistem otomatis biasa. Sering kali, hal ini memerlukan campur tangan analis risiko senior atau departemen kepatuhan. Inilah yang menjadikan pendekatan Active Learning relevan dan strategis. Alih-alih mengandalkan pelabelan secara menyeluruh terhadap data mentah, Active Learning memungkinkan model untuk secara aktif memilih data mana yang paling penting untuk dipelajari.
Active Learning adalah metode pembelajaran mesin di mana model tidak belajar secara pasif dari seluruh dataset, melainkan secara selektif memilih data tak berlabel yang ia anggap paling informatif. Model kemudian meminta agar data tersebut diberi label oleh manusia ahli. Dengan cara ini, model dapat meningkatkan kemampuannya secara signifikan hanya dari sejumlah kecil data berlabel, tanpa harus mengorbankan akurasi.
Siklus kerja Active Learning umumnya dimulai dari pelatihan awal menggunakan subset kecil data yang sudah diberi label. Selanjutnya, model mengevaluasi data tidak berlabel dalam jumlah besar, lalu mengajukan “pertanyaan” berupa permintaan label pada data yang menurutnya paling membingungkan atau berpotensi memperbaiki kinerjanya secara drastis. Label tersebut kemudian dimasukkan kembali ke dalam proses pelatihan. Siklus ini berulang hingga model mencapai performa yang diinginkan atau batas biaya pelabelan terpenuhi.
Salah satu studi dari MIT CSAIL menyebutkan bahwa "Active Learning secara konsisten mampu menurunkan kebutuhan pelabelan hingga 40 hingga 70 persen dalam proyek-proyek klasifikasi berbasis data nyata" (Zhou et al., 2020). Ini adalah angka yang signifikan, terutama ketika pelabelan dilakukan oleh analis senior yang hanya memiliki waktu terbatas.
Dalam konteks keuangan, penerapan Active Learning sangat nyata dalam proyek deteksi fraud kartu kredit. Meskipun data transaksi tersedia dalam jumlah besar, hanya sebagian kecil yang sudah dikonfirmasi sebagai fraud. Selain itu, kasus penipuan cenderung berkembang secara dinamis, membuat model yang dilatih pada data lama cepat kehilangan relevansi. Dengan Active Learning, model dapat terus memperbarui dirinya dengan cara yang cerdas, yakni dengan memilih sendiri transaksi-transaksi mencurigakan yang ia anggap perlu dikaji ulang oleh manusia.
Contoh lain yang cukup banyak diterapkan adalah dalam pemrosesan keluhan nasabah. Sebuah bank digital yang menerima ribuan keluhan setiap bulan akan kesulitan melabeli seluruh data secara manual. Active Learning dapat membantu model untuk memprioritaskan keluhan yang paling membingungkan atau tidak dapat diklasifikasikan dengan baik, dan meminta tim layanan pelanggan untuk memberi label hanya pada bagian yang paling penting. Pendekatan ini tidak hanya menghemat waktu, tetapi juga meningkatkan akurasi klasifikasi secara signifikan.
Namun, Active Learning bukan tanpa tantangan. Salah satu isu utama adalah ketergantungan pada kualitas label dari manusia. Jika label yang diberikan tidak akurat, maka model akan belajar dari informasi yang keliru. Selain itu, beberapa strategi Active Learning seperti Expected Error Reduction memerlukan komputasi yang sangat intensif, yang tidak selalu cocok untuk pipeline operasional yang berjalan dalam waktu nyata.
Salah satu kekhawatiran lain adalah bias terhadap kelas mayoritas. Dalam kasus deteksi fraud, misalnya, jika model terlalu sering memilih data yang mirip dengan mayoritas, maka tipe fraud yang langka tapi berbahaya bisa terabaikan. Oleh karena itu, strategi pemilihan data harus dirancang dengan cermat, mempertimbangkan keseimbangan antara ketidakpastian model dan distribusi data secara keseluruhan.
Menurut laporan dari McKinsey (2022), banyak perusahaan jasa keuangan yang telah mulai mengadopsi pendekatan pembelajaran adaptif seperti Active Learning untuk meningkatkan efisiensi pipeline data science mereka. Dalam studi tersebut, perusahaan yang mengintegrasikan Active Learning ke dalam proses deteksi anomali dan kredit scoring mengalami pengurangan biaya labeling hingga 60 persen, dengan peningkatan akurasi model sebesar 15 hingga 20 persen dibandingkan pendekatan tradisional.
Hal ini menunjukkan bahwa Active Learning bukan sekadar metode alternatif, melainkan pendekatan strategis yang layak dipertimbangkan dalam skala produksi. Terutama di industri keuangan, di mana setiap keputusan model dapat berdampak langsung pada kepercayaan nasabah, risiko hukum, dan performa bisnis.
Lebih jauh lagi, pendekatan ini menggeser cara kita memandang proses belajar dalam sistem kecerdasan buatan. Ia bukan hanya soal memberi data sebanyak mungkin, melainkan tentang mengajarkan sistem untuk tahu apa yang belum ia pahami, dan mengembangkan kemampuannya berdasarkan pertanyaan-pertanyaan yang ia ajukan sendiri.
Pada akhirnya, Active Learning adalah refleksi dari pemahaman mendalam bahwa belajar bukan hanya tentang mengumpulkan informasi, melainkan tentang membuat pilihan yang tepat tentang informasi mana yang benar-benar perlu dipelajari. Dalam dunia data yang semakin padat dan cepat berubah, kemampuan untuk belajar secara selektif bisa menjadi pembeda utama antara sistem yang sekadar canggih dan sistem yang benar-benar cerdas.