Deteksi Penipuan dalam Pembelajaran Mesin: Yang Perlu Anda Ketahui [2022]

Diterbitkan: 2021-01-02

Makanan, pakaian, aksesoris, atau furnitur. Semua yang dulu Anda beli dari toko-toko di jalan yang sibuk sekarang dapat dibeli secara online. E-Commerce adalah industri bernilai miliaran dolar dan terus meningkat. Tak perlu dikatakan, ini juga dalam genggaman dunia kriminal. Penjahat online hadir di semua sektor online yang dapat Anda sebutkan.

Deteksi Penipuan dengan Pembelajaran Mesin dimungkinkan karena kemampuan model untuk belajar dari data penipuan masa lalu untuk mengenali pola dan memprediksi legitimasi transaksi di masa depan. Dalam kebanyakan kasus, ini lebih efektif daripada manusia karena kecepatan dan efisiensi pemrosesan informasi.

Beberapa jenis penipuan internet adalah:

pemalsuan identitas. Saat ini ID dibuat dengan sangat baik sehingga hampir tidak mungkin bagi manusia untuk memverifikasi keabsahannya dan mencegah penipuan identitas.

Melalui penggunaan AI, berbagai fitur tampilan KTP dapat dianalisis untuk memberikan hasil keaslian dokumen. Hal ini memungkinkan perusahaan untuk menetapkan kriteria keamanan mereka sendiri ketika permintaan dibuat yang memerlukan dokumen ID tertentu.

- Penipuan pinjaman bank. Ini mungkin terjadi jika seseorang menghubungi Anda dan menawarkan skema pinjaman dengan kondisi yang mencurigakan. Di sini orang yang menghubungi Anda akan menanyakan detail bank Anda atau pembayaran di muka, tanpa memiliki informasi perusahaan yang tepat atau bahkan menggunakan nomor kontak internasional. Penipuan semacam itu dapat dengan mudah ditangani oleh AI menggunakan catatan aplikasi pinjaman sebelumnya untuk menyaring para pelanggar pinjaman.

Email phising. Ini adalah jenis kejahatan dunia maya di mana situs dan pesan palsu diiklankan kepada pengguna, meminta mereka untuk membagikan data pribadi. Jika seseorang tidak terlalu berhati-hati, ia dapat memasukkan data rahasia apa pun yang dapat membuat mereka rentan terhadap ancaman. Cara terbaik untuk menghindari penipuan ini adalah agar pengguna berhati-hati sendiri, namun, AI dapat melakukan pekerjaan menemukan email penipuan dengan memfilternya menggunakan algoritme pembelajaran mesin dasar seperti regresi.

penipuan kartu kredit. Ini adalah jenis penipuan pembayaran yang paling umum. Ini karena semua detail disimpan secara online yang memudahkan penjahat dan peretas untuk mengakses. Kartu yang dikirim melalui surat juga dapat dengan mudah disadap. Salah satu cara untuk memfilter transaksi penipuan tersebut menggunakan pembelajaran mesin dibahas di bawah ini.

Pencurian identitas. Pembelajaran Mesin untuk mendeteksi pencurian identitas membantu memeriksa dokumen identitas berharga seperti paspor, kartu PAN, atau SIM secara real-time. Selain itu, informasi biometrik terkadang diperlukan untuk lebih meningkatkan keamanan. Metode keamanan ini membutuhkan otentikasi langsung yang mengurangi kemungkinan penipuan untuk sebagian besar.

Baca juga tentang: Gaji Engineer Machine Learning di India

Model untuk memprediksi penipuan menggunakan data kartu kredit

Di sini kumpulan data Kaggle yang sangat terkenal digunakan untuk mendemonstrasikan cara kerja pendeteksian penipuan menggunakan model jaringan saraf sederhana.

Impor:

impor panda sebagai pd

impor numpy sebagai np

impor tensorflow sebagai tf

impor keras

dari sklearn.preprocessing impor StandardScaler

dari keras.models import Sequential

dari keras.layers impor Padat

dari sklearn.model_selection impor train_test_split

dari sklearn.metrics mengimpor klasifikasi_laporan

Silahkan lihat di dataset di sini . Kolom Jumlah dinormalisasi seperti semua fitur lainnya dan kolom Waktu dihapus karena tidak relevan.

data= pd.read_csv ( 'kartu kredit.csv' )

data [ 'Amount_norm' ] = StandardScaler () .fit_transform ( data [ 'Amount' ] .values.reshape ( -1 , 1 ))

data= data.drop ([ 'Jumlah' ], axis= 1 )

data= data.drop ([ 'Waktu' ], sumbu= 1 )

data= data [: -1 ]

data.info()

Sekarang setelah beberapa pembersihan data, dataset kami berisi total 28 fitur dan satu target, semuanya memiliki nilai float yang tidak kosong.

Target kami adalah kolom Kelas yang menentukan apakah transaksi kartu kredit tertentu adalah penipuan atau tidak. Jadi dataset dibagi sesuai menjadi train dan test, dengan menjaga rasio split 80:20 yang biasa. ( random_state diperbaiki untuk membantu Anda mereproduksi data split Anda)

X = data.iloc [:, data.columns != 'Kelas' ]

y = data.iloc [:, data.columns == 'Kelas' ]

X_train , X_test , y_train , y_test = train_test_split ( X , y , test_size = 0.2 , random_state = 0 )

Kami menggunakan model sekuensial dari perpustakaan keras untuk membangun jaringan saraf dengan 3 lapisan padat. Lapisan keluaran hanya berisi satu neuron yang akan menggunakan fungsi sigmoid untuk menghasilkan kelas positif atau kelas negatif.

Model kemudian dikompilasi dengan pengoptimal adam , meskipun sangat disarankan agar Anda mencoba sendiri nilai parameter hiper yang berbeda, seperti jumlah unit di setiap lapisan, aktivasi, pengoptimal, dll. Himpunan data.

model= Urutan ()

model.add ( Padat ( satuan = 16 , aktivasi = 'relu' , input_dim = 29 ))

model.add ( Padat ( unit= 16 , aktivasi = 'relu' ))

model.add ( Padat ( unit= 1 , aktivasi = 'sigmoid' ))

model. kompilasi ( pengoptimal = 'adam' , loss = 'binary_crossentropy' , metrik = [ 'akurasi' ])

model.fit ( X_train , y_train , batch_size = 32 , epoch = 15 )

Ini adalah hasil setelah menjalankan model selama beberapa epoch.

Kami melihat bahwa model memberikan akurasi 99,97% dengan sangat cepat. Di bawah, y_pred berisi prediksi yang dibuat oleh model kami pada data pengujian, dan ringkasan kinerjanya ditampilkan.

y_pred = model.predict ( X_test )

y_pred = ( y_pred > 0,5 )

cetak ( klasifikasi_laporan ( y_test , y_pred ))

Baca: Ide Proyek Pembelajaran Mesin untuk Pemula

Kesimpulan

Jadi dengan cara ini kami berhasil membangun model yang sangat akurat untuk menentukan transaksi penipuan. Ini sangat berguna untuk tujuan manajemen risiko.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Pimpin Revolusi Teknologi Berbasis AI

DIPLOMA PG DALAM PEMBELAJARAN MESIN DAN KECERDASAN BUATAN

Belajarlah lagi