Makine Öğreniminde Dolandırıcılık Tespiti: Bilmeniz Gerekenler [2022]

Yayınlanan: 2021-01-02

Yiyecek, giysi, aksesuar veya mobilya. Kalabalık yollardaki mağazalardan satın aldığınız her şey artık çevrimiçi olarak satın alınabilir. E-Ticaret, milyarlarca dolarlık bir endüstridir ve her geçen gün daha da artmaktadır. Söylemeye gerek yok, bu da suç dünyasının elinde. Çevrimiçi suçlular, adlandırabileceğiniz tüm çevrimiçi sektörlerde mevcuttur.

Makine Öğrenimi ile Dolandırıcılık Tespiti, modellerin geçmiş dolandırıcılık verilerinden öğrenme, kalıpları tanıma ve gelecekteki işlemlerin meşruluğunu tahmin etme yeteneği nedeniyle mümkündür. Çoğu durumda, bilgi işlemenin hızı ve verimliliği nedeniyle insanlardan daha etkilidir.

Bazı internet dolandırıcılığı türleri şunlardır:

kimlik sahtekarlığı Günümüzde kimlikler o kadar iyi üretiliyor ki, insanların meşruiyetlerini doğrulamaları ve herhangi bir kimlik sahtekarlığını önlemeleri neredeyse imkansız.

AI kullanımı yoluyla, kimlik kartı görünümünün çeşitli özellikleri, belgenin gerçekliği hakkında bir sonuç vermek için analiz edilebilir. Bu, belirli kimlik belgelerini gerektiren taleplerde bulunulduğunda şirketlerin kendi güvenlik kriterlerini oluşturmalarına olanak tanır.

- Banka kredisi dolandırıcılığı. Bir kişi sizinle iletişime geçerse ve şüpheli derecede uygun koşullara sahip bir kredi planı sunarsa bunlar olabilir. Burada sizinle iletişime geçecek kişi, herhangi bir uygun şirket bilgisi olmadan veya hatta uluslararası bir iletişim numarası kullanmadan banka bilgilerinizi veya ön ödemenizi isteyecektir. Bu tür sahtekarlıklar, kredi borcunu ödeyemeyenleri filtrelemek için önceki kredi başvuru kayıtları kullanılarak yapay zeka tarafından kolayca halledilebilir.

E-posta kimlik avı. Bu, sahte sitelerin ve mesajların kullanıcılara reklamının yapıldığı ve kişisel verilerini paylaşmalarının istendiği bir tür siber suçtur. Bir kişi çok dikkatli olmazsa, kendisini tehditlere karşı savunmasız hale getirebilecek herhangi bir gizli veri girebilir. Bu sahtekarlığı önlemenin en iyi yolu, kullanıcının kendisine dikkat etmesidir, ancak AI, sahtekarlık e-postalarını bulma işini, regresyon gibi temel makine öğrenimi algoritmalarını kullanarak filtreleyerek yapabilir.

Kredi kartı dolandırıcılıkları. Bu, en yaygın ödeme dolandırıcılığı türüdür. Bunun nedeni, tüm ayrıntıların çevrimiçi olarak saklanması ve bu da suçluların ve bilgisayar korsanlarının erişmesini kolaylaştırmasıdır. Posta yoluyla gönderilen kartlar da kolayca ele geçirilebilir. Makine öğrenimini kullanarak bu tür dolandırıcılık işlemlerini filtrelemenin bir yolu aşağıda tartışılmaktadır.

Kimlik Hırsızı. Kimlik hırsızlığını tespit etmeye yönelik Makine Öğrenimi, pasaportlar, PAN kartları veya ehliyetler gibi değerli kimlik belgelerinin gerçek zamanlı olarak kontrol edilmesine yardımcı olur. Ayrıca, bazen güvenliği daha da artırmak için biyometrik bilgilere ihtiyaç duyulabilir. Bu güvenlik yöntemleri, dolandırıcılık olasılığını büyük ölçüde azaltan yüz yüze kimlik doğrulamaya ihtiyaç duyar.

Ayrıca şunu da okuyun: Hindistan'da Makine Öğrenimi Mühendisi Maaşı

Kredi kartı verilerini kullanarak dolandırıcılığı tahmin etme modeli

Burada, basit bir sinir ağı modeli kullanılarak dolandırıcılık tespitinin nasıl çalıştığını göstermek için çok ünlü bir Kaggle veri seti kullanılıyor.

İthalat:

pandaları pd olarak içe aktar

numpy'yi np olarak içe aktar

tensorflow'u tf olarak içe aktar

ithalat keraları

sklearn.preprocessing'den içe aktarma StandardScaler

keras.models'den sıralı içe aktar

keras.layers'dan Yoğun içe aktar

sklearn.model_selection'dan train_test_split'i içe aktarın

sklearn.metrics'den sınıflandırma_reportunu içe aktar

Buradaki veri setine bir göz atın . Tutar sütunu diğer tüm özellikler gibi normalleştirilir ve Süre sütunu alakasız olduğu için kaldırılır.

veri= pd.read_csv ( 'creditcard.csv' )

data [ 'Amount_norm' ] = StandardScaler () .fit_transform ( data [ 'Miktar' ] .values.reshape ( -1 , 1 ))

data= data.drop ([ 'Miktar' ], eksen= 1 )

data= data.drop ([ 'Zaman' ], eksen= 1 )

veri= veri [: -1 ]

veri.bilgi()

Şimdi, biraz veri temizliğinden sonra, veri kümemiz, tümü boş olmayan kayan değerlere sahip toplam 28 özellik ve bir hedef içeriyor.

Hedefimiz , belirli bir kredi kartı işleminin dolandırıcılık olup olmadığını belirleyen Sınıf sütunudur. Böylece veri seti, alışılmış 80:20 bölme oranını koruyarak buna göre tren ve teste bölünür. ( random_state , bölünmüş verilerinizi yeniden oluşturmanıza yardımcı olmak için düzeltildi)

X = data.iloc [:, data.columns != 'Sınıf' ]

y = data.iloc [:, data.columns == 'Sınıf' ]

X_train , X_test , y_train , y_test = train_test_split ( X , y , test_size = 0.2 , random_state= 0 )

3 yoğun katmandan oluşan bir sinir ağı oluşturmak için keras kitaplığından sıralı modeli kullanıyoruz . Çıktı katmanı, pozitif bir sınıf veya negatif bir sınıfla sonuçlanmak için sigmoid işlevini kullanacak yalnızca tek bir nöron içerir .

Model daha sonra adam optimizer ile derlenir, ancak belirli bir katman için en iyi neyin işe yaradığını görmek için her katmandaki birim sayısı, etkinleştirme, optimize edici vb. gibi hiper parametrenin farklı değerlerini kendiniz denemeniz şiddetle önerilir. veri kümesi.

model= Sıralı ()

model.add ( Yoğun ( birim= 16 , aktivasyon = 'relu' , input_dim = 29 ))

model.add ( Yoğun ( birim= 16 , aktivasyon = 'relu' ))

model.add ( Yoğun ( birim= 1 , aktivasyon = 'sigmoid' ))

modeli. derleme ( optimizer = 'adam' , kayıp = 'binary_crossentropy' , metrikler = [ 'doğruluk' ])

model.fit ( X_train , y_train , batch_size = 32 , çağ sayısı = 15 )

Bu, modeli birkaç dönem çalıştırdıktan sonra elde edilen sonuçtur.

Modelin çok hızlı %99,97 doğruluk verdiğini görüyoruz. Aşağıda, y_pred , modelimiz tarafından test verileri üzerinde yapılan tahminleri içerir ve performansının düzgün bir özeti gösterilir.

y_pred = model.predict ( X_test )

y_pred = ( y_pred > 0,5 )

yazdır ( sınıflandırma_raporu ( y_test , y_pred ))

Okuyun: Yeni Başlayanlar için Makine Öğrenimi Proje Fikirleri

Çözüm

Böylece, hileli işlemleri belirlemek için son derece doğru bir modeli başarıyla oluşturabildik. Bunlar risk yönetimi amaçları için çok kullanışlıdır.

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Yapay Zeka Güdümlü Teknolojik Devrime Öncülük Edin

MAKİNE ÖĞRENİMİNDE PG DİPLOMASI VE YAPAY ZEKA

Daha fazla bilgi edin