كشف الاحتيال في التعلم الآلي: ما تحتاج إلى معرفته [2022]
نشرت: 2021-01-02الطعام أو الملابس أو الملحقات أو الأثاث. يمكنك الآن شراء كل ما اعتدت شرائه من المتاجر الموجودة أسفل الطرق المزدحمة عبر الإنترنت. التجارة الإلكترونية هي صناعة بمليارات الدولارات وهي تنمو أكثر فأكثر. وغني عن القول ، هذا أيضًا في متناول العالم الإجرامي. المجرمون عبر الإنترنت موجودون في جميع قطاعات الإنترنت التي يمكنك تسميتها.
يعد اكتشاف الاحتيال باستخدام التعلم الآلي ممكنًا نظرًا لقدرة النماذج على التعلم من بيانات الاحتيال السابقة للتعرف على الأنماط والتنبؤ بشرعية المعاملات المستقبلية. في معظم الحالات ، يكون أكثر فاعلية من البشر بسبب سرعة وكفاءة معالجة المعلومات.
بعض أنواع عمليات الاحتيال عبر الإنترنت هي:
- تزوير الهوية. في الوقت الحاضر ، يتم تصنيع بطاقات الهوية بشكل جيد لدرجة أنه يكاد يكون من المستحيل على البشر التحقق من شرعيتها ومنع أي احتيال في الهوية.
من خلال استخدام الذكاء الاصطناعي ، يمكن تحليل الميزات المختلفة لمظهر بطاقة الهوية لإعطاء نتيجة حول صحة المستند. يسمح هذا للشركات بوضع معاييرها الخاصة للأمان عند تقديم الطلبات التي تتطلب مستندات تعريف معينة.
- الحيل على القروض المصرفية. قد يحدث هذا إذا اتصل بك شخص ما وقدم لك خطة قروض بشروط مواتية مشبوهة. هنا سيطلب الشخص الذي يتصل بك تفاصيل حسابك المصرفي أو بالدفع مقدمًا ، دون أن يكون لديه أي معلومات مناسبة عن الشركة أو حتى استخدام رقم اتصال دولي. يمكن للذكاء الاصطناعي التعامل مع عمليات الاحتيال هذه بسهولة باستخدام سجلات طلبات القروض السابقة لتصفية المتعثرين في الحصول على القروض.
- البريد الإلكتروني التصيد. هذا نوع من الجرائم الإلكترونية حيث يتم الإعلان عن المواقع والرسائل المزيفة للمستخدمين ، وتطلب منهم مشاركة البيانات الشخصية. إذا لم يكن الشخص حريصًا جدًا ، فيجوز له إدخال أي بيانات سرية يمكن أن تجعله عرضة للتهديدات. أفضل طريقة لتجنب هذا الاحتيال هي أن يكون المستخدم حريصًا على نفسه ، ومع ذلك ، يمكن للذكاء الاصطناعي القيام بمهمة اكتشاف رسائل البريد الإلكتروني الاحتيالية عن طريق تصفيتها باستخدام خوارزميات التعلم الآلي الأساسية مثل الانحدار.
- عمليات الاحتيال على بطاقات الائتمان. هذا هو أكثر أنواع الاحتيال في الدفع شيوعًا. هذا لأن جميع التفاصيل مخزنة على الإنترنت مما يسهل على المجرمين والمتسللين الوصول إليها. يمكن أيضًا اعتراض البطاقات المرسلة عبر البريد بسهولة. تتم مناقشة إحدى طرق تصفية معاملات الاحتيال هذه باستخدام التعلم الآلي أدناه.
- سرقة الهوية. يساعد التعلم الآلي لاكتشاف سرقة الهوية في التحقق من مستندات الهوية القيمة مثل جوازات السفر أو بطاقات PAN أو رخص القيادة في الوقت الفعلي. علاوة على ذلك ، قد تكون المعلومات البيومترية مطلوبة في بعض الأحيان لتحسين الأمان بشكل أكبر. تحتاج أساليب الأمان هذه إلى مصادقة شخصية مما يقلل من فرصة الاحتيال إلى حد كبير.
اقرأ أيضًا عن: راتب مهندس تعلم الآلة في الهند
نموذج للتنبؤ بالاحتيال باستخدام بيانات بطاقة الائتمان
هنا يتم استخدام مجموعة بيانات Kaggle الشهيرة جدًا لتوضيح كيفية عمل الكشف عن الاحتيال باستخدام نموذج بسيط للشبكة العصبية.

الواردات:
استيراد الباندا كما pd
استيراد numpy كـ np
استيراد tensorflow مثل tf
استيراد كراس
من sklearn.preprocessing استيراد StandardScaler
من keras.models استيراد تسلسلي
من keras.layer استيراد كثيف
من sklearn.model_selection استيراد train_test_split
من sklearn.metrics استيراد تصنيف_تقرير
ألق نظرة على مجموعة البيانات هنا . تتم تسوية عمود المبلغ مثل جميع الميزات الأخرى وتتم إزالة عمود الوقت لأنه غير ذي صلة.
data = pd.read_csv ( 'creditcard.csv' )
البيانات [ 'Amount_norm' ] = StandardScaler () .fit_transform ( البيانات [ "المبلغ" ] .values.reshape ( -1 ، 1 ))
data = data.drop ([ 'Amount' ] ، المحور = 1 )
data = data.drop ([ "الوقت" ] ، المحور = 1 )

البيانات = البيانات [: -1 ]
data.info ()
الآن بعد تنظيف بعض البيانات ، تحتوي مجموعة البيانات الخاصة بنا على إجمالي 28 ميزة وهدف واحد ، وكلها تحتوي على قيم عائمة وليست فارغة.
هدفنا هو عمود الفئة الذي يحدد ما إذا كانت معاملة بطاقة الائتمان المعينة احتيالية أم لا. لذلك يتم تقسيم مجموعة البيانات وفقًا لذلك إلى قطار واختبار ، مع الحفاظ على نسبة الانقسام المعتادة 80:20. ( تم إصلاح Random_state لمساعدتك على إعادة إنتاج بياناتك المقسمة)
X = data.iloc [:، data.columns ! = 'Class' ]
y = data.iloc [:، data.columns == 'Class' ]
X_train ، X_test ، y_train ، y_test = train_test_split ( X ، y ، test_size = 0.2 ، random_state = 0 )
نستخدم النموذج التسلسلي من مكتبة keras لبناء شبكة عصبية بثلاث طبقات كثيفة. تحتوي الطبقة الناتجة على خلية عصبية واحدة فقط والتي ستستخدم الدالة السينية لتنتج إما فئة موجبة أو فئة سلبية.
يتم بعد ذلك تجميع النموذج باستخدام مُحسِّن adam ، على الرغم من أنه يُقترح بشدة أن تجرب قيمًا مختلفة للمعلمات الفائقة بنفسك ، مثل عدد الوحدات في كل طبقة ، والتفعيل ، والمحسن ، وما إلى ذلك لمعرفة ما هو الأفضل بالنسبة إلى معين. مجموعة البيانات.
النموذج = تسلسلي ()
model.add ( كثيف ( الوحدات = 16 ، التنشيط = 'relu' ، input_dim = 29 ))
model.add ( كثيف ( الوحدات = 16 ، التنشيط = 'relu' ))
model.add ( كثيف ( الوحدات = 1 ، التنشيط = 'sigmoid' ))
نموذج. تجميع ( محسن = 'adam' ، خسارة = 'binary_crossentropy' ، مقاييس = [ 'دقة' ])
model.fit ( X_train ، y_train ، batch_size = 32 ، العصور = 15 )
هذه هي النتيجة بعد تشغيل النموذج لبضع فترات.
نرى أن النموذج يعطي دقة 99.97٪ بسرعة كبيرة. أدناه ، يحتوي y_pred على التنبؤات التي قدمها نموذجنا على بيانات الاختبار ، ويتم عرض ملخص أنيق لأدائه.
y_pred = model.predict ( X_test )

y_pred = ( y_pred> 0.5 )
طباعة ( تصنيف_تقرير ( y_test ، y_pred ))
قراءة: أفكار مشروع التعلم الآلي للمبتدئين
خاتمة
وبهذه الطريقة تمكنا بنجاح من بناء نموذج عالي الدقة لتحديد المعاملات الاحتيالية. هذه تأتي في متناول اليد لأغراض إدارة المخاطر.
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.