خوارزمية Apriori: كيف تعمل؟ كيف يمكن للعلامات التجارية استخدام خوارزمية Apriori؟
نشرت: 2020-03-26تخيل أنك في سوبر ماركت ، وفي عقلك ، لديك الأشياء التي تريد شراءها. لكن ينتهي بك الأمر بشراء أكثر بكثير مما كان من المفترض أن تشتريه. وهذا ما يسمى الشراء الاندفاعي وتستخدم العلامات التجارية خوارزمية أبريوري للاستفادة من هذه الظاهرة. انقر لمعرفة المزيد إذا كنت مهتمًا بمعرفة المزيد حول خوارزميات علوم البيانات.
ما هي هذه الخوارزمية؟ وكيف يعمل؟ ستجد إجابات لهذه الأسئلة في هذه المقالة. سنلقي أولاً نظرة على ماهية هذه الخوارزمية ثم كيف تعمل.
هيا نبدأ.
جدول المحتويات
ما هي خوارزمية Apriori؟
تمنحك خوارزمية apriori مجموعات عناصر متكررة. أساسها هو خاصية apriori والتي يمكننا شرحها بالطريقة التالية:
افترض أن مجموعة عناصر لديك لها قيمة دعم أقل من قيمة الدعم الضرورية. بعد ذلك ، سيكون للمجموعات الفرعية لمجموعة العناصر هذه أيضًا قيمة دعم أقل من المطلوب. لذلك ، لن تقوم بتضمينها في الحساب الخاص بك ونتيجة لذلك ، توفر مساحة كبيرة.
تشير قيمة الدعم إلى عدد المرات التي تظهر فيها مجموعة عناصر معينة في المعاملات. تحظى خوارزمية apriori بشعبية كبيرة بسبب تطبيقها في أنظمة التوصية. بشكل عام ، ستقوم بتطبيق هذه الخوارزمية على قواعد بيانات المعاملات ، مما يعني ، قاعدة بيانات للمعاملات. هناك العديد من تطبيقات العالم الحقيقي لهذه الخوارزمية أيضًا. يجب أيضًا أن تكون على دراية بـ Association Rule Mining لفهم خوارزمية apriori بشكل صحيح.
اقرأ أيضًا: المتطلبات الأساسية لعلوم البيانات. كيف تتغير بمرور الوقت؟
كيف تعمل خوارزمية Apriori؟
تنشئ خوارزمية apriori قواعد ارتباط باستخدام مجموعات عناصر متكررة. مبدأها بسيط - المجموعة الفرعية لمجموعة العناصر المتكررة ستكون أيضًا مجموعة عناصر متكررة. مجموعة العناصر التي لها قيمة دعم أكبر من قيمة العتبة هي مجموعة عناصر متكررة. ضع في اعتبارك البيانات التالية:
TID | العناصر |
T1 | 1 3 4 |
T2 | 2 3 5 |
T3 | 1 2 3 5 |
T4 | 2 5 |
T5 | 1 3 5 |
في التكرار الأول ، افترض أن قيمة الدعم هي اثنين واجعل مجموعات العناصر بالحجم 1. الآن احسب قيم الدعم وفقًا لذلك. سوف نتجاهل العنصر الذي سيكون له قيمة دعم أقل من الحد الأدنى. في هذا المثال ، سيكون هذا هو العنصر رقم أربعة.
C1 (نتيجة التكرار الأول)
مجموعة العناصر | الدعم |
{1} | 3 |
{2} | 3 |
{3} | 4 |
{4} | 1 |
{5} | 4 |
F1 (بعد أن نتجاهل {4})
مجموعة العناصر | الدعم |
{1} | 3 |
{2} | 3 |
{3} | 4 |
{5} | 4 |
في التكرار الثاني ، سنحتفظ بحجم مجموعة العناصر اثنين ثم نحسب قيم الدعم. سنستخدم جميع تركيبات الجدول F1 في هذا التكرار. سنقوم بإزالة أي مجموعات عناصر قد يكون لها قيم دعم أقل من اثنين.
C2 (يحتوي فقط على عناصر موجودة في F1)
مجموعة العناصر | الدعم |
{1،2} | 1 |
{1،3} | 3 |
{1،5} | 2 |
{2،3} | 2 |
{2،5} | 3 |
{3،5} | 3 |
F2 (بعد أن نزيل العناصر التي لها قيم دعم أقل من 2)
مجموعة العناصر | الدعم |
{1،3} | 3 |
{1،5} | 2 |
{2،3} | 2 |
{2،5} | 3 |
{3،5} | 3 |
الآن ، سنقوم بعملية التقليم. في هذه الحالة ، سنقسم مجموعات عناصر C3 إلى مجموعات فرعية ونزيل العناصر التي لها قيمة دعم أقل من اثنين.
C3 (بعد التقليم)
مجموعة العناصر | في F2؟ |
{1،2،3} ، {1،2} ، {1،3} ، {2،3} | رقم |
{1،2،5} ، {1،2} ، {1،5} ، {2،5} | رقم |
{1،3،5} ، {1،5} ، {1،3} ، {3،5} | نعم |
{2،3،5} ، {2،3} ، {2،5} ، {3،5} | نعم |

في التكرار الثالث ، سنستبعد {1،2،5} و {1،2،3} نظرًا لأن كلاهما يحتوي على {1،2}. هذا هو التأثير الرئيسي لخوارزمية apriori.
F3 (بعد أن نتجاهل {1،2،5} و {1،2،3})
مجموعة العناصر | الدعم |
{1،3،5} | 2 |
{2،3،5} | 2 |
في التكرار الرابع ، سنستخدم مجموعات F3 لإنشاء C4. ومع ذلك ، نظرًا لأن قيمة دعم C4 أقل من 2 ، فلن نتابع ومجموعة العناصر النهائية هي F3.
ج 3
مجموعة العناصر | الدعم |
{1،2،3،5} | 1 |
لدينا العناصر التالية مع F3:
بالنسبة إلى I = {1،3،5} ، المجموعات الفرعية لدينا هي {5} ، {3} ، {1} ، {3،5} ، {1،5} ، {1،3}
بالنسبة إلى I = {2،3،5} ، المجموعات الفرعية لدينا هي {5} ، {3} ، {2} ، {3،5} ، {2،5} ، {2،3}
الآن ، سننشئ ونطبق القواعد على مجموعة العناصر F3. لهذا الغرض ، سنفترض أن الحد الأدنى لقيمة الثقة هو حاليًا 60٪. بالنسبة للمجموعات الفرعية S من I ، إليك القاعدة التي نخرجها:
- S -> (I ، S) (وهذا يعني أن S توصي IS)
- إذا كان الدعم (I) / support (S)> = قيمة min_conf
لنفعل هذا للمجموعة الفرعية الأولى لدينا ، على سبيل المثال ، {1،3،5}
القاعدة رقم 1: {1،3} -> ({1،3،5} - {1،3}) وهذا يعني 1 & 3-> 5
قيمة الثقة = قيمة الدعم (1،3،5) / قيمة الدعم (1،3) = ⅔ = 66.66٪
حيث كانت النتيجة أعلى من 60٪ ، نختار القاعدة رقم 1.
القاعدة رقم 2: {1،5} -> {(1،3،5) - {1،5}) وهذا يعني 1 & 5 -> 3
قيمة الثقة = قيمة الدعم (1،3،5) / قيمة الدعم (1،5) = 2/2 = 100٪
حيث كانت النتيجة أعلى من 60٪ نختار القاعدة رقم 2.
القاعدة رقم 3: {3} -> ({1،3،5} - {3}) وهذا يعني 3 -> 1 & 5
قيمة الثقة = قيمة الدعم (1،3،5) / قيمة الدعم (3) = 2/4 = 50٪
ولما كانت النتيجة أقل من 60٪ فإننا نرفض القاعدة رقم 3.
احصل على دورات في علوم البيانات من أفضل الجامعات في العالم. انضم إلى برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.
باستخدام المثال أعلاه ، يمكنك أن ترى كيف تنشئ خوارزمية Apriori القواعد وتطبقها. يمكنك اتباع هذه الخطوات لمجموعة العناصر الثانية ({2،3،5}) لدينا. ستمنحك تجربته بالتأكيد تجربة رائعة في فهم القواعد التي تقبلها الخوارزمية وتلك التي ترفضها. تظل الخوارزمية كما هي في أماكن أخرى مثل خوارزمية Apriori Python.
خاتمة
بعد قراءة هذا المقال ، نحن على يقين من أنك ستكون على دراية كاملة بهذه الخوارزمية وتطبيقها. نظرًا لاستخدامه في أنظمة التوصية ، فقد أصبح شائعًا أيضًا.
هل هناك خوارزمية أكثر كفاءة من خوارزمية Apriori؟
تم العثور على خوارزمية ECLAT (تجميع فئة التكافؤ و Lattice Traversal من أسفل إلى أعلى) لتكون مفيدة جدًا وشائعة لتعدين قواعد الجمعيات. علاوة على ذلك ، من المعروف أيضًا أنها خوارزمية أكثر كفاءة وأسرع مقارنة بخوارزمية Apriori.
تعمل خوارزمية Apriori بطريقة أفقية حيث إنها تحاكي البحث الأول في عرض الرسم البياني ، بينما تعمل خوارزمية ECLAT بطريقة رأسية عن طريق محاكاة بحث العمق الأول للرسم البياني. هذا النهج الرأسي هو السبب وراء السرعة الأسرع والكفاءة الأفضل لخوارزمية ECLAT مقارنة بخوارزمية Apriori.
خوارزمية Apriori مفيدة لأي غرض؟
خوارزمية Apriori هي خوارزمية كلاسيكية تستخدم على نطاق واسع في استخراج البيانات. إنه مفيد حقًا لتعدين قواعد الارتباط ذات الصلة وأيضًا مجموعات العناصر المتكررة من قاعدة البيانات المتاحة. عادة ، يتم استخدام هذه الخوارزمية من قبل المؤسسات التي يتعين عليها التعامل مع قاعدة بيانات تتكون من الكثير من المعاملات. على سبيل المثال ، تجعل خوارزمية apriori من السهل جدًا تحديد العناصر التي يشتريها العملاء كثيرًا من متجرك. يمكن تحسين مبيعات السوق بشكل كبير بمساعدة هذه الخوارزمية.
بخلاف ذلك ، تُستخدم هذه الخوارزمية أيضًا في قطاع الرعاية الصحية لاكتشاف التفاعلات الدوائية الضارة. تنتج الخوارزمية قواعد ارتباط لتحديد جميع مجموعات خصائص المريض والأدوية التي يمكن أن تؤدي إلى تفاعلات دوائية ضائرة.
ما هي إيجابيات وسلبيات خوارزمية Apriori؟
خوارزمية Apriori سهلة التنفيذ والفهم ويمكن استخدامها بكفاءة عالية على مجموعات العناصر الكبيرة. في بعض الأحيان ، قد تكون هناك حاجة للعثور على عدد كبير من القواعد المرشحة ، وقد تكون هذه العملية مكلفة من الناحية الحسابية بعض الشيء. نظرًا لأنه يجب أن يمر عبر قاعدة البيانات بأكملها ، فإن حساب الدعم مكلف أيضًا.