Apriori Algoritması: Nasıl Çalışır? Markalar Apriori Algoritmasından Nasıl Yararlanabilir?

Yayınlanan: 2020-03-26

Süpermarkette olduğunuzu ve zihninizde satın almak istediğiniz eşyaların olduğunu hayal edin. Ama sonunda olması gerekenden çok daha fazlasını satın alıyorsun. Buna dürtüsel satın alma denir ve markalar bu fenomenden yararlanmak için apriori algoritmasını kullanır. Veri bilimi algoritmaları hakkında daha fazla bilgi edinmek istiyorsanız, daha fazlasını öğrenmek için tıklayın.

Bu algoritma nedir? Ve nasıl çalışır? Bu soruların cevaplarını bu yazıda bulacaksınız. Önce bu algoritmanın ne olduğuna ve sonra nasıl çalıştığına bir göz atacağız.

Hadi başlayalım.

İçindekiler

Apriori Algoritması nedir?

Apriori algoritması size sık kullanılan öğe kümelerini verir. Bunun temeli, aşağıdaki şekilde açıklayabileceğimiz apriori özelliğidir:

Sahip olduğunuz bir öğe setinin, gerekli destek değerinden daha düşük bir destek değerine sahip olduğunu varsayalım. Ardından, bu öğe kümesinin alt kümeleri de gerekenden daha az destek değerine sahip olacaktır. Böylece onları hesaplamanıza dahil etmeyeceksiniz ve sonuç olarak çok fazla yerden tasarruf edeceksiniz.

Destek değeri, belirli bir öğe kümesinin işlemlerde görünme sayısını ifade eder. Apriori algoritması, öneri sistemlerinde uygulanması nedeniyle oldukça popülerdir. Genel olarak, bu algoritmayı işlem veritabanlarına, yani bir işlem veri tabanına uygulayacaksınız. Bu algoritmanın birçok gerçek dünya uygulaması da vardır. Apriori algoritmasını doğru bir şekilde anlamak için Birliktelik Kuralı Madenciliğine de aşina olmalısınız .

Ayrıca okuyun: Veri Bilimi için Ön Koşul. Zamanla nasıl değişir?

Apriori Algoritması Nasıl Çalışır?

Apriori algoritması, sık öğe kümelerini kullanarak birliktelik kuralları üretir. İlkesi basittir - sık görülen bir öğe kümesinin alt kümesi aynı zamanda bir sık öğe kümesi olacaktır. Bir eşik değerinden daha büyük bir destek değerine sahip bir öğe kümesi, sık kullanılan bir öğe kümesidir. Aşağıdaki verileri göz önünde bulundurun:

TID	Öğeler
T1	1 3 4
T2	2 3 5
T3	1 2 3 5
T4	2 5
T5	1 3 5

İlk yinelemede, destek değerinin iki olduğunu varsayalım ve öğe kümelerini 1 boyutunda yapın. Şimdi destek değerlerini buna göre hesaplayın. Minimum değerden daha düşük bir destek değerine sahip olan öğeyi atardık. Bu örnekte, bu dört numaralı madde olacaktır.

C1 (İlk yinelemenin sonucu)

Öğe seti	Destek
{1}	3
{2}	3
{3}	4
{4}	1
{5}	4

F1 ({4}'i attıktan sonra)

Öğe seti	Destek
{1}	3
{2}	3
{3}	4
{5}	4

İkinci yinelemede, öğe kümelerinin boyutunu iki tutacağız ve ardından destek değerlerini hesaplayacağız. Bu yinelemede F1 tablosunun tüm kombinasyonlarını kullanacağız. Destek değerleri ikiden az olacak tüm öğe kümelerini kaldıracağız.

C2 (Yalnızca F1'de öğeler var)

Öğe seti	Destek
{1,2}	1
{1,3}	3
{1,5}	2
{2,3}	2
{2,5}	3
{3,5}	3

F2 (Destek değeri 2'den düşük olan öğeleri çıkardıktan sonra)

Öğe seti	Destek
{1,3}	3
{1,5}	2
{2,3}	2
{2,5}	3
{3,5}	3

Şimdi budama yapacağız. Bu durumda, C3'ün öğe kümelerini alt kümelere ayıracağız ve destek değeri ikiden küçük olanları kaldıracağız.

C3 (Budama yaptıktan sonra)

Öğe seti	F2'de mi?
{1,2,3}, {1,2}, {1,3}, {2,3}	HAYIR
{1,2,5}, {1,2}, {1,5}, {2,5}	HAYIR
{1,3,5}, {1,5}, {1,3}, {3,5}	EVET
{2,3,5}, {2,3}, {2,5}, {3,5}	EVET

Üçüncü yinelemede, her ikisinde de {1,2} olduğu için {1,2,5} ve {1,2,3} öğelerini atacağız. Bu, apriori algoritmasının ana etkisidir.

F3 ({1,2,5} ve {1,2,3}'i attıktan sonra)

Öğe seti	Destek
{1,3,5}	2
{2,3,5}	2

Dördüncü yinelemede, C4'ü oluşturmak için F3 kümelerini kullanacağız. ancak, C4'ün destek değeri 2'den düşük olduğu için devam edemeyiz ve son öğe seti F3'tür.

Öğe seti	Destek
{1,2,3,5}	1

F3 ile aşağıdaki öğe kümelerine sahibiz:

I = {1,3,5} için sahip olduğumuz alt kümeler {5}, {3}, {1}, {3,5}, {1,5}, {1,3}

I = {2,3,5} için elimizdeki alt kümeler {5}, {3}, {2}, {3,5}, {2,5}, {2,3}

Şimdi, F3 öğe kümesinde kurallar oluşturup uygulayacağız. Bu amaçla, minimum güven değerinin şu anda %60 olduğunu varsayacağız. I'nin S alt kümeleri için, çıktısını aldığımız kural şudur:

S -> (I,S) (bu, S'nin IS'yi önerdiği anlamına gelir)
Eğer destek(I) / destek(S) >= min_conf değeri

Bunu sahip olduğumuz ilk alt küme için yapalım, yani {1,3,5}

Kural no.1: {1,3} -> ({1,3,5} – {1,3}) bu 1 & 3-> 5 anlamına gelir

Güven değeri = (1,3,5) destek değeri / (1,3) destek değeri = ⅔ = %66,66

Sonuç %60'ın üzerinde olduğu için Kural no.1'i seçiyoruz.

Kural no.2: {1,5} -> {(1,3,5) – {1,5}) 1 & 5 -> 3 anlamına gelir

Güven değeri = (1,3,5) destek değeri / (1,5) destek değeri = 2/2 = %100

Sonuç %60'ın üzerinde olduğu için Kural no.2'yi seçiyoruz.

Kural no.3: {3} -> ({1,3,5} – {3}) bu 3 -> 1 ve 5 anlamına gelir

Güven değeri = (1,3,5) destek değeri / (3) destek değeri = 2/4 = %50

Sonuç %60'ın altında olduğu için Kural no.3'ü reddediyoruz.

Dünyanın en iyi Üniversitelerinden veri bilimi kursları kazanın . Kariyerinizi hızlandırmak için Yönetici PG Programlarımıza, İleri Düzey Sertifika Programlarımıza veya Yüksek Lisans Programlarımıza katılın.

Yukarıdaki örnek ile Apriori algoritmasının kuralları nasıl oluşturduğunu ve uyguladığını görebilirsiniz. Elimizdeki ikinci öğe seti ({2,3,5}) için bu adımları takip edebilirsiniz. Denemek, algoritmanın hangi kuralları kabul ettiğini ve hangilerini reddettiğini anlama konusunda kesinlikle size harika bir deneyim verecektir. Algoritma, Apriori algoritması Python gibi diğer yerlerde aynı kalır.

Çözüm

Bu makaleyi okuduktan sonra, bu algoritmaya ve uygulamasına oldukça aşina olacağınızdan eminiz. Öneri sistemlerinde kullanılması nedeniyle de oldukça popüler hale gelmiştir.

Apriori algoritmasından daha verimli bir algoritma var mı?

ECLAT (Eşdeğerlik Sınıfı Kümeleme ve Aşağıdan Yukarıya Kafes Geçişi) algoritmasının birliktelik kuralı madenciliği için oldukça kullanışlı ve popüler bir algoritma olduğu bulunmuştur. Bunun da ötesinde, Apriori algoritmasına kıyasla daha verimli ve daha hızlı bir algoritma olduğu da bilinmektedir.

Apriori algoritması, Grafiğin Genişlik-İlk Aramasını taklit ettiği için yatay bir şekilde çalışır, ECLAT algoritması ise Grafiğin Derinlik-İlk Aramasını taklit ederek dikey bir şekilde çalışır. Bu dikey yaklaşım, ECLAT algoritmasının Apriori algoritmasına kıyasla daha hızlı ve daha verimli olmasının arkasındaki nedendir.

Apriori algoritması hangi amaç için yararlıdır?

Apriori algoritması, veri madenciliğinde yaygın olarak kullanılan klasik bir algoritmadır. İlgili birliktelik kurallarının ve ayrıca mevcut veri tabanından sık kullanılan öğe kümelerinin madenciliği için gerçekten yararlıdır. Genellikle bu algoritma, çok sayıda işlemden oluşan bir veritabanını işlemek zorunda olan kuruluşlar tarafından kullanılır. Örneğin, apriori algoritması, müşterilerin mağazanızdan sıklıkla satın aldığı ürünleri belirlemeyi oldukça kolaylaştırır. Bu algoritmanın yardımıyla pazar satışları oldukça iyileştirilebilir.

Bunun dışında sağlık sektöründe de advers ilaç reaksiyonlarının tespiti için bu algoritma kullanılmaktadır. Algoritma, advers ilaç reaksiyonlarına yol açabilecek tüm hasta özellikleri ve ilaç kombinasyonlarını belirlemek için birliktelik kuralları üretir.

Apriori algoritmasının artıları ve eksileri nelerdir?

Apriori algoritmasının uygulanması, anlaşılması oldukça kolaydır ve büyük öğe kümelerinde çok verimli bir şekilde kullanılabilir. Bazen çok sayıda aday kural bulma ihtiyacı olabilir ve bu süreç hesaplama açısından biraz pahalı olabilir. Tüm veri tabanından geçmesi gerektiğinden, desteği hesaplamak da pahalıdır.