Bilmeniz Gereken Yapay Zeka Algoritma Türleri [Tam Bir Kılavuz]

Yayınlanan: 2019-11-13

Yapay Zeka , dünya üzerinde önemli bir etkiye sahip olacak şekilde büyüdü. Farklı uygulamalar ve kaynaklar tarafından üretilen büyük miktarda veriyle, makine öğrenimi sistemleri test verilerinden öğrenebilir ve akıllı görevler gerçekleştirebilir.

Yapay Zeka, makinelere belirleyici yetenek ve düşünme yeteneği kazandırmakla ilgilenen bilgisayar bilimi alanıdır. Yapay Zeka bu nedenle bilgisayar bilimi, veri analitiği ve saf matematiğin bir karışımıdır.

Makine öğrenimi, Yapay Zekanın ayrılmaz bir parçası haline gelir ve yalnızca girdi verilerinden öğrenme süreci olan ilk kısımla ilgilenir. Yapay Zeka ve faydaları bizi şaşırtmaktan asla vazgeçmedi.

Kariyerinizi hızlandırmak için Dünyanın En İyi Üniversiteleri - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zeka alanında İleri Düzey Sertifika Programından çevrimiçi olarak AI Kurslarına katılın .

İçindekiler

Yapay Zeka Algoritma Türleri

Yapay zeka algoritmaları genel olarak şu şekilde sınıflandırılabilir:

1. Sınıflandırma Algoritmaları

Sınıflandırma algoritmaları, denetimli öğrenmenin bir parçasıdır. Bu algoritmalar, tabi tutulan değişkeni farklı sınıflara bölmek ve ardından verilen bir girdi için sınıfı tahmin etmek için kullanılır. Örneğin, e-postaları spam olarak sınıflandırmak için sınıflandırma algoritmaları kullanılabilir. Yaygın olarak kullanılan sınıflandırma algoritmalarından bazılarını tartışalım.

a) Naif Bayes

Naive Bayes algoritması, Bayes teoremi üzerinde çalışır ve diğer sınıflandırma algoritmalarından farklı olarak olasılıksal bir yaklaşım benimser. Algoritmanın her sınıf için bir dizi ön olasılığı vardır. Veri beslendikten sonra, algoritma bu olasılıkları güncelleyerek sonsal olasılık olarak bilinen bir şey oluşturur. Bu, girdinin belirli bir sınıf listesine ait olup olmadığını tahmin etmeniz gerektiğinde kullanışlıdır.

b) Karar Ağacı

Karar ağacı algoritması, düğümlerin bir girdi özniteliği üzerindeki testi temsil ettiği ve dalların testin sonucunu temsil ettiği bir algoritma gibi daha çok bir akış şemasıdır.

c) Rastgele Orman

Rastgele orman, bir grup ağaç gibi çalışır. Girdi veri seti alt bölümlere ayrılır ve farklı karar ağaçlarına beslenir. Tüm karar ağaçlarından elde edilen çıktıların ortalaması dikkate alınır. Rastgele ormanlar, Karar ağacı algoritmasına kıyasla daha doğru bir sınıflandırıcı sunar.

d) Destek Vektör Makineleri

SVM, hiperdüzlem ile destek vektörleri arasındaki mesafenin maksimum olduğundan emin olarak, bir hiperdüzlem kullanarak verileri sınıflandıran bir algoritmadır.

e) K En Yakın Komşular

KNN algoritması, yeni bir örnek veri noktasının sınıfını tahmin etmek için sınıflara ayrılmış bir grup veri noktası kullanır. Diğer algoritmalara göre nispeten kısa olduğu için “tembel öğrenme algoritması” olarak adlandırılır.

2. Regresyon Algoritmaları

Regresyon algoritmaları, denetimli makine öğrenimi algoritmaları altında popüler bir algoritmadır. Regresyon algoritmaları, öğrenme sisteminde beslenen girdi veri noktalarına dayalı olarak çıktı değerlerini tahmin edebilir. Regresyon algoritmalarının ana uygulaması, borsa fiyatını tahmin etmeyi, hava durumunu tahmin etmeyi vb. içerir. Bu bölümdeki en yaygın algoritmalar şunlardır:

a) Doğrusal regresyon

Tutarlı değişkenleri göz önünde bulundurarak gerçek nitelikleri ölçmek için kullanılır. Tüm regresyon algoritmalarının en basitidir, ancak yalnızca doğrusal ilişki veya doğrusal olarak ayrılabilir bir problem durumunda uygulanabilir. Algoritma, en uygun çizgi veya regresyon çizgisi olarak adlandırılan veri noktaları arasında düz bir çizgi çizer ve yeni değerleri tahmin etmek için kullanılır.

Okuyun: Doğrusal Regresyon – Makine Öğrenimi Mülakat Soruları ve Cevapları

b) Kement Regresyonu

Kement regresyon algoritması, bir yanıt değişkeni için tahmin hatasını en aza indiren tahmin edicilerin alt kümesini elde ederek çalışır. Bu, veri noktalarına bir kısıtlama getirerek ve bazılarının sıfır değerine küçülmesine izin vererek elde edilir.

c) Lojistik Regresyon

Lojistik regresyon esas olarak ikili sınıflandırma için kullanılır. Bu yöntem, bir dizi değişkeni analiz etmenize ve kategorik bir sonucu tahmin etmenize olanak tanır. Birincil uygulamaları, müşteri yaşam boyu değerini, ev değerlerini vb. tahmin etmeyi içerir.

d) Çok Değişkenli Regresyon

Bu algoritma, birden fazla tahmin değişkeni olduğunda kullanılmalıdır. Bu algoritma, müşterilerin tercih ettiği ürünlerin marka, kalite, fiyat, inceleme vb. gibi birçok faktöre bağlı olduğu perakende sektörü ürün tavsiye motorlarında yaygın olarak kullanılmaktadır.

e) Çoklu Regresyon Algoritması

Çoklu Regresyon Algoritması, girdi olarak birden fazla açıklayıcı değişkeni alan lineer regresyon ve lineer olmayan regresyon algoritmalarının bir kombinasyonunu kullanır. Ana uygulamalar arasında sosyal bilim araştırması, sigorta talebinin gerçekliği, davranış analizi vb.

3. Kümeleme Algoritmaları

Kümeleme, grup üyeleri içindeki benzerliklere dayalı olarak veri noktalarını gruplara ayırma ve düzenleme sürecidir. Bu denetimsiz öğrenmenin bir parçasıdır. Ana amaç benzer öğeleri gruplandırmaktır. Örneğin, işlemdeki bazı özelliklere göre hileli nitelikteki tüm işlemleri bir arada düzenleyebilir. Aşağıda en yaygın kümeleme algoritmaları bulunmaktadır.

a) K-Ortalamalar Kümeleme

En basit denetimsiz öğrenme algoritmasıdır. Algoritma, benzer veri noktalarını bir araya toplar ve ardından bunları bir kümede birleştirir. Kümeleme, veri noktaları grubunun ağırlık merkezi hesaplanarak ve ardından her bir veri noktasının kümenin merkezinden uzaklığı değerlendirilerek yapılır. Mesafeye bağlı olarak, analiz edilen veri noktası daha sonra en yakın kümeye atanır. K-araçlarındaki 'K', veri noktalarının gruplandırıldığı küme sayısı anlamına gelir.

b) Bulanık C-ortalamalar Algoritması

FCM algoritması olasılık üzerinde çalışır. Her veri noktasının başka bir kümeye ait olma olasılığına sahip olduğu kabul edilir. Veri noktalarının belirli bir küme üzerinde mutlak bir üyeliği yoktur ve bu nedenle algoritmaya bulanık denir.

c) Beklenti-Maksimizasyon (EM) Algoritması

İstatistikte öğrendiğimiz Gauss dağılımına dayanmaktadır. Sorunu çözmek için veriler bir Gauss dağılım modeline dönüştürülür. Bir olasılık atadıktan sonra, beklenti ve maksimizasyon denklemlerine dayalı olarak bir nokta örneği hesaplanır.

d) Hiyerarşik Kümeleme Algoritması

Bu algoritmalar, veri noktalarını öğrendikten ve benzerlik gözlemleri yaptıktan sonra kümeleri hiyerarşik olarak sıralar. İki tip olabilir

  • Yukarıdan aşağıya bir yaklaşım için bölücü kümeleme
  • Aşağıdan yukarıya bir yaklaşım için aglomeratif kümeleme

Toplayalım ve sonuçlandıralım

AI, dünyayı birçok kez şaşırttı ve gerçek dünyada karmaşık sorunlarını çözmek için birçok uygulamaya sahip. Bu makalenin çeşitli Yapay Zeka algoritmalarına ve bunların geniş sınıflandırmalarına biraz ışık tuttuğunu umuyoruz. Algoritmalar, sahip olduğumuz veri noktalarının ihtiyacına ve doğasına göre seçilir.

Algoritmaların doğruluk, performans ve işlem süresi açısından avantajları ve dezavantajları vardır. Bunlar sadece birkaç algoritma. Daha fazlasını öğrenmeye meraklıysanız, yukarıGrad ve IIIT-B'nin Makine Öğrenimi ve Yapay Zeka alanında Yönetici PG Programına göz atın.

Naif bayes nedir?

Bayes teoremi, bu listedeki diğer algoritmalardan farklı olarak olasılıksal bir yaklaşım benimseyen Naive Bayes algoritmasında kullanılır. Bu basitçe, yöntemin, doğrudan verilere sıçramak yerine, hedefiniz için sınıflandırmaların her biri için önceden belirlenmiş bir dizi olasılığa sahip olduğu anlamına gelir. Algoritma, verileri beslediğinizde sonraki olasılığı oluşturmak için bu önceki olasılıkları değiştirir. Sonuç olarak, girdinizin n sınıftan birine karşılık gelip gelmediğini veya hiçbirine karşılık gelmediğini tahmin etmeniz gereken durumlarda bu inanılmaz derecede faydalı olabilir. Bu, olasılıksal bir teknik kullanılarak yapılabilir, çünkü tüm n sınıfları için atılan olasılıklar oldukça düşük olacaktır.

Karar ağacı nedir?

Karar Ağacı, her bir dış düğümün bir öznitelik üzerinde bir denemeyi temsil ettiği ve her dalın testin sonucunu gösterdiği akış şeması benzeri bir ağaç yapısıdır. Beklenen etiketler yaprak düğümlerinde saklanır. Ağacın kökünden başlıyoruz ve öznitelik değerlerini karşılaştırarak yaprak düğümüne doğru ilerliyoruz. Yüksek boyutlu verilerle uğraşırken ve veri hazırlamaya çok az zaman harcanırken, bu sınıflandırıcıyı kullanırız. Bununla birlikte, bir uyarı: fazla takılmaya eğilimlidirler ve eğitim verilerindeki küçük değişikliklerle bile önemli ölçüde değişebilirler.

Destek vektör makinesi nedir?

Veri noktalarını mümkün olduğu kadar geniş iki sınıf arasındaki marjlarla sıralamaya çalıştığı ölçüde, bir SVM benzersizdir. Bu, maksimum marj ayrımı olarak adlandırılır. Akılda tutulması gereken bir başka nokta da, doğrusal regresyondan farklı olarak, SVM'lerin hiper düzlemi yalnızca destek vektörlerini kullanarak çizmesi, doğrusal regresyonun ise tam veri kümesini kullanmasıdır. SVM'ler, verilerin çok sayıda boyutu olduğu durumlarda özellikle faydalıdır. Rastgele bir hiperdüzlem oluşturarak, ardından onunla her sınıftan en yakın veri değerleri arasındaki mesafeyi ölçerek başlarsınız. Destek vektörleri, hiper düzleme en yakın olan veri noktalarıdır.