Yeni Başlayanlar İçin Python'da En İyi Makine Öğrenimi Projeleri [2022]

Yayınlanan: 2021-01-03

Bir makine öğrenimi uzmanı olmak istiyorsanız, teknolojilerini kullanarak deneyim kazanmanız gerekir. Bunu yapmanın en iyi yolu projeleri tamamlamaktır. Bu nedenle bu makalede, becerilerinizi hızla test etmeye ve değerli deneyimler kazanmaya başlayabilmeniz için Python'da birden çok makine öğrenimi projesini paylaşıyoruz.

Ancak, başlamadan önce, makine öğrenimi ve algoritmasına aşina olduğunuzdan emin olun. Daha önce bir proje üzerinde çalışmadıysanız endişelenmeyin çünkü biz de bir projeyle ilgili ayrıntılı bir eğitim paylaştık:

İçindekiler

Iris Veri Kümesi: Yeni Başlayanlar İçin

Iris veri seti, Python'daki en popüler makine öğrenimi projelerinden biridir. Nispeten küçüktür, ancak sadeliği ve kompakt boyutu onu yeni başlayanlar için mükemmel kılar. Python'da herhangi bir makine öğrenimi projesinde çalışmadıysanız, onunla başlamalısınız. İris veri seti, İris çiçeğinin çanak yaprağı ve taç yaprağı boyutlarının bir koleksiyonudur. Her birinde 50 örnek bulunan üç sınıfı vardır.

Çeşitli yerlerde örnek kod sağladık, ancak bunu yalnızca nasıl çalıştığını anlamak için kullanmalısınız. Kodu anlamadan uygulamak, projeyi gerçekleştirmenin öncülünde başarısız olur. Bu nedenle, uygulamadan önce kodu iyi anladığınızdan emin olun.

Adım 1: Kitaplıkları İçe Aktarın

Herhangi bir makine öğrenimi projesinin ilk adımı kitaplıkları içe aktarmaktır. Python'un bu kadar çok yönlü olmasının birincil nedeni, sağlam kitaplıklarından kaynaklanmaktadır. Bu projede ihtiyaç duyacağımız kütüphaneler:

  • pandalar
  • matplotlib
  • Sklearn
  • bilim
  • Dizi

Kitaplıkları sisteminize aktarmanın birden çok yöntemi vardır ve tüm kitaplıkları içe aktarmak için belirli bir yol kullanmalısınız. Tutarlılığı sağlar ve herhangi bir karışıklığı önlemenize yardımcı olur. Kurulumun cihazınızın İşletim Sistemine göre değiştiğini unutmayın, bu nedenle kitaplıkları içe aktarırken bunu aklınızda bulundurun.

Kod:

# Kitaplıkları yükle

pandalardan read_csv içe aktar

pandas.plotting'den içe aktarma scatter_matrix

matplotlib'den import pyplot

sklearn.model_selection'dan train_test_split'i içe aktarın

sklearn.model_selection'dan cross_val_score'u içe aktarın

sklearn.model_selection'dan StratifiedKFold'u içe aktarın

sklearn.metrics'den sınıflandırma_reportunu içe aktar

sklearn.metrics'den configuration_matrix'i içe aktarın

sklearn.metrics'den doğruluk_score'u içe aktarın

sklearn.linear_model'den LogisticRegression'ı içe aktarın

sklearn.tree'den DecisionTreeClassifier'ı içe aktarın

sklearn.neighbors'dan KNeighborsClassifier'ı içe aktarın

sklearn.discriminant_analysis'den LinearDiscriminantAnalysis'i içe aktarın

sklearn.naive_bayes'den GaussianNB'yi içe aktarın

sklearn.svm'den SVC'yi içe aktar

Okuyun: Yeni Başlayanlar İçin En İyi 10 Makine Öğrenimi Veri Kümesi Proje Fikirleri

2. Adım: Veri Kümesini Yükleyin

Kitaplıkları içe aktardıktan sonra veri kümesini yükleme zamanı. Tartıştığımız gibi, bu projede Iris veri setini kullanacağız. Buradan indirebilirsiniz .

Verileri yüklerken her sütunun adını belirttiğinizden emin olun, bu size daha sonra projede yardımcı olacaktır. Veri kümesini indirmenizi öneririz, böylece bağlantı sorunlarıyla karşılaşsanız bile projeniz etkilenmeyecektir.

Kod:

# Veri kümesini yükle

url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”

isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']

veri kümesi = read_csv(url, adlar=adlar)

3. Adım: Özetleme

Veri setini kullanmaya başlamadan önce, içinde mevcut olan verilere bakmalıyız. Veri kümesinin beş özniteliği ve 150 örneği olduğunu bize gösteren veri kümesinin boyutunu kontrol ederek başlayacağız.

Boyutu kontrol ettikten sonra, içeriği hakkında size genel bir fikir vermesi için veri kümesinin birkaç satırına ve sütununa bakmalısınız. Ardından, veri kümesinin istatistiksel özetine bakmalı ve aynı metriklerde hangi metriklerin en yaygın olduğunu görmelisiniz.

Son olarak, veri kümesindeki sınıf dağılımını kontrol etmelisiniz. Bu, her sınıfa kaç örneğin düştüğünü kontrol etmeniz gerektiği anlamına gelir. Veri kümemizi özetlemek için kod:

# verileri özetle

pandalardan read_csv içe aktar

# Veri kümesini yükle

url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”

isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']

veri kümesi = read_csv(url, adlar=adlar)

# şekil

yazdır(veri kümesi.şekil)

# kafa

yazdır(veri kümesi.kafa(20))

# Açıklamalar

yazdır(veri kümesi.describe())

# sınıf dağılımı

print(dataset.groupby('class').size())

Adım 4: Verileri Görselleştirin

Veri setini özetledikten sonra daha iyi anlamak ve analiz edebilmek için görselleştirmelisiniz. Her özelliği ayrıntılı olarak analiz etmek için tek değişkenli grafikler ve her özelliğin ilişkilerini incelemek için çok değişkenli grafikler kullanabilirsiniz. Veri görselleştirme, veri kümesinde bulunan temel bilgileri bulmaya yardımcı olduğu için makine öğrenimi projelerinin çok önemli bir yönüdür.

Adım 5: Algoritma Değerlendirmesi

Verileri görselleştirdikten sonra, projemiz için en iyi modeli bulmak için birkaç algoritmayı değerlendireceğiz. İlk olarak, orijinal olandan çıkaracağımız bir doğrulama veri seti oluşturacağız. Ardından 10 kat çapraz doğrulama uygulayacağız ve çeşitli modeller oluşturacağız. Daha önce tartışıldığı gibi, çiçeklerin ölçümleri yoluyla türleri tahmin etmeyi amaçlıyoruz. Farklı türde algoritmalar kullanmalı ve en iyi sonucu vereni seçmelisiniz. SVM (Destek Vektör Makineleri), KNN (K-En Yakın Komşular), LR (Lojistik Regresyon) ve diğerlerini test edebilirsiniz.

Uygulamamızda en iyi modelin SVM olduğunu gördük. İşte kod:

pandalardan read_csv içe aktar

matplotlib'den import pyplot

sklearn.model_selection'dan train_test_split'i içe aktarın

sklearn.model_selection'dan cross_val_score'u içe aktarın

sklearn.model_selection'dan StratifiedKFold'u içe aktarın

sklearn.linear_model'den LogisticRegression'ı içe aktarın

sklearn.tree'den DecisionTreeClassifier'ı içe aktarın

sklearn.neighbors'dan KNeighborsClassifier'ı içe aktarın

sklearn.discriminant_analysis'den LinearDiscriminantAnalysis'i içe aktarın

sklearn.naive_bayes'den GaussianNB'yi içe aktarın

sklearn.svm'den SVC'yi içe aktar

# Veri kümesini yükle

url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”

isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']

veri kümesi = read_csv(url, adlar=adlar)

# Bölünmüş doğrulama veri kümesi

dizi = veri kümesi.değerler

X = dizi[:,0:4]

y = dizi[:,4]

X_train, X_validation, Y_train, Y_validation = train_test_split(X, y, test_size=0.20, random_state=1, shuffle=True)

# Nokta Kontrol Algoritmaları

modeller = []

modeller.append(('LR', LogisticRegression(solver='liblinear', multi_class='ovr')))

modeller.append(('LDA', LinearDiscriminantAnalysis()))

modeller.append(('KNN', KNeighborsClassifier()))

modeller.append(('SEPET', DecisionTreeClassifier()))

modeller.append(('NB', GaussianNB()))

modeller.append(('SVM', SVC(gamma='auto')))

# sırayla her modeli değerlendirin

sonuçlar = []

isimler = []

isim için, modellerde model:

kfold = KatmanlıKFold(n_splits=10, random_state=1, shuffle=Doğru)

cv_results = cross_val_score(model, X_train, Y_train, cv=kfold, puanlama='doğruluk')

sonuçlar.append(cv_results)

isimler.append(isim)

print('%s: %f (%f)' % (ad, cv_results.mean(), cv_results.std()))

# Algoritmaları Karşılaştır

pyplot.boxplot(sonuçlar, etiketler=adlar)

pyplot.title('Algoritma Karşılaştırması')

pyplot.show()

6. Adım: Tahmin

Farklı algoritmaları değerlendirip en iyisini seçtikten sonra sıra sonuçları tahmin etmeye geliyor. Doğruluğunu test etmek için önce modelimizi doğrulama veri kümesinde kullanacağız. Bundan sonra, tüm veri kümesi üzerinde test edeceğiz.

Modelimizi veri kümesinde çalıştırmanın kodu:

# tahmin yap

pandalardan read_csv içe aktar

sklearn.model_selection'dan train_test_split'i içe aktarın

sklearn.metrics'den sınıflandırma_reportunu içe aktar

sklearn.metrics'den configuration_matrix'i içe aktarın

sklearn.metrics'den doğruluk_score'u içe aktarın

sklearn.svm'den SVC'yi içe aktar

# Veri kümesini yükle

url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”

isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']

veri kümesi = read_csv(url, adlar=adlar)

# Bölünmüş doğrulama veri kümesi

dizi = veri kümesi.değerler

X = dizi[:,0:4]

y = dizi[:,4]

X_train, X_validation, Y_train, Y_validation = train_test_split(X, y, test_size=0.20, random_state=1)

# Doğrulama veri kümesi üzerinde tahminler yapın

model = SVC(gama='otomatik')

model.fit(X_tren, Y_tren)

tahminler = model.predict(X_validation)

# Tahminleri değerlendirin

print(accuracy_score(Y_validation, tahminler))

print(confusion_matrix(Y_validation, tahminler))

print(classification_report(Y_validation, tahminler))

Bu kadar. Artık Iris veri kümesini kullanarak Python'da bir makine öğrenimi projesini tamamladınız.

Python'da Ek Makine Öğrenimi Projeleri

Iris veri seti öncelikle yeni başlayanlar içindir. Python'da makine öğrenimi projelerinde çalışma deneyiminiz varsa, aşağıdaki projelere bakmalısınız:

1. Hisse Senedi Fiyatlarını Tahmin Etmek İçin ML Kullanın

Hisse senedi piyasası, makine öğrenimi algoritmalarını uygulamak için mükemmel bir yerdir. Şirketler, bir süredir teknik analiz yapmak için yapay zeka algoritmaları ve makine öğrenimi tabanlı teknolojiler kullanıyor. Hisse senedi fiyatlarını tahmin eden bir ML modeli de oluşturabilirsiniz.

Ancak, bu proje üzerinde çalışmak için, regresyon analizi, tahmine dayalı analiz, istatistiksel modelleme ve eylem analizi dahil olmak üzere çeşitli teknikler kullanmanız gerekecek. Gerekli verileri borsaların resmi web sitelerinden edinebilirsiniz. Hisselerin geçmiş performanslarına ilişkin verileri paylaşırlar. Bu verileri modelinizi eğitmek ve test etmek için kullanabilirsiniz.

Yeni başlayan biri olarak, belirli bir şirkete odaklanabilir ve üç aylık hisse senedi değerini tahmin edebilirsiniz. Benzer şekilde, projeyi zorlaştırmak istiyorsanız, birden fazla şirket kullanabilir ve tahmin zaman çizelgelerinizi uzatabilirsiniz.

Bu Projeden Öğrenecekleriniz:

Bu proje, finans endüstrisindeki AI ve ML uygulamalarına aşina olmanızı sağlayacaktır. Siz de bu proje üzerinden tahmine dayalı analiz çalışabilir ve farklı algoritmalar deneyebilirsiniz.

2. Sıfırdan Bir Makine Öğrenimi Algoritması Yazın

Yeni başlayan biriyseniz ve Python'da herhangi bir makine öğrenimi projesinde çalışmadıysanız, bununla da başlayabilirsiniz. Bu projede sıfırdan bir ML algoritması oluşturmanız gerekiyor. Bu projeyi yapmak, matematiksel formülleri makine öğrenimi koduna dönüştürmeyi öğretirken, algoritmanın işlevlerinin tüm temellerini anlamanıza yardımcı olacaktır.

Gelecekte birçok kez uygulamanız gerekeceğinden, matematiksel kavramları ML koduna nasıl dönüştüreceğinizi bilmek çok önemlidir. Daha ileri düzey sorunları çözeceğiniz için bu beceriye güvenmeniz gerekecek. Kavramlarına aşina olduğunuza göre herhangi bir algoritma seçebilirsiniz. Tecrübeniz yoksa basit bir algoritma ile başlamak en iyisi olacaktır.

Bu Projeden Öğrenecekleriniz:

Yapay zeka ve makine öğreniminin matematiksel kavramlarına aşina olacaksınız.

3. Bir El Yazısı Okuyucusu Oluşturun

Bu bir bilgisayar vizyonu projesidir. Bilgisayarla görme, görüntü analizi ile ilgili yapay zeka sektörüdür. Bu projede, el yazısını okuyabilen bir ML modeli oluşturacaksınız. Okuma, modelin kağıda yazılanları tanıması gerektiği anlamına gelir. Derin öğrenme ve bununla ilgili kavramlara aşina olmak için bu projede bir sinir ağı kullanmanız gerekir.

Önce görüntüyü önceden işlemeniz ve gereksiz bölümleri kaldırmanız gerekir; başka bir deyişle, netlik için görüntü üzerinde veri temizliği yapın. Bundan sonra, algoritmanın karakterleri doğru bir şekilde okuyabilmesi için görüntünün segmentasyonunu ve yeniden boyutlandırılmasını yapmanız gerekecektir. Ön işlemeyi ve segmentasyonu tamamladıktan sonra, bir sonraki adım olan sınıflandırmaya geçebilirsiniz. Bir sınıflandırma algoritması, metinde bulunan karakterleri ayırt edecek ve onları ilgili kategorilerine yerleştirecektir.

Bu proje için ML algoritmanızı eğitmek için log sigmoid aktivasyonunu kullanabilirsiniz.

Bu Projeden Öğrenecekleriniz:

Bilgisayarla görü ve sinir ağları üzerinde çalışacaksınız. Bu projeyi tamamlamak, görüntü tanıma ve analizine de aşina olmanızı sağlayacaktır.

4. Bir Satış Tahmincisi

Perakende sektörü, yapay zeka ve makine öğrenimi için birçok uygulamaya sahiptir. Bu projede, ürün satışlarını tahmin eden böyle bir uygulama keşfedeceksiniz.

Makine öğrenimi meraklıları arasında yaygın bir veri kümesi, BigMart satış veri kümesidir. 10 şehirde çeşitli satış noktalarına yayılmış 1559'dan fazla ürüne sahiptir. Bir regresyon modeli oluşturmak için veri kümesini kullanabilirsiniz. Satış noktalarına göre, modelinizin önümüzdeki yıl belirli ürünlerin potansiyel satışlarını tahmin etmesi gerekiyor. Bu veri kümesi, özelliklerini ve ikisi arasındaki ilişkiyi hızlı bir şekilde anlamak için her satış noktası ve ürün için belirli niteliklere sahiptir.

Bu Projeden Öğrenecekleriniz:

Bu proje üzerinde çalışmak, sizi regresyon modelleri ve tahmine dayalı analiz hakkında bilgilendirecektir. Ayrıca perakende sektöründe makine öğrenimi uygulamaları hakkında bilgi edineceksiniz.

Makine Öğrenimi ve Python Hakkında Daha Fazla Bilgi Edinin

Python'daki bu makine öğrenimi projeleri listesini faydalı bulduğunuzu umuyoruz. Herhangi bir sorunuz veya düşünceniz varsa, lütfen yorum bölümünden bize bildirin. Sorularınıza cevap vermeyi çok isteriz.

Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.

Makine öğrenimi ve Python'u incelemek için bazı ek kaynakları burada bulabilirsiniz.

  • Python Eğitimi
  • Makine Öğrenimi Vs. Derin Öğrenme
  • Makine Öğrenimi Uygulamaları

Öte yandan, daha kişiselleştirilmiş bir öğrenme deneyimi yaşamak istiyorsanız AI ve ML kursuna katılabilirsiniz. Videolar, ödevler ve projeler aracılığıyla sektör uzmanlarından bilgi edineceksiniz.

Makine öğrenimi iyi bir kariyer seçimi midir?

Gelişmekte olan teknolojilere ve ilgili haberlere meraklıysanız, makine öğrenimi teknolojisinin getirdiği dördüncü sanayi devrimini zaten duymuş olmalısınız. Raporlara göre, küresel makine öğrenimi pazarının 2023 yılına kadar 543 milyar INR değerine ulaşması bekleniyor. Ancak, yetkin makine öğrenimi profesyonellerinin arz ve talebi arasındaki fark neredeyse yüzde 125'e yükseldi. Bu, doğru beceriler kombinasyonuna sahip bir makine öğrenimi uzmanı için iş piyasasının birçok vaatte bulunduğunu gösterir. İster makine öğrenimi mühendisi, ister araştırma mühendisi ya da araştırma bilimcisi olmayı hedefliyor olun, şüphesiz bu sizin için zenginleştirici bir kariyer olacaktır.

Daha taze bir çanta, bir makine öğrenimi işi olabilir mi?

Günümüzde makine öğrenimi işlerinin çoğu deneyimli profesyoneller gerektirse de, pazardaki muazzam talep nedeniyle yeni başlayanlar için seçenekler de artıyor. Yeni başlayanlar için zor olabilir, ancak bir makine öğrenimi işi almak kesinlikle imkansız değildir. Gerekli becerilerde ustalaşabilir, nasıl iyi performans göstereceğinizi planlayabilir ve sahadaki deneyimli oyunculardan hızlı bir şekilde öğrenebilirseniz, hayalinizdeki işi de yapabilirsiniz. Daha fazla değer katmak için ilgili sertifikalar almak, güvenilir platformlarda makine öğrenimi kurslarına kaydolmak, uygulamalı projeler denemek, en son teknoloji haberlerini ve trendleri takip etmek ve çevrimiçi topluluklara katılmak gibi seçenekleri değerlendirebilirsiniz.

Bir makine öğrenimi mühendisi ne kadar kazanır?

Glassdoor.in'den alınan verilere göre, Hindistan'da bir makine öğrenimi mühendisi tarafından alınan ortalama maaş, yılda yaklaşık 8,2 lakh INR'dir. Şimdi, ortalama gelir beceriler, sertifikalar, deneyim, konum ve daha fazlası gibi çeşitli faktörlere bağlıdır. Ancak daha fazla iş tecrübesi ile kazancınızı artırmayı bekleyebilirsiniz. Örneğin, kıdemli makine öğrenimi mühendisleri ortalama olarak 13 ila 15 lakh INR aralığında kazanabilir.