Yeni Başlayanlar İçin Python'da En İyi Makine Öğrenimi Projeleri [2022]
Yayınlanan: 2021-01-03Bir makine öğrenimi uzmanı olmak istiyorsanız, teknolojilerini kullanarak deneyim kazanmanız gerekir. Bunu yapmanın en iyi yolu projeleri tamamlamaktır. Bu nedenle bu makalede, becerilerinizi hızla test etmeye ve değerli deneyimler kazanmaya başlayabilmeniz için Python'da birden çok makine öğrenimi projesini paylaşıyoruz.
Ancak, başlamadan önce, makine öğrenimi ve algoritmasına aşina olduğunuzdan emin olun. Daha önce bir proje üzerinde çalışmadıysanız endişelenmeyin çünkü biz de bir projeyle ilgili ayrıntılı bir eğitim paylaştık:
İçindekiler
Iris Veri Kümesi: Yeni Başlayanlar İçin
Iris veri seti, Python'daki en popüler makine öğrenimi projelerinden biridir. Nispeten küçüktür, ancak sadeliği ve kompakt boyutu onu yeni başlayanlar için mükemmel kılar. Python'da herhangi bir makine öğrenimi projesinde çalışmadıysanız, onunla başlamalısınız. İris veri seti, İris çiçeğinin çanak yaprağı ve taç yaprağı boyutlarının bir koleksiyonudur. Her birinde 50 örnek bulunan üç sınıfı vardır.
Çeşitli yerlerde örnek kod sağladık, ancak bunu yalnızca nasıl çalıştığını anlamak için kullanmalısınız. Kodu anlamadan uygulamak, projeyi gerçekleştirmenin öncülünde başarısız olur. Bu nedenle, uygulamadan önce kodu iyi anladığınızdan emin olun.
Adım 1: Kitaplıkları İçe Aktarın
Herhangi bir makine öğrenimi projesinin ilk adımı kitaplıkları içe aktarmaktır. Python'un bu kadar çok yönlü olmasının birincil nedeni, sağlam kitaplıklarından kaynaklanmaktadır. Bu projede ihtiyaç duyacağımız kütüphaneler:
- pandalar
- matplotlib
- Sklearn
- bilim
- Dizi
Kitaplıkları sisteminize aktarmanın birden çok yöntemi vardır ve tüm kitaplıkları içe aktarmak için belirli bir yol kullanmalısınız. Tutarlılığı sağlar ve herhangi bir karışıklığı önlemenize yardımcı olur. Kurulumun cihazınızın İşletim Sistemine göre değiştiğini unutmayın, bu nedenle kitaplıkları içe aktarırken bunu aklınızda bulundurun.

Kod:
# Kitaplıkları yükle
pandalardan read_csv içe aktar
pandas.plotting'den içe aktarma scatter_matrix
matplotlib'den import pyplot
sklearn.model_selection'dan train_test_split'i içe aktarın
sklearn.model_selection'dan cross_val_score'u içe aktarın
sklearn.model_selection'dan StratifiedKFold'u içe aktarın
sklearn.metrics'den sınıflandırma_reportunu içe aktar
sklearn.metrics'den configuration_matrix'i içe aktarın
sklearn.metrics'den doğruluk_score'u içe aktarın
sklearn.linear_model'den LogisticRegression'ı içe aktarın
sklearn.tree'den DecisionTreeClassifier'ı içe aktarın
sklearn.neighbors'dan KNeighborsClassifier'ı içe aktarın
sklearn.discriminant_analysis'den LinearDiscriminantAnalysis'i içe aktarın
sklearn.naive_bayes'den GaussianNB'yi içe aktarın
sklearn.svm'den SVC'yi içe aktar
Okuyun: Yeni Başlayanlar İçin En İyi 10 Makine Öğrenimi Veri Kümesi Proje Fikirleri
2. Adım: Veri Kümesini Yükleyin
Kitaplıkları içe aktardıktan sonra veri kümesini yükleme zamanı. Tartıştığımız gibi, bu projede Iris veri setini kullanacağız. Buradan indirebilirsiniz .
Verileri yüklerken her sütunun adını belirttiğinizden emin olun, bu size daha sonra projede yardımcı olacaktır. Veri kümesini indirmenizi öneririz, böylece bağlantı sorunlarıyla karşılaşsanız bile projeniz etkilenmeyecektir.
Kod:
# Veri kümesini yükle
url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”
isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']
veri kümesi = read_csv(url, adlar=adlar)
3. Adım: Özetleme
Veri setini kullanmaya başlamadan önce, içinde mevcut olan verilere bakmalıyız. Veri kümesinin beş özniteliği ve 150 örneği olduğunu bize gösteren veri kümesinin boyutunu kontrol ederek başlayacağız.
Boyutu kontrol ettikten sonra, içeriği hakkında size genel bir fikir vermesi için veri kümesinin birkaç satırına ve sütununa bakmalısınız. Ardından, veri kümesinin istatistiksel özetine bakmalı ve aynı metriklerde hangi metriklerin en yaygın olduğunu görmelisiniz.
Son olarak, veri kümesindeki sınıf dağılımını kontrol etmelisiniz. Bu, her sınıfa kaç örneğin düştüğünü kontrol etmeniz gerektiği anlamına gelir. Veri kümemizi özetlemek için kod:
# verileri özetle
pandalardan read_csv içe aktar
# Veri kümesini yükle
url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”
isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']
veri kümesi = read_csv(url, adlar=adlar)
# şekil
yazdır(veri kümesi.şekil)
# kafa
yazdır(veri kümesi.kafa(20))
# Açıklamalar
yazdır(veri kümesi.describe())
# sınıf dağılımı
print(dataset.groupby('class').size())
Adım 4: Verileri Görselleştirin
Veri setini özetledikten sonra daha iyi anlamak ve analiz edebilmek için görselleştirmelisiniz. Her özelliği ayrıntılı olarak analiz etmek için tek değişkenli grafikler ve her özelliğin ilişkilerini incelemek için çok değişkenli grafikler kullanabilirsiniz. Veri görselleştirme, veri kümesinde bulunan temel bilgileri bulmaya yardımcı olduğu için makine öğrenimi projelerinin çok önemli bir yönüdür.
Adım 5: Algoritma Değerlendirmesi
Verileri görselleştirdikten sonra, projemiz için en iyi modeli bulmak için birkaç algoritmayı değerlendireceğiz. İlk olarak, orijinal olandan çıkaracağımız bir doğrulama veri seti oluşturacağız. Ardından 10 kat çapraz doğrulama uygulayacağız ve çeşitli modeller oluşturacağız. Daha önce tartışıldığı gibi, çiçeklerin ölçümleri yoluyla türleri tahmin etmeyi amaçlıyoruz. Farklı türde algoritmalar kullanmalı ve en iyi sonucu vereni seçmelisiniz. SVM (Destek Vektör Makineleri), KNN (K-En Yakın Komşular), LR (Lojistik Regresyon) ve diğerlerini test edebilirsiniz.
Uygulamamızda en iyi modelin SVM olduğunu gördük. İşte kod:
pandalardan read_csv içe aktar
matplotlib'den import pyplot
sklearn.model_selection'dan train_test_split'i içe aktarın
sklearn.model_selection'dan cross_val_score'u içe aktarın
sklearn.model_selection'dan StratifiedKFold'u içe aktarın
sklearn.linear_model'den LogisticRegression'ı içe aktarın
sklearn.tree'den DecisionTreeClassifier'ı içe aktarın
sklearn.neighbors'dan KNeighborsClassifier'ı içe aktarın
sklearn.discriminant_analysis'den LinearDiscriminantAnalysis'i içe aktarın
sklearn.naive_bayes'den GaussianNB'yi içe aktarın
sklearn.svm'den SVC'yi içe aktar
# Veri kümesini yükle
url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”
isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']
veri kümesi = read_csv(url, adlar=adlar)
# Bölünmüş doğrulama veri kümesi
dizi = veri kümesi.değerler
X = dizi[:,0:4]
y = dizi[:,4]
X_train, X_validation, Y_train, Y_validation = train_test_split(X, y, test_size=0.20, random_state=1, shuffle=True)
# Nokta Kontrol Algoritmaları
modeller = []
modeller.append(('LR', LogisticRegression(solver='liblinear', multi_class='ovr')))
modeller.append(('LDA', LinearDiscriminantAnalysis()))
modeller.append(('KNN', KNeighborsClassifier()))
modeller.append(('SEPET', DecisionTreeClassifier()))
modeller.append(('NB', GaussianNB()))
modeller.append(('SVM', SVC(gamma='auto')))
# sırayla her modeli değerlendirin
sonuçlar = []
isimler = []
isim için, modellerde model:
kfold = KatmanlıKFold(n_splits=10, random_state=1, shuffle=Doğru)

cv_results = cross_val_score(model, X_train, Y_train, cv=kfold, puanlama='doğruluk')
sonuçlar.append(cv_results)
isimler.append(isim)
print('%s: %f (%f)' % (ad, cv_results.mean(), cv_results.std()))
# Algoritmaları Karşılaştır
pyplot.boxplot(sonuçlar, etiketler=adlar)
pyplot.title('Algoritma Karşılaştırması')
pyplot.show()
6. Adım: Tahmin
Farklı algoritmaları değerlendirip en iyisini seçtikten sonra sıra sonuçları tahmin etmeye geliyor. Doğruluğunu test etmek için önce modelimizi doğrulama veri kümesinde kullanacağız. Bundan sonra, tüm veri kümesi üzerinde test edeceğiz.
Modelimizi veri kümesinde çalıştırmanın kodu:
# tahmin yap
pandalardan read_csv içe aktar
sklearn.model_selection'dan train_test_split'i içe aktarın
sklearn.metrics'den sınıflandırma_reportunu içe aktar
sklearn.metrics'den configuration_matrix'i içe aktarın
sklearn.metrics'den doğruluk_score'u içe aktarın
sklearn.svm'den SVC'yi içe aktar
# Veri kümesini yükle
url = “https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv”
isimler = ['sepal-uzunluk', 'sepal-genişlik', 'petal-uzunluk', 'petal-genişlik', 'sınıf']
veri kümesi = read_csv(url, adlar=adlar)
# Bölünmüş doğrulama veri kümesi
dizi = veri kümesi.değerler
X = dizi[:,0:4]
y = dizi[:,4]
X_train, X_validation, Y_train, Y_validation = train_test_split(X, y, test_size=0.20, random_state=1)
# Doğrulama veri kümesi üzerinde tahminler yapın
model = SVC(gama='otomatik')
model.fit(X_tren, Y_tren)
tahminler = model.predict(X_validation)
# Tahminleri değerlendirin
print(accuracy_score(Y_validation, tahminler))
print(confusion_matrix(Y_validation, tahminler))
print(classification_report(Y_validation, tahminler))
Bu kadar. Artık Iris veri kümesini kullanarak Python'da bir makine öğrenimi projesini tamamladınız.
Python'da Ek Makine Öğrenimi Projeleri
Iris veri seti öncelikle yeni başlayanlar içindir. Python'da makine öğrenimi projelerinde çalışma deneyiminiz varsa, aşağıdaki projelere bakmalısınız:
1. Hisse Senedi Fiyatlarını Tahmin Etmek İçin ML Kullanın
Hisse senedi piyasası, makine öğrenimi algoritmalarını uygulamak için mükemmel bir yerdir. Şirketler, bir süredir teknik analiz yapmak için yapay zeka algoritmaları ve makine öğrenimi tabanlı teknolojiler kullanıyor. Hisse senedi fiyatlarını tahmin eden bir ML modeli de oluşturabilirsiniz.
Ancak, bu proje üzerinde çalışmak için, regresyon analizi, tahmine dayalı analiz, istatistiksel modelleme ve eylem analizi dahil olmak üzere çeşitli teknikler kullanmanız gerekecek. Gerekli verileri borsaların resmi web sitelerinden edinebilirsiniz. Hisselerin geçmiş performanslarına ilişkin verileri paylaşırlar. Bu verileri modelinizi eğitmek ve test etmek için kullanabilirsiniz.
Yeni başlayan biri olarak, belirli bir şirkete odaklanabilir ve üç aylık hisse senedi değerini tahmin edebilirsiniz. Benzer şekilde, projeyi zorlaştırmak istiyorsanız, birden fazla şirket kullanabilir ve tahmin zaman çizelgelerinizi uzatabilirsiniz.
Bu Projeden Öğrenecekleriniz:
Bu proje, finans endüstrisindeki AI ve ML uygulamalarına aşina olmanızı sağlayacaktır. Siz de bu proje üzerinden tahmine dayalı analiz çalışabilir ve farklı algoritmalar deneyebilirsiniz.
2. Sıfırdan Bir Makine Öğrenimi Algoritması Yazın
Yeni başlayan biriyseniz ve Python'da herhangi bir makine öğrenimi projesinde çalışmadıysanız, bununla da başlayabilirsiniz. Bu projede sıfırdan bir ML algoritması oluşturmanız gerekiyor. Bu projeyi yapmak, matematiksel formülleri makine öğrenimi koduna dönüştürmeyi öğretirken, algoritmanın işlevlerinin tüm temellerini anlamanıza yardımcı olacaktır.
Gelecekte birçok kez uygulamanız gerekeceğinden, matematiksel kavramları ML koduna nasıl dönüştüreceğinizi bilmek çok önemlidir. Daha ileri düzey sorunları çözeceğiniz için bu beceriye güvenmeniz gerekecek. Kavramlarına aşina olduğunuza göre herhangi bir algoritma seçebilirsiniz. Tecrübeniz yoksa basit bir algoritma ile başlamak en iyisi olacaktır.
Bu Projeden Öğrenecekleriniz:
Yapay zeka ve makine öğreniminin matematiksel kavramlarına aşina olacaksınız.
3. Bir El Yazısı Okuyucusu Oluşturun
Bu bir bilgisayar vizyonu projesidir. Bilgisayarla görme, görüntü analizi ile ilgili yapay zeka sektörüdür. Bu projede, el yazısını okuyabilen bir ML modeli oluşturacaksınız. Okuma, modelin kağıda yazılanları tanıması gerektiği anlamına gelir. Derin öğrenme ve bununla ilgili kavramlara aşina olmak için bu projede bir sinir ağı kullanmanız gerekir.
Önce görüntüyü önceden işlemeniz ve gereksiz bölümleri kaldırmanız gerekir; başka bir deyişle, netlik için görüntü üzerinde veri temizliği yapın. Bundan sonra, algoritmanın karakterleri doğru bir şekilde okuyabilmesi için görüntünün segmentasyonunu ve yeniden boyutlandırılmasını yapmanız gerekecektir. Ön işlemeyi ve segmentasyonu tamamladıktan sonra, bir sonraki adım olan sınıflandırmaya geçebilirsiniz. Bir sınıflandırma algoritması, metinde bulunan karakterleri ayırt edecek ve onları ilgili kategorilerine yerleştirecektir.
Bu proje için ML algoritmanızı eğitmek için log sigmoid aktivasyonunu kullanabilirsiniz.
Bu Projeden Öğrenecekleriniz:
Bilgisayarla görü ve sinir ağları üzerinde çalışacaksınız. Bu projeyi tamamlamak, görüntü tanıma ve analizine de aşina olmanızı sağlayacaktır.
4. Bir Satış Tahmincisi
Perakende sektörü, yapay zeka ve makine öğrenimi için birçok uygulamaya sahiptir. Bu projede, ürün satışlarını tahmin eden böyle bir uygulama keşfedeceksiniz.
Makine öğrenimi meraklıları arasında yaygın bir veri kümesi, BigMart satış veri kümesidir. 10 şehirde çeşitli satış noktalarına yayılmış 1559'dan fazla ürüne sahiptir. Bir regresyon modeli oluşturmak için veri kümesini kullanabilirsiniz. Satış noktalarına göre, modelinizin önümüzdeki yıl belirli ürünlerin potansiyel satışlarını tahmin etmesi gerekiyor. Bu veri kümesi, özelliklerini ve ikisi arasındaki ilişkiyi hızlı bir şekilde anlamak için her satış noktası ve ürün için belirli niteliklere sahiptir.
Bu Projeden Öğrenecekleriniz:

Bu proje üzerinde çalışmak, sizi regresyon modelleri ve tahmine dayalı analiz hakkında bilgilendirecektir. Ayrıca perakende sektöründe makine öğrenimi uygulamaları hakkında bilgi edineceksiniz.
Makine Öğrenimi ve Python Hakkında Daha Fazla Bilgi Edinin
Python'daki bu makine öğrenimi projeleri listesini faydalı bulduğunuzu umuyoruz. Herhangi bir sorunuz veya düşünceniz varsa, lütfen yorum bölümünden bize bildirin. Sorularınıza cevap vermeyi çok isteriz.
Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.
Makine öğrenimi ve Python'u incelemek için bazı ek kaynakları burada bulabilirsiniz.
- Python Eğitimi
- Makine Öğrenimi Vs. Derin Öğrenme
- Makine Öğrenimi Uygulamaları
Öte yandan, daha kişiselleştirilmiş bir öğrenme deneyimi yaşamak istiyorsanız AI ve ML kursuna katılabilirsiniz. Videolar, ödevler ve projeler aracılığıyla sektör uzmanlarından bilgi edineceksiniz.
Makine öğrenimi iyi bir kariyer seçimi midir?
Gelişmekte olan teknolojilere ve ilgili haberlere meraklıysanız, makine öğrenimi teknolojisinin getirdiği dördüncü sanayi devrimini zaten duymuş olmalısınız. Raporlara göre, küresel makine öğrenimi pazarının 2023 yılına kadar 543 milyar INR değerine ulaşması bekleniyor. Ancak, yetkin makine öğrenimi profesyonellerinin arz ve talebi arasındaki fark neredeyse yüzde 125'e yükseldi. Bu, doğru beceriler kombinasyonuna sahip bir makine öğrenimi uzmanı için iş piyasasının birçok vaatte bulunduğunu gösterir. İster makine öğrenimi mühendisi, ister araştırma mühendisi ya da araştırma bilimcisi olmayı hedefliyor olun, şüphesiz bu sizin için zenginleştirici bir kariyer olacaktır.
Daha taze bir çanta, bir makine öğrenimi işi olabilir mi?
Günümüzde makine öğrenimi işlerinin çoğu deneyimli profesyoneller gerektirse de, pazardaki muazzam talep nedeniyle yeni başlayanlar için seçenekler de artıyor. Yeni başlayanlar için zor olabilir, ancak bir makine öğrenimi işi almak kesinlikle imkansız değildir. Gerekli becerilerde ustalaşabilir, nasıl iyi performans göstereceğinizi planlayabilir ve sahadaki deneyimli oyunculardan hızlı bir şekilde öğrenebilirseniz, hayalinizdeki işi de yapabilirsiniz. Daha fazla değer katmak için ilgili sertifikalar almak, güvenilir platformlarda makine öğrenimi kurslarına kaydolmak, uygulamalı projeler denemek, en son teknoloji haberlerini ve trendleri takip etmek ve çevrimiçi topluluklara katılmak gibi seçenekleri değerlendirebilirsiniz.
Bir makine öğrenimi mühendisi ne kadar kazanır?
Glassdoor.in'den alınan verilere göre, Hindistan'da bir makine öğrenimi mühendisi tarafından alınan ortalama maaş, yılda yaklaşık 8,2 lakh INR'dir. Şimdi, ortalama gelir beceriler, sertifikalar, deneyim, konum ve daha fazlası gibi çeşitli faktörlere bağlıdır. Ancak daha fazla iş tecrübesi ile kazancınızı artırmayı bekleyebilirsiniz. Örneğin, kıdemli makine öğrenimi mühendisleri ortalama olarak 13 ila 15 lakh INR aralığında kazanabilir.