Yeni Başlayanlar İçin R'de 15 Heyecanlı Makine Öğrenimi Projesi [2022]
Yayınlanan: 2021-01-01“Makine Öğrenimi ve Yapay Zeka kritik bir dönüm noktasına ulaştı ve neredeyse her teknoloji etkin hizmeti, şeyi veya uygulamayı giderek artıracak ve genişletecek. Önceden tanımlanmış talimatları yerine getirmek yerine adapte olan, öğrenen ve potansiyel olarak özerk hareket eden akıllı sistemler oluşturmak, teknoloji satıcıları için en az 2022 yılına kadar birincil savaş alanı olacak.”
Bu daha doğru olamazdı. 2022'de burada dururken, günlük hayatımızda artan AI ve ML akışına tanık oluyoruz. Bu akıllı teknolojiler, sağlık ve eğitim ya da iş ve yönetim olsun, hayatımızın neredeyse her yönünü dikte ediyor.
AI ve ML teknolojilerinin endüstrinin tüm sektörlerinde benimsenmesi, nitelikli ve yetenekli Veri Bilimi uzmanlarına olan talebi artırdı. Ancak bu, kimsenin umut verici bir AI/ML iş rolü üstlenebileceği anlamına gelmez - deneyiminizi sergilemek için doğru eğitim niteliklerine, becerilere ve en önemlisi gerçek dünya projelerine ihtiyacınız vardır.
Canlı projeler geliştirmek, teorik bilginizi test etmenize, becerilerinizi geliştirmenize ve temel güçlü ve zayıf yönlerinizi belirlemenize olanak tanır. Kendi projelerinizi oluşturmaya devam ettikçe, zamanla mesleki bilgi ve becerileriniz üzerinde daha fazla güven kazanacaksınız.
Bu gönderiyi yalnızca Makine Öğrenimi alanına girmek isteyen adaylar için oluşturduk. Bu makalede, R'deki bazı heyecan verici Makine Öğrenimi projelerini vurgulayacağız. İstatistiksel hesaplama söz konusu olduğunda R en çok tercih edilen olduğundan, Makine Öğrenimi projeleri oluşturmak için ideal seçimdir.
R'deki Makine Öğrenimi projeleri hakkındaki tartışmamıza başlamadan önce, bir Makine Öğrenimi projesi oluşturmayla ilgili standart adımlardan haberdar olmalısınız:

- Problem tanımı – Bir Makine Öğrenimi projesi tasarlamaya başlamadan önce, problem ifadesini, yani modelle hangi problemi çözmeyi amaçladığınızı ve ML'nin resme nasıl uyduğunu tanımlamanız gerekir.
- Veri hazırlama – Eldeki veri kümesini incelemeli ve bunun yapılandırılmış mı yoksa yapılandırılmamış bir veri kümesi mi olduğunu, statik mi yoksa akış mı olduğunu ve sorun tanımını nasıl tamamlayacağını belirlemelisiniz. Bu aşama esas olarak verilerin işlenmesi için temizlenmesini ve hazırlanmasını içerir.
- Algoritma değerlendirmesi – Bir Makine Öğrenimi projesi, farklı ML algoritmaları içerir. Hangi algoritmaların problem tanımına en uygun olduğunu belirlemek ve sonuçların maksimum doğruluğunu garanti etmek çok önemlidir.
- Veri özellikleri – Bu aşamada, Makine Öğrenimi projesi için veri kümesinin hangi öğelerini veya özelliklerini kullanacağınızı ve halihazırda elde edilen içgörülerin projeyi nasıl etkileyeceğini belirleyeceksiniz.
- Modelleme – Belirli bir model yapısı seçmeli ve onu geliştirmenin yollarını bulmalısınız. Ayrıca, hangisinin sorun ifadesine uygun olduğunu görmek için bunu diğer modellerle karşılaştırmalısınız.
- Test Etme – Adından da anlaşılacağı gibi test etme, modelin sonuçlarını incelemek ve onu daha da geliştirmenin yollarını bulmak anlamına gelir. Küçük bir değişikliğin modelin genel sonucunu nasıl etkilediğini ve ayrıca aşağıdaki adımları nasıl etkilediğini analiz etmek çok önemlidir.
O halde lafı fazla uzatmadan başlayalım!
İçindekiler
R'de Makine Öğrenimi Projeleri
1. Havacılık olayı risk tahmini için ML modeli
Bu projede, havacılık olayı risk tahmini için bir topluluk ML modeli oluşturacaksınız. Proje, havacılıkla ilgili belirsiz ve tehlikeli olayların riskini değerlendirmeyi amaçlamaktadır. Burada hibrit model, yapılandırılmamış veriler üzerindeki SVM tahminini ve yapılandırılmış veriler üzerindeki derin sinir ağları topluluğunu birleştirir. Bu ML projesinin odak noktası, havacılık sistemlerinin güvenlik seviyesini artırmak ve anormal olayların oluşumunu doğru bir şekilde tahmin ederek riskleri ölçmektir.
2. Fidye yazılımı ailelerinin sınıflandırılması
İnşa edeceğiniz proje, fidye yazılımlarını tanımlamak ve sınıflandırmak için statik sınıflandırma tekniğini uygulayacaktır. Fidye yazılımı örneklerini N-gram dizilerine dönüştürerek başlayacak. Model daha sonra fidye yazılımının gelişmiş ayrımını kolaylaştırmak için frekans-Ters belge frekansını (TF-IDF) hesaplayacaktır. Son olarak, bu, fidye yazılımını sınıflandırmak için ML modelinin girdisi olur. Bu makine öğrenimi modeli aynı zamanda farklı fidye yazılımı ailelerinde işlem kodları arasındaki ayrımı araştırır ve analiz eder.
3. Kötü niyetli Android uygulamalarının tespiti
Buradaki fikir, diskriminant sistem çağrıları kullanan zararlı Android uygulamalarını tespit edebilen bir ML sistemi oluşturmaktır. Bu proje, büyük bir sistem çağrısı veri setini budamak için Büyük Popülasyon Testi (RSLPT) kullanan Ağırlıklı Sistem Çağrılarının Mutlak Farkı (ADWSC) ve Dereceli Sistem Çağrılarından yararlanır.
Özellik seçimi, farklı özellikler arasındaki korelasyona dayalı olsa da, bu iki seçim tekniği, kötü amaçlı yazılım örneklerinin daha fazla doğrulukla sınıflandırılmasına yardımcı olacak en faydalı özelliklerin ortaya çıkarılmasına yardımcı olur. Bu Makine Öğrenimi projesinin birincil amacı, hesaplama karmaşıklığını minimumda tutarken kötü amaçlı Android uygulamalarını bulmaktır.
4. Kredi puanlama
Bu ML modeli, kredi puanlaması için Büyük Veriyi kullanır. Esasen, kredi puanlama modeli, finansal katılımı artırmak ve bir kredi kartı sahibinin kredibilitesini değerlendirmek için sosyal ağ analizlerinden ve cep telefonu verilerinden yararlanır. Model, farklı ülkelere yayılan çok çeşitli kredilerin büyük hacimli aynı mobil verilerini kullanarak, kredi için karar verme sürecini iyileştirmek için istatistiksel performansı iyileştirmeyi amaçlamaktadır.
5. Yaşam modeli
Bu Makine Öğrenimi projesi, sağlık sisteminin geçici verilerini kullanarak sağlık hizmeti analizlerindeki anormallikleri doğru bir şekilde tahmin etmeyi ve bir hastanın ölüm oranını tahmin etmeyi amaçlar. Bunu yapmak için bu proje, derin öğrenme sinir ağına dayalı bir Yaşam Modeli (LM) geliştirilmesini önermektedir. Sinir ağları, zamansal dizi (ITS) tensörlerinin yoğunluğundan yararlanarak, geçmiş tıbbi verilerine dayanarak her hastanın ömrünü modelleyecektir. Sonuç, kısa ve özlü bir zamansal dizi şeklinde olacaktır.
Daha fazla bilgi edinin: Derin Öğrenme ve Sinir Ağları
6. Aktivite tahmin sistemi
Bu aktivite tahmin sistemi, Tekrarlayan Sinir Ağı'na (RNN) dayanmaktadır. Akıllı sağlık altyapısının bir parçası olarak uç bilişimi kolaylaştıracak giyilebilir sensör tabanlı bir aktivite tahmin sistemidir.
Giyilebilir cihaz, hastaların aktivitelerini izleyecek ve sensör tarafından sağlanan bilgileri kullanarak hareketlerini daha fazla tahmin edecek. Bu model, büyük ölçekli, karmaşık verilerle başa çıkmak ve akıllı sağlık sistemlerinin tahmin performansını iyileştirmek için hızlı hesaplamayı teşvik etmek için tasarlanmıştır.

Okuyun: Python Proje Fikirleri ve Konuları
7. Destek vektör makinesi
Bu Machine Learning projesinde, ulaşım sistemlerindeki hataları tespit etmek için ölçeklenebilir bir destek vektör makinesi geliştireceksiniz. Buradaki amaç, veri noktalarının geliştirilmiş işlem hızını kolaylaştıran bir sistem oluşturmaktır. Model, ulaşım sistemindeki arıza tespit kısıtlamalarını azaltmak için KNN tabanlı FSVM (KNN-FSVM) yaklaşımını kullanır.
Bu yöntem sadece verinin boyutunu küçültmekle kalmaz, aynı zamanda dengesiz bir veri seti için eğitim verisinin ne kadar önemli olduğunu da ortaya koyar. Ayrıca, KNN-FSVM yöntemi, hatalı verilerin sınıflandırılmasıyla ilgili sınırlamaları ortadan kaldırarak tahmin doğruluğunu iyileştirebilir.
8. Su pompaları için elektrik kullanımını en aza indiren sistem
Bu Makine Öğrenimi projesi, su dağıtım sistemlerinin (WDS) hesaplama karmaşıklığını ele almak ve yönetmek için makine öğrenimi ve gelişmiş optimizasyon yöntemlerinin bir kombinasyonunu kullanmayı önerir. Model, karışık tamsayı problemiyle mücadele etmek için diğer optimizasyon teknikleriyle birlikte bir regresyon tekniği kullanır. Enerji tahmini için eğri uydurma teknikleri kullanır. Yarı denetimli öğrenme yaklaşımını kullanmak, hesaplama süresini azaltmaya yardımcı olduğu için bu proje için en iyi seçimdir.
Ayrıca şunu da okuyun: Yeni Başlayanlar için R Projesi Fikirleri ve Konuları
9. Müzik biliş sistemi
Bu projede, müziği anlayabilen ve aynı kökten türeyen bir müzik algılama sistemi oluşturmak için farklı ML tekniklerinden yararlanacak ve sis hesaplama yoluyla otomatik olarak müzik puanı oluşturacaksınız. Proje, müziği ve benzersiz özelliklerini tanımak için hem gizli Markov modelini hem de Gauss karışım modelini kullanıyor. Sistemi tasarlamak için çoklu enstrüman tanıma senaryosu kullanmanız önerilir. Bu, biliş modelinin genel performansını iyileştirecektir.
10. Saldırı tespit sistemi
Bu, özellik seçimi analizini kullanan anormallik tabanlı bir saldırı tespit sistemidir. Burada, izinsiz girişin kapsamını analiz etmek için ağ işlem verileri üzerinde farklı ML teknikleri kullanan bir hibrit model oluşturacaksınız. Odak noktası, algılama süresini minimumda tutmaktır. Model, optimal veri özelliklerini çıkarmak için Bilgi Kazancı ile Oylama algoritmasını açıkça kullanacaktır. Ardından, algılama sisteminin doğruluğunu artırmak için sınıflandırıcıları kullanacaktır.
11. Kişiselleştirilmiş Pazar Sepeti Tahmini
Bu kişiselleştirilmiş sepet tahmin sistemi, kullanıcıların ihtiyaç ve tercihlerini en iyi şekilde karşılamaları için bir öneri listesi oluşturmayı önerir. Müşterilerin satın alma geçmişinden Geçici Açıklamalı Yinelenen Dizileri (TARS) çıkaracak ve toplayacak bir model tasarlayacaksınız. Bir sonraki adımda, bir müşteri için kişiselleştirilmiş bir ürün sepetini tahmin etmek için TARS Tabanlı Tahmini (TBP) kullanacak. Mevcut öneri listesi ürünlerinin özelliklerini yeni ürünlerin özellikleriyle birlikte analiz etmek, tahmin kalitesinin artırılmasına yardımcı olur.
12. Mobil ağlar için performans tahmin sistemi
Bu Makine Öğrenimi projesinin amacı, hücresel ağlarda performans tahmini sorunlarını çözmektir. Model, işletim maliyetlerini minimumda tutmak için rastgele orman ML tekniğini kullanacaktır. Bu teknik, hesaplama zorluklarını ve kaynak tahsisi sorunlarını çözmek için de mükemmeldir. Model, hücresel ağların performansını tahmin ederken, müşteri deneyimini de iyileştirebilmelidir.
13. Gizli yetenek modeli
Bu Gizli Yetenek Modeli (LAM) , çalışanların iş gücünü ve aktivite günlüklerini analiz etmek için tasarlanmıştır. LAM'ın birincil işi, çalışanlar ve atanan faaliyetler arasındaki gizli bir ilişkiyi modellemektir. Böylece, çalışan ile çalışan memnuniyet seviyesini belirleyen faaliyetler arasındaki puanı hesaplayacaktır.
Bu puana dayalı olarak, LAM çalışan performansını tahmin etmek, çalışan yeteneklerini karşılaştırmak ve çalışan aktivitelerinin kalite tahminini yürütmek için tahmin modelleri geliştirecektir. Ayrıca, çalışanların aktivite günlüğüne dayalı bir tahmine dayalı dağıtım temsili oluşturacaktır.
14. Hisse senedi fiyat endeksi tahmin sistemi
Bu projede, Hisse Senedi Endeksinin oynaklığını tahmin etmek için bir tahmin sistemi oluşturacaksınız. Bu hibrit modelde, uzun kısa süreli bellek (LSTM) modeli, çoklu GARCH (Generalized AutoRegressive Conditional Heteroscedasticity) tipi modellerle entegre edilmiştir. Bu kombinasyon, oynaklık kümelenmesini desteklemeye ve iyileştirmeye yardımcı olacaktır.

15. Akıllı varlık tahsis sistemi
Bu model, sosyal medyadan toplanan varlık düzeyinde duyarlılık tabanlı zaman serisi verilerini hesaplamak için tasarlanmıştır. Tahsis teknikleriyle birlikte duygu analizi ve metin madenciliği yöntemlerini kullanır. Ayrıca, ML modeli, piyasa verileri ve istatistiklerine karşı duyarlılık verilerini doğrulamak için uzun kısa süreli bellek (LSTM) modelini ve gelişen kümeleme tekniğinin bir çeşidini kullanır. Bu nedenle, bu projenin birincil amacı, akıllı varlık tahsisi için piyasa duyarlılığını yakalamaktır.
Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.
Şuna da Bakın: Veri Yapısı Proje Fikirleri
toparlamak
İşte burada – R'de 15 ilginç Makine Öğrenimi projesi! Proje oluşturma, sizi heyecanlandıran ve ilgi alanlarınızla yakından ilgili konuları seçmeniz koşuluyla eğlenceli bir öğrenme deneyimidir. Pratik becerilerinizi geliştirmek için daha küçük ve daha basit projeler üzerinde çalışarak başlayın ve ardından daha ileri düzey projelere ilerleyin. Son olarak, her zaman modellerinizi test ettiğinizden emin olun!
Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.
R'de makine öğrenimi yapılabilir mi?
Evet. R, birçok makine öğrenimi görevi için kullanılır. Sınıflandırma, segmentasyon ve regresyon, R kullanılarak yapılabilecek birkaç görevdir. R ile ilgili olan şey, farklı görevler için kullanılabilecek çok çeşitli makine öğrenimi paketleri ile birlikte gelmesidir. Örneğin regresyon yapmak istiyorsanız randomForest paketini kullanabilirsiniz. Öte yandan sınıflandırma ile ilgileniyorsanız, glmnet paketini kullanabilirsiniz.
Makine öğreniminde denetimli öğrenme nedir?
Denetimli öğrenme, en temel makine öğrenmesi tekniklerinden biridir. Aynı zamanda diğer birçok makine öğrenimi algoritması ve görevinin temel taşıdır. Bu tür öğrenmede kullanılan veriler etiketlenir - bunlar denetimli veri kümeleri olarak bilinir. Bu tür öğrenmede algoritma, girdi değişkenleri ile çıktı değişkenleri arasındaki eşleştirmeyi öğrenmelidir. Algoritma, girdiler ve çıktılar arasındaki ilişkiyi yöneten kuralları öğrenmelidir. Çıktıların etiketlenmediği bir veri kümesinden öğrenmeye kıyasla, öğrenme algoritmasının bu tür verileri kullanarak öğrenmesi çok daha kolaydır.
Makine öğreniminde sınıflandırma ve regresyon arasındaki fark nedir?
Sınıflandırma, veri örneklerinin sınıf etiketini tahmin ederken, regresyon sayısal değerleri tahmin ediyor. Regresyon için doğrusal bir model ve sınıflandırma için doğrusal olmayan bir model uyguluyoruz. Basit bir doğrusal regresyon örneği, kullanılmış araba fiyatlarını tahmin etmektir. Bu sorunu çözmek için, bir otomobilin şu özelliklerini hesaba katan bir modele ihtiyacımız var: arabanın uzunluğu, ağırlığı, yakıt verimliliği vb. Daha sonra veri noktalarına doğrusal bir denklem yerleştiririz. İyi bir sınıflandırma örneği, bir hastanın yaşı, cinsiyeti, sigara içme durumu vb. bazında belirli bir hastalığa yakalanıp yakalanmayacağını tahmin etmektir. Bu durumda, veri noktalarına doğrusal olmayan bir model yerleştiririz.