Yeni Başlayanlar İçin R'de 8 Şaşırtıcı Veri Bilimi Projesi [2022]
Yayınlanan: 2021-01-05Veri Bilimi alanına girmek istiyor musunuz?
Yenilikçi Veri Bilimi araçları ve çözümleri geliştirmek ister misiniz?
Cevabınız evet ise, mükemmel makaleye rastladınız! Bu gönderide, yeni başlayanlar için en heyecan verici Veri Bilimi proje fikirlerinden bazılarını sizinle paylaşacağız.
Neden Veri Bilimi projeleri üzerinde çalışmalısınız?
Daha fazla şirket ve kuruluş Data Science çoğunluğa katıldığından, nitelikli ve yetenekli Veri Bilimi, yapay zeka ve makine öğrenimi uzmanlarına olan talep hızla artıyor. Bu, milyonlarca Veri Bilimi adayı ve profesyoneli için umut verici bir fırsat olsa da, Veri Bilimi iş rolünü üstlenmek kolay bir yol değil. Şirketler yalnızca doğru eğitim niteliklerine, becerilere ve en önemlisi pratik deneyime sahip adayları işe alır.
Peki, pratik deneyim iş deneyimi anlamına mı geliyor? Ve öyleyse, Veri Bilimi eğitimlerini yeni tamamlamış yeni başlayanlar ne olacak?
“Pratik deneyim” dediğimizde profesyonel iş deneyimini kastetmiyoruz. Bunun yerine, gerçek dünya Veri Bilimi projeleri oluşturmaktan ve yaratmaktan bahsediyoruz. Her Veri Bilimi adayı için, canlı projeler üzerinde çalışmak, başarılı bir Veri Bilimi kariyeri oluşturmaya yönelik önemli bir adımdır.
Projeler size teorik bilgi ve becerilerinizi gerçek dünya senaryolarında uygulama fırsatı sunar. Bu, yalnızca bilgi tabanınızı güçlendirmenize ve becerilerinizi geliştirmenize yardımcı olmakla kalmaz, aynı zamanda güveninizi artırmanıza da yardımcı olur. Dahası, kıyasıya rekabetin hakim olduğu bir piyasada işverenler her zaman “X” faktörüne sahip adayları tercih ederler. Böylece, inşa ettiğiniz projeler sizi eşit niteliklere sahip adaylardan oluşan kalabalığın arasından ayırabilir.
Ancak asıl zorluk, niteliklerinize, becerilerinize ve ilgi alanlarınıza göre doğru projeleri bulmakla birlikte gelir. Bu nedenle, yeni başlayanlar için R'de mükemmel Veri Bilimi proje fikirlerinin bir listesini derledik!
İçindekiler
R'de Veri Bilimi projeleri
1. Duygu Analizi projesi
Müşteri memnuniyeti artık hemen hemen her şirket ve markanın en önemli hedeflerinden biridir. Sadık ve memnun müşterilerden oluşan bir hayran kitlesi yaratmanın en iyi yolu onların ruhlarına girmektir - sevdiklerini ve sevmediklerini anlamak, tercih kalıplarını ve en önemlisi ihtiyaçlarını belirlemek. Duyarlılık Analizi, çoğu şirketin hedef kitlelerinin ürünlerine/hizmetlerine yönelik tutumunu anlamak için kullandığı araçtır.
Adından da anlaşılacağı gibi, Duygu Analizi, onları ifade eden insanların altında yatan duyguları belirlemek için kelimeleri analiz eder. Duyarlılık Analizi aracı, kelimeleri analiz ederek onları iki ikili dosya altında sınıflandırır – pozitif, negatif ve nötr olarak. Bu projede, 'janeaustenR' veri kümesini/paketini kullanacaksınız. Projede kullanılan diğer araçlar, AFINN, Bing ve Loughran gibi genel amaçlı sözlükleri içerir. Ayrıca sonuçları görüntülemek için bir kelime bulutu kullanacaksınız.
2. Uber Veri Analizi projesi
Uber, baştan sona veri odaklı bir markadır. Şirket, müşterileri için en uygun kabin çözümlerini oluşturmak için kullanıcı verilerini kullanır ve kullanır. Uber, veriye dayalı kararlar almaya yatırım yaparken, pazarlama stratejilerini, promosyon tekliflerini ve fiyatlandırma politikalarını tasarlamak için gelişmiş veri analitiği ve tahmine dayalı analitiğin bir kombinasyonundan da yararlanır.
Bu projede, kullanıcı verilerinden içgörüler elde etmek ve Uber yolculuklarından ve yolculuklarından yararlanacak müşteriler hakkında neredeyse doğru tahminler oluşturmak için ggplot2 kitaplığını kullanan bir veri analiz sistemi tasarlayacaksınız. Sistem, bir günde yapılan yolculuk sayısı, tekrar eden müşterilerin günlük yolculuk saatleri, belirli bir aydaki yolculuk sayısı gibi farklı müşteri parametrelerini analiz etmek için R programlamayı ve ggplot2 kitaplığını kullanacaktır.
Sistem, bu veri noktalarını görselleştirerek, bir günde Uber seyahatlerinden yararlanan ortalama yolcu sayısını, uygulamada maksimum trafiğin olduğu yoğun saatleri, bir ayda en fazla seyahatin olduğu günleri vb. .
3. Kredi Kartı Dolandırıcılık Tespiti projesi
Son zamanlarda, kredi kartı dolandırıcılıkları hızla arttı. Aslında, BFSI sektörünün en yaygın tehditlerinden biridir. Bu R projesinin arkasındaki fikir, kredi kartı dolandırıcılık işlemlerini verimli bir şekilde tespit edebilen bir sınıflandırıcı geliştirmektir.
Projenin veri seti, hem dolandırıcılık içermeyen hem de dolandırıcılık işlemlerinin bir karışımını içeren kredi kartı işlem veri seti olacaktır. Proje, Karar Ağaçları, Lojistik Regresyon, Yapay Sinir Ağları ve Gradient Boosting Classifier gibi çok sayıda ML algoritmasını içerecektir.
Bu ML algoritmalarını uygulayarak sistem, sahte bir aramayı sahte olmayan bir aramadan ayırt edebilecektir. Bu proje, sınıflandırma gerçekleştirmek için gerçek dünya senaryosunda ML algoritmalarının nasıl uygulanacağını öğretecektir.
4. Film Öneri projesi
Amazon, Amazon Prime veya Netflix'in hevesli bir sevgilisiyseniz, muhtemelen bu platformların “tavsiye motorlarından” yararlandığını biliyorsunuzdur. Adından da anlaşılacağı gibi, bir öneri motorunun tek amacı müşterilere ilgili şeyleri "tavsiye etmektir" - Amazon için ürünler önerirken, Prime ve Netflix için kullanıcılara önceki satın alma geçmişlerine veya izleme geçmişlerine göre içerik önerir.

Bu R projesinin temel amacı, kullanıcılara film önerecek bir öneri sistemi tasarlamaktır. Bu proje için kullanılan veri kümesi MovieLens veri kümesidir. Bu veriler, 10329'dan fazla film için 105339 puan içerir. Bu projede, bir Öğe Tabanlı İşbirlikçi Filtre oluşturacaksınız.
Bu film öneri motorunu sıfırdan oluşturmanın en iyi yanı, bir öneri motorunun iç işleyişini ve mekanizmasını anlamanıza yardımcı olacak olmasıdır. Canlı bir projede R programlama becerilerinizi Makine öğrenimi becerileriyle birlikte nasıl uygulayacağınızı öğreneceksiniz.
5. Müzik Öneri projesi
Müzik öneri sistemi, film öneri sistemine benzer şekilde çalışır, tek fark, kullanıcılara filmler yerine müzik önermesidir. Bu bir Python + R projesidir. Bu proje için kullanılan veri seti, Asya'nın önde gelen müzik akışı hizmeti olan ve 30 milyondan fazla müzik parçası içeren bir kitaplığa sahip olan KKBOX'tan alınmıştır.
Bu projede, belirli bir zaman aralığında ilk dinleme olayı tetiklendikten sonra kullanıcının döngüde bir şarkıyı dinleme şansını tahmin edebilen Python ve R kullanarak bir ML sistemi oluşturacaksınız. Burada, eğitim ve test veri kümeleri, belirli bir zaman diliminde farklı kullanıcıların dinleme geçmişinden seçilir.
Bu nedenle, örneğin, bir kullanıcının ilk gözlemlenebilir dinleme olayından sonraki bir ay içinde yinelenen bir dinleme olayı(ları) tetiklenirse, sistem hedefi eğitim setinde 1 olarak işaretler, aksi halde 0 olarak işaretler. Daha sonra aynı kural uygulanır. test setine. Bu proje, verilerden içgörüler elde etmek için temel EDA'nın nasıl gerçekleştirileceğini öğrenmek için mükemmel bir fırsattır.
6. Müşteri Segmentasyonu projesi
Müşterilerin farklı ürünler/hizmetler hakkındaki düşünceleri ve duyguları hakkında daha derin bilgiler elde etmek için Duygu Analizi'nin kullanılması gibi, Müşteri Segmentasyonu daha hedefli pazarlama için kullanılır. Markalar, hedef kitleyi ihtiyaçlarına, tercihlerine, yaşına, konumuna, işine, satın alma davranışına vb. göre farklı alıcı kişiliklerine ayırarak belirli bir müşteri segmenti için özelleştirilmiş ürünler, pazarlama stratejileri ve teklifler/indirimler oluşturabilir. Bu, sonuçta satışları ve geliri artıran daha yüksek müşteri memnuniyeti sağlar.
Müşteri Segmentasyonu, denetimsiz öğrenmenin (ML) en yaygın kullanılan uygulamalarından biridir. Bu projede, etiketlenmemiş bir veri kümesini kümelemek için K-araçlar algoritmasını kullanacaksınız. K-araç kümeleme algoritması, veri kümesindeki yaş ve cinsiyet dağılımlarını etkin bir şekilde görselleştirebilir. Ayrıca, yıllık gelirleri ve harcama modellerini de analiz edecektir. Esasen, bu R projesi, K-ortalama algoritmasının çeşitli versiyonlarını uygulayarak verilerin tanımlayıcı bir analizini sunacaktır.
7. Ürün Paketi Tanımlama projesi
Ürün paketleme kavramı, pazarlama alanında yeni bir şey değildir. Ürün paketleme yaklaşımında, farklı ürünler bir araya getirilir ve belirli bir fiyata (genellikle indirimli fiyat) tek bir birim olarak satılır. Bu, pazarlamacıların müşterileri ürünlerini daha fazla satın almaya teşvik etmelerini sağlar. Belki de bir ürün paketinin en iyi örneği McDonald's Happy Meal'dir.
Bu Veri Bilimi projesinde, birincil odak noktası, satış verilerindeki en iyi ürün paketlerini belirlemeye yardımcı olabilecek bir kümeleme tekniği olan öznel segmentasyon olacaktır. Burada, birkaç hafta boyunca satın alınan farklı ürünlerin miktarlarını içeren haftalık bir satış işlemi veri seti alacağız.
Veri kümesi ayrıca normalleştirilmiş değerleri de içerecektir. Bu veri setini kullanarak amaç, müşteriler için mükemmel kombinasyonlar oluşturmak için hangi ürünlerin bir araya getirilebileceğini bulmaktır. Geleneksel yaklaşım, ürün paketlerini belirlemek için Pazar Sepeti Analizini kullanırken, bu projede odak noktamız, satış verilerinden ürün paketlerini belirlemede zaman serisi kümelemesinin göreli önemini karşılaştırmak ve analiz etmektir.
8. Şarap Kalitesi Tahmini projesi
Buradaki fikir, tahmine dayalı modelleme kullanarak şarap kalitesini iyileştirmektir. Bu Veri Bilimi projesinde, şarap kalitesini değerlendirmek için bir kırmızı şarap veri setini analiz edeceğiz. Bu projenin amacı, kırmızı şarabın kalitesini etkileyen kimyasal özellikleri araştırmaktır.
Projede birinci husus, şarap kalitesini tahmin etmek için girdi değişkenlerini kullanmak, ikinci husus ise mükemmel özelliklere sahip şarapları sınıflandırmaktır. Verilerdeki benzersiz ilişkileri, ortaya çıktıkça ve ne zaman ortaya çıkardıklarını göstermek için grafikler oluşturacak ve iyileştireceksiniz. Proje size veri keşfi, veri görselleştirme, hikaye anlatımı ve ayrıca regresyon modellerinin nasıl uygulanacağını öğretecek ve projenin farklı aşamalarında veri analizi için doğru soruları soracaktır.
Dünyanın en iyi Üniversitelerinden veri bilimi kursları kazanın . Kariyerinizi hızlandırmak için Yönetici PG Programlarımıza, İleri Düzey Sertifika Programlarımıza veya Yüksek Lisans Programlarımıza katılın.
Çözüm
Bunlar, kendiniz deneyebileceğiniz 8 ilginç Veri Bilimi projesi! Bunlar üzerinde çalışırken, Veri Bilimi ve R programlamanın temel kavramlarına hakim olacaksınız. En önemlisi, tüm projelerinizi özgeçmişinizde sergileme şansınız olacak – potansiyel işvereninizin dikkatini çekmek için bundan daha iyi ne olabilir!
Veri Bilimi alanında gerçek bir yetenek olmanızı kolaylaştırmak için tasarlanmış Veri Bilimi Programının yapısı, piyasadaki en iyi işvereni bulmayı kolaylaştırır. upGrad ile öğrenme yolculuğunuza başlamak için bugün kaydolun!