Veri Bilimi için En İyi Tahmin Soruları ve Bilgilendirme Yöntemleri [222]
Yayınlanan: 2021-01-06Tahmini nedir?
Tahmin, metodolojik bir teori ve değerlendirme yöntemidir; daha yüksek bir doğruluk derecesi ile verimli bir şekilde çalışmanıza yardımcı olur. Sonucu pekiştirmek için verilerin incelenmesidir . Aynı zamanda İş Analisti veya Veri Bilimi ve Veri Mimarları veya Veri Teknisyenlerinin önemli bir parçasıdır.
- Anlamı: Çözmek istediğiniz sorunu ve bunun amacının ne olduğunu, neden çözmek istediğinizi anlamakla ilgilidir.
- Tanım: Belirli bir nesne ve bir sürecin akışının girdi ve çıktısı ile ilgilidir. Tek kelimeyle anlatmak gerekirse, açıklama.
- Tahmin : Bu düşünce ve sonuçla ilgilidir - probleminizde belirli bir nesne yaratıyorsunuz.
- Tahmin: Belirli bir problemdeki sayıların tahmini ile ilgilidir.
- Bir fikir üretin : Fikri araştırma ve geliştirme ile hayata geçirin.
Tahmini bir soru bir pazarın büyüklüğünü sorabildiğinde, buna “pazar büyüklüğü” sorusu denir.
Tahminle ilgili temel sorular şunlardır:
- Tipik bir Pazartesi günü New York'ta kaç kişi mavi giyer?
- Bir uçağa kaç tane tenis topu sığdırabilirsin?
Tahmine Nasıl Yaklaşılır?
Tahmini bir problemi çözme süreci oldukça yönetilebilir:
- Nihai miktarı etkileyebilecek uygulanabilir parametrelere bakın ve sayılarını tahmin edin.
- Bir adım geri çekil ve düşün.
- Düşüncelerinizi netleştirin.
- Düşüncelerinizi dile getirin.
- Basit Matematik yaklaşımı-
Bu yaklaşım tipik olarak, tahmin edilecek sayı bir tür oran olduğunda kullanılır. Görev, pay ve paydayı elde etmek, sonra işimiz bitti!
1. Kişi başına yaklaşım-
Bu yaklaşım, tahmin edilecek sayının coğrafya içinde kişi, hane veya nüfus düzeyinde bir tüketim maddesi olarak düşünülebildiği durumlarda kullanılır.
2. Arz ve Talep yaklaşımı-
Bu yaklaşım, kalemin arz veya talep (veya her ikisi) tarafından tahmin edilen sayıyı düşünmeyi gerektirir.
Genel olarak konuşursak, şu iki yoldan biriyle tahminde bulunabilirsiniz:
- Yukarıdan aşağıya yöntemi
- Aşağıdan yukarıya yöntemi
Yukarıdan aşağıya, tahmininizin bir parçası olduğu mümkün olan en büyük evrenle başlarsınız.
En geniş taban üstte. Bu evrene, evrenden gelen sayıyı tahmininize uygun bir sayıya indirgeyen bir dizi koşul veya filtre (bunu nasıl koymak isterseniz) uygulamaya devam edersiniz.
Yukarıdan aşağıya tahmin sürecinin anahtarı şurada yatmaktadır:
- Başlangıç evrenini doğru bir şekilde tanımlıyor.
- Tahmini probleminiz için geçerli olan ilgili koşulların/filtrelerin ve segmentlerin çoğunu doğru bir şekilde tanımlar.
- Segmentler: Sıklıkla, önce evreni bölümlere ayırmanız ve her bölüme farklı filtreler uygulamanız gerekir.
Veri Bilimi için tahmin soruları için ipuçları:
- Sunma Alıştırma: Tamamlamış olduğunuz belirli çözümü dinleyicilere sunma pratiğini yapmalıyız.
- Uygulama Analizi: Analiz, verilen problem üzerinde düşünce süreçlerinin oluşturulmasında hayati bir rol oynar.
- Rakamlarla Alıştırma: Rakamlarla oynamak veya özel mantık oluşturmak her zaman önemlidir.
Veri Bilimi için tahmin sorularını çözerken şu noktaları anlamanız gerekir:
- Bunu kafanda olmayan birine anlatıyorsun. Çözüm senin için değil.
- Aynı zamanda, her yönü tamamen yeni bir tahmine dönüştürmemeyi unutmayın! Zekanız ve analitik yetenekleriniz tarafından kolayca etkilenebilirsiniz.
- Soruya odaklan. Analiz-felç diye bir şey duydunuz mu?
Veri Bilimi için tahmin sorularının amaçları nelerdir?
- Bir durumu anlama kapasitenizi anlamak için.
- Bir şeyleri birbirine bağlama yeteneğinizin kapsamını anlamak, bir cevaba ulaşmak.
- Farklı parametrelere öncelik verme ve reddetme gücünüzü bilmek.
- Yetersiz bilgi ile ne kadar iyi çalıştığınızı anlamak için.
İşte Veri Bilimi için bazı tahmini sorular-
Soru:1 UCI Iris veri setinde k-ortalama algoritması ile bir Deney oluşturun:
Bu deneyde, veri kümesindeki tüm özellikleri kullanarak k-ortalama kümeleme gerçekleştirin ve ardından kümeleme sonuçlarını tüm numuneler için gerçek sınıf etiketiyle karşılaştırın.
Çok sınıflı sınıflandırma gerçekleştirmek için Çok Sınıflı Lojistik Regresyon modülünü kullanın ve performansını k-ortalama kümelemenin performansıyla karşılaştırın.
Soru:2 Çok basit bir formatta Kesinlik ve Geri Çağırma?
Soru:3 Size bir veri seti verildiyse, kullanıcıya hangi ML algoritmasına nasıl karar veriyorsunuz?
Soru:4 Çok fazla yanlış pozitif olması daha mı iyi? Yoksa çok fazla yanlış negatif mi?
Soru:5 Model doğruluğu ve model performansı nedir? Hangi senaryoyu uygulayabilirsiniz?
Soru:6 Bir modele gereğinden fazla uymadığınızdan nasıl emin olursunuz? Bir örnekle açıklayınız.
Soru:7 Bir ikili sınıflandırma ağacı algoritması çalıştırdığınızda oldukça kolaydır. Binary algoritmasında, ağaç, kök düğümde ve onu izleyen alt düğümlerde hangi değişkenin bölüneceğine nasıl karar verir?

Soru:8 NumPy ve SciPy nasıl tanımlanır?
Soru:9 Herhangi bir sınıflandırıcı kullanarak herhangi bir veri kümesini içe aktaran veri kümesinin doğruluğunu kontrol etmek için temel bir Makine öğrenimi programı yazın?
Soru:10 Bir arabanın fiyatını farklı değişkenlere dayalı olarak tahmin etmek için bir Regresyon algoritması oluşturun.
Soru:11 İkili sınıflandırmaları kullanarak hangi ağ etkinliklerinin izinsiz giriş/saldırının parçası olduğunu saptamak için farklı ağ özelliklerini kullanan bir model geliştirin.
Soru:12 Benzer organizasyonları Wikipedia açıklamalarına göre bir arada bulmak için Gruplandırma (Kümeleme).
Soru:13 Kimlerin gelecek ay aboneliklerini yenileyeceğini nasıl tahmin edersiniz?
- Bunu çözmek için hangi verilere ihtiyacınız var?
- Ne tür bir analiz yapardınız?
- Ne tür tahmine dayalı modellerin algoritmalarına ihtiyaç duyulur?
Soru:14 Takma adları (Alen, Bob, Alex, Tim, vb.) gerçek adlarla nasıl eşleştirirsiniz?
Soru:15 R veya python komut dosyası ile bir İkili sınıflandırıcı kullanarak tarifeli yolcu uçuşunun ertelenip ertelenmeyeceğine dair bir tahmin oluşturun.
Soru:16 Normalleştirilmiş kayıplar sütununu kaldırarak verileri Hazırla ve Temizle ile Doğrusal Regresyon kullanarak otomobil fiyatlarını tahmin edin.
Birçok eksik değeri olduğu için bir deney ve model oluşturun.
Soru:17 14 kişiyi 5'er kişilik 4 takıma kaç farklı şekilde ayırabilirsiniz?
Soru:18 Standart normal eğrinin altındaki alan nedir?
- 1'den büyük
- 1'e eşit
- 1'den az
Soru:19 Bir arabanın fiyatını farklı değişkenlere dayalı olarak tahmin etmek için bir Regresyon algoritması oluşturun.
Soru:20 Yöneticiniz eğitiminiz sırasında 10000 ağaçlı rastgele bir orman modeli oluşturmanızı istedi ve 0,00 olarak eğitim hatası aldınız. Ancak, testte doğrulama hatası 34.23 idi. Neyin yanlış gittiğini hangi temelde varsayacaksınız? Mükemmel bir şekilde eğitilmemişse modelinizi nasıl kontrol edersiniz?
Soru:21 'Bunu alan da aldı...' Amazon'da görülen öneriler hangi algoritmaya göre yapılıyor?
Soru:22 'Bugünün Haberleri ve görüşler' olarak gördüğünüz önerilerde hangi algoritmalar bağlantılı?
Okuyun: Veri Bilimi Mülakat Soruları
Çözüm
Bu makalenin, veri bilimi için tahmini soruları ve bunların nasıl üstesinden gelineceğini anlamanıza yardımcı olduğunu umuyoruz. upGrad'da bunun gibi daha faydalı makaleler bulacaksınız; Çok çeşitli kurslar, MBA, Veri Bilimi, Makine Öğrenimi vb. sunuyoruz. Sektörlerin en iyi bireylerinden mentorluk sağlıyoruz!
Veri Bilimi öğrenmekle ilgileniyorsanız ve bu alanda bir kariyer yapmayı tercih ediyorsanız, çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, pratik uygulamalı atölye çalışmaları sunan IIIT-B & upGrad'ın Veri Biliminde Yönetici PG Programına göz atın , endüstri uzmanlarıyla mentorluk, endüstri danışmanlarıyla 1'e 1, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.
Tahmini bir problemi çözmek için ideal adımlar nelerdir?
Tahmini bir soruyu yanıtlamadan önce, daha iyi bir fikir bulmak için bazı noktaları akılda tutmak akıllıca olacaktır. Bu noktalar aşağıdaki gibidir - Cevaplamaya başlamadan önce soruyla ilgili tüm şüphelerinizi gidermelisiniz. Görüşmeciye istediğiniz kadar ilgili soru sorabilirsiniz, ancak herhangi bir sayısal hesaplamaya yol açan sorulardan kaçınmaya çalışın. Bunun görüşmeci üzerinde kötü bir etkisi olabilir. Herhangi bir kötü izlenimden kaçınmak için evet veya hayır sorularına bağlı kalmanız önerilir. Problemi bir kerede çözmeye çalışmayın, bunun yerine daha küçük alt problemlere bölün ve ardından her küçük problemi çözmeye çalışın. Sorununuzu 6 adımdan fazlasına bölmeyin. Bu yöntem, uzun hesaplamalarla bile cevaba ulaşmanıza yardımcı olacaktır.
Tahmini nedir?
Tahmin, tamamen sorunu anlamak ve onu çözmek için doğru yaklaşımı bulmakla ilgilidir. Bu, metodolojik bir teori ve değerlendirme yöntemidir. Bu tür sorularda en önemli şey çözümü nasıl açıkladığınızdır.
Özellikle sorulan soruların türlerine ilk baktığınızda, konukçuluk göz korkutucu bir görev gibi gelebilir. Büyük holdinglerin pazar büyüklüklerinden gelirlere ve nüfusa kadar, bu miktarların bazılarını bir basketbol sahasına yakın bile hesaplamak gerçekçi olarak imkansızdır.
Tahmini bir problemi çözmek için farklı yaklaşımlar nelerdir?
Basit Matematik yaklaşımı - Bu yaklaşım çoğunlukla tahmin edilecek sayının bir tür oran olduğu durumlarda kullanılır. Kişi başına yaklaşım - bu yaklaşım, tahmin edilecek sayının coğrafya içinde bir kişi, hane veya nüfus düzeyinde bir tüketim maddesi olarak düşünülebildiği durumlarda kullanılır. Arz ve Talep yaklaşımı - bu yaklaşım, sayıyı arz veya talep yönünden düşünmenizi gerektirir.