Veri Bilimcileri: Mitler ve Gerçekler

Yayınlanan: 2018-04-05

Hızla ivme kazanan her şey, herkesin bahsettiği şey olma eğilimindedir. Ve bir şey hakkında ne kadar çok insan konuşursa, o kadar çok yanlış anlamalar ve efsaneler birikir. Veri Bilimi ve Analitiği, sürekli olarak yükselişte olan böyle bir alandır ve bununla birlikte artan sayıda ilişkili mit vardır.

Bugün, veri bilimcilerinin yaşamları ve çalışmaları etrafında dönen bu mitlerin ve yanlış anlamaların bazılarını çürüteceğiz. Ancak buna geçmeden önce, bir veri bilimcisinin hayatındaki tipik bir günü anlayalım.

Veri Bilimcisi

Bir kuruluşun zaman içinde çeşitli kaynaklardan ve çeşitli biçimlerde topladığı yığınla veri vardır. Şimdi, bu konuda bir şeyler yapmaya karar verdiler. Verilerini saymak istiyorlar. Kime dönüyorlar?

Veri bilimcileri!
Evet, çoğunluğun bazı doğaüstü varlıklarla karıştırdığı veri bilimcileri. Bu insanlar, herhangi bir kuruluşun veri analizi ekibinin kalbinde ve ruhunda yer alır. Hayati bir konuma sahiptirler ve sizin için bir sürpriz gibi gelse de, normal günleri diğer beyaz yakalı çalışanların tipik günleri gibidir.

İçindekiler

Toplantılar, toplantılar ve birkaç toplantı daha!

Veri bilimcileri, gereksinimleri toplamak, yapılan işi tartışmak ve günün çalışmasını planlamak için çoğunlukla günlük olarak toplantılara katılmak zorundadır. Ayrıca kurumsal hedefler için önemli olan ve iş sorunlarının üstesinden gelen şirket içi toplantılar da vardır. Sonuç olarak, bu toplantıların amacı, eldeki sorunlar hakkında daha net bir fikir edinmek ve kuruluştaki herkesin ileriye giden yolda olduğundan emin olmaktır.

Verileri araştırın ve bozulmamış hale getirin!

Günlerinin bir kısmı, kuruluşlarının karşı karşıya olduğu gerçek dünya sorunlarını belirlemeye ve bu sorunları çözmede verilerinin yardımcı olmasını sağlamanın yollarını bulmaya geçer. Ardından daha zorlu bir kısım gelir - gereken veri türünü ve kaynağını belirlemek. Deneyimli bir veri bilimcisi, verileri her zaman en alakalı kaynaklardan, yani değer sağlaması muhtemel olanlardan seçer.

Ancak, bu deneyim ve uzmanlık ile gelen bir şeydir. Bu nedenle, veri bilimcilerinin üzerinde oldukça fazla zaman harcaması gerekiyor.

Ancak, verileri toplamak işin yalnızca yarısını yapar. Veri bilimcisi ayrıca verilerin doğrulandığından ve temizlendiğinden emin olmalıdır. Kusurlu verilerle çalışırlarsa başarılı olma şansları katlanarak azalır.

Veri Bilimi İçin İstatistiğin Temel Temelleri

Büyü yapmaya başla. Analitik demek istiyoruz.

Veriler tamamen temizlendiğinde, veri bilimcisi kalan zamanını verilerden eğilimleri ve kalıpları belirlemeye harcar. Bu, özellikle bu verileri verimli bir şekilde analiz etmek için belirlenmiş bir yöntem olmadığı için, bir veri bilimcisinin işinin bir başka sorunlu yönüdür. Çoğu zaman, bir veri bilimcisinin araçlarını ve algoritmalarını tasarlamasını veya mevcut olanlarla değiştirmesini gerektirir. Bu, açık bir zihin ve deney yapma isteği gerektirir.

Bir hikaye ör.

Veri kümelerini analiz ettikten sonra en önemli kısım olan veri görselleştirme gelir. Veri bilimcilerinin bulgularını, şirketin paydaşları ve pazarlamacıları gibi büyük ölçüde teknoloji dışı bir kitlenin önünde sunmaları gerekiyor. Bu her zaman günlük bir görev değildir, ancak işleri hareket halinde tutmak için sık sık yapılması gerekir. Veri bilimcisinin buradaki önemli iş yükü, yalnızca verilerinin özünü yakalamakla kalmayıp aynı zamanda her şeyi estetik açıdan hoş bir şekilde sunan bir görselleştirme tekniği bulmayı içerir.

Bir veri bilimcisinin rolü son derece dinamiktir; Onlar için iki gün aynı değildir. İşleri onların her zaman tetikte olmalarını ve her zaman düşünme şapkalarını takmalarını içerir. Çalıştıkları veriler, çözmeyi amaçladıkları sorunlar ve keşfetmek istedikleri içgörüler sürekli değişiyor. Bir veri bilimcisinin rolünü bu kadar benzersiz ve heyecan verici yapan şey budur.

Yeni Başlayanlar İçin Veri Bilimi ve Uygulamaları Kılavuzu

Şimdi, bir adım öne geçin ve bu tür, bazen akıl almaz efsanelerin daha fazlasını çürütün: video

Youtube videosu

Efsane 1: Doktora derecesine sahip uzman bir istatistikçi olmanız gerekir . istatistiklerde. Ya da en azından istatistik diplomanız olmalı.

Evet, resmi bir istatistik diplomasına sahip olmak, 1. günden itibaren istatistikte daha iyi uygulamalarla anlaşmaya varmanızı sağlayacaktır. Ancak, atlarınızı orada tutun – veri bilimi dünyasına bakarsanız, matematik bağımlısı “roket bilimcilerinden” daha yönetimsel/matematiksel olmayan bir arka plan.

Efsane #2: Veri biliminde başarılı olmak için sıkı bir programcı olmanız gerekir. Ne kadar hardcore, o kadar iyi.

Yine, birkaç satır önce tartıştığımız efsane gibi, bu da veri bilimcinin işi hakkında yanlış bir varsayıma dayanıyor. İnsanlar bir veri bilimcisi olmanın satırlarca kod ve algoritma yazmayı içerdiğini varsayıyor! Ancak, daha önce tartıştığımız rutine dikkat ettiyseniz, orada önemli bir “kodlama” olmadığını fark edeceksiniz. Algoritmaların veya yöntemlerin çoğu, sadece biraz ince ayar gerektirerek hazır olarak mevcuttur. Ancak, bunu yapmak için mantıklı bir zihne sahip olmanız gerekir.

Python ile Veri Bilimine Başlayın

Efsane #3: Veri bilimcileri, kelimenin tam anlamıyla bilim insanı değildir.

Her bilim insanı varsayılan olarak bir veri bilimcisidir. Saf bilim her zaman gözlemsel verilerle birlikte var olmuştur. Verilerini eleme, sıralama, yapılandırma, sınıflandırma, teorileştirme ve sunma yeteneği olmadan hiçbir bilim insanı çalışmalarına tutarlılık getiremez. Benzer şekilde, verilerinin kalbine derinlemesine girmemiş bir veri bilimcisi bulgularını etkili bir şekilde sunamaz. İstatistiksel kontroller her zaman saf bilimin temel taşı olmuştur ve şimdi bir veri bilimcisinin temel sorumluluklarıdır. Dolayısıyla, bir veri bilimcisi, bir kuruluşun müşterilerinin davranışlarındaki eğilimleri ve kalıpları gözlemliyorsa ve istatistikler ve gerçek dünya deneylerini kullanarak bulgularını doğruluyorsa, o bir bilim insanıdır, basit ve basittir.

Efsane #4: Veri bilimcileri, işlerini halletmek için maliyetli ve karmaşık istatistiksel araçlar üzerinde çalışırlar.

Esasen, bir veri bilimcisinin işi, onlardan geniş bir veri setinde gizli eğilimleri ve kalıpları aramasını gerektirir. Bunun için kullanıcı dostu görselleştirme araçlarını, self servis arama odaklı iş zekası araçlarını, etkileşimli veri araştırma araçlarını ve hatta çok fazla istatistiksel ustalık gerektirmeyen basit araçları kullanabilirler. Eklemek gerekirse, dünyanın birçok iş analisti, birincil elektronik tablo uygulamasındaki özellikleri modelleyerek bile derin içgörüler bulabilir.

Efsane #5: Veri bilimi, Hadoop kümelerine veri beslemek ve MapReduce kullanmakla ilgilidir. Basit!

İnsanlar efsaneleri yaymadan önce keşfetmeye çalışsaydı, burada olmazdık. Bir veri bilimcisi ile konuşursanız, veri bilimi ve analitiğinin Hadoop ve MapReduce'dan çok daha fazlası olduğunu fark edeceksiniz. Bu ikisi birçok araçtan sadece ikisi. Başarılı bir veri bilimi projesi çoğu zaman çeşitli aşamalarda bir dizi araç kullanır. Bu nedenle, bir veri bilimcisinin, gerektiğinde herhangi bir araç veya teknolojiye uygun geçişi yapmak için bu alanda meydana gelen herhangi bir büyük teknolojik gelişmenin zirvesinde olması beklenir. Veri Bilimi söz konusu olduğunda, bir ayakkabı herkese uymaz ve veri bilimi ruhlarının biz ölümlülerle konuşmasını sağlayacak sihirli bir Ouija tahtası yoktur.

Veri Biliminde Ustalaşmak İçin En İyi Adımlar, Güven Bana Onları Denedim

Umarız vizyonunuzu genişletmekten keyif almışsınızdır! Bizimle kalın; Daha fazla Mythbusters ile geri döneceğiz.

Doktora mı Veri Bilimcisi olmak zorunlu mu?

Bunu daha iyi anlamak için bir Veri Bilimcisinin rolünü iki alana ayıralım:

1. Uygulamalı Veri Bilimi rolü - Mevcut algoritmalarla çalışmak ve bunların nasıl işlediğini anlamak, Uygulamalı Veri Biliminin ana odak noktasıdır. Başka bir deyişle, bu yöntemleri projenize dahil etmekle ilgili. Veri Bilimi kariyeri ile ilgili kişilerin çoğunluğu bu kategoriye girer. İş ilanlarının ve iş tanımlarının çoğu genellikle bu rol için görülür.
2. Araştırma rolü – Araştırma rolüyle ilgileniyorsanız, doktora derecesine ihtiyacınız olabilir. Veri Biliminde Araştırma rolü, sıfırdan yeni algoritmalar oluşturmayı, araştırmayı, bilimsel makaleler yazmayı vb. içerir.

Yapay Zeka yakın gelecekte Veri Bilimcilerinin yerini alacak mı?

Veri Biliminin evriminde, yapay zekanın sonunda Veri Bilimcileri tarafından manuel olarak gerçekleştirilen işlemlerin yerini alacağını söylemek akla yatkındır. Bununla birlikte, bir bilgisayar, verileri temizlemeye, verimli bir model geliştirmeye, model doğruluğu üzerinde çalışmaya ve benzeri şeylere kendi başına karar veremez. Bu seçimler gerekli niteliklere sahip biri tarafından yapılır. Veri Bilimcilerine olan ihtiyacı azaltma umuduyla daha gelişmiş algoritmalar geliştirmeye yönelik girişimlerde bulunulsa bile, bunun çok yakında gerçekleşmesi olası değildir. En gelişmiş algoritmalarla bile, firmaları çalışır durumda tutmak, yine de sağlam muhakeme ve alan bilgisine sahip birini gerektirecektir.

Sadece Veri Bilimi araçlarında uzmanlaşarak Veri Bilimcisi olabilir miyim?

İstatistiksel araçların ve kitaplıkların nasıl kullanılacağını bilmenin sizi bir Veri Bilimcisi olarak nitelendirdiği yaygın bir yanılgıdır. Bu araçlarla çalışmak, onları daha iyi anlamanıza yardımcı olacaktır, ancak veri bilimi, çeşitli yetenekleri birleştiren bir beceri setidir. Onunla birlikte gelen araçlar hakkında bilgi edinmek, sürecin yalnızca bir yönüdür. Python veya R gibi araçları bilmenin yanı sıra, problem çözme gibi beceriler, kavramların tam olarak anlaşılması ve bir iş sorunu için gerekli olan doğru uygulamalar hakkında bilgi de ustalaşmak için hayati önem taşır.