Büyük Veri Mühendisleri: Mitler ve Gerçekler
Yayınlanan: 2018-05-07Kurumlarda mevcut olan veriler her geçen dakika artmaktadır. Bu veriler çeşitli biçimlerde, boyutlarda ve türlerdedir ve bu nedenle verimli bir şekilde analiz etmek şöyle dursun, incelenmesi bile son derece zordur. Buna yardımcı olmak için Büyük Veri Mühendisleri var! Bunlar, işe yaramaz Büyük Veriyi, daha sonra veri bilimcileri tarafından daha fazla incelenip analiz edilebilecek faydalı Büyük Veriye dönüştürmekten sorumlu kişilerdir.
Büyük Veri Mühendisleri, haklı olarak veri bilimcisi ve mühendis arasındaki bir karışım olarak adlandırılabilir. Varsayılan olarak büyük verilerle ilgilenen herhangi bir kuruluşun bir Büyük Veri Mühendisine ihtiyacı vardır.
Tipik olarak, bir Büyük Veri Mühendisinin rolü, aşağıdaki becerilerden birini (veya daha fazlasını) gerçekleştirmelerini gerektirir:
İçindekiler
Veri analizi
- Hadoop, MapReduce, IBM Biginsights, Hortonworks ve MapR, Büyük Veri Mühendislerinin veri analizi gerçekleştirmek için komuta etmesi beklenen araçlardan bazılarıdır. Çoğu mühendis yalnızca MapReduce ile deneyim sahibi olma eğilimindedir (çünkü en eskisi ve diğerleri oldukça yenidir), ancak temel alınan algoritmalar yeni teknolojileri hızlı ve verimli bir şekilde öğrenmeyi kolaylaştırır.
- Veri madenciliği, Veri analizinin temel yönlerinden biridir. Büyük Veri Mühendisleri, Veri Madenciliği ile ilgili işleri yürütmek için Mahout gibi teknolojiler üzerinde çalışır. Büyük Veri Mühendisinin ilk sorumluluğu, veriyi daha temizlemeden önce aramaktır. Bu nedenle, Mahout veya diğer veri madenciliği araçları konusunda yetkin olmaları gerekir.
- İstatistiksel analiz de önemli bir rol oynar ve bir Büyük Veri Mühendisinin R, SPSS, SAS ve MATLAB vb. üzerinde bir miktar komuta sahip olması beklenir.
- Büyük Veri Mühendisleri günün sonunda mühendislerdir. Programlamanın temellerini iyi bilmeleri gerekir. Güçlü programlama becerilerinin çoğu, yalnızca özel/özel algoritma uygulamaları için gerekli olacaktır.
Veri depolama
- Veri ambarı, verilerin bir ambara kaldırılması anlamına gelir. Bunun için bir büyük veri mühendisinin MySQL, MS SQL Server, Oracle veya herhangi bir ilişkisel veritabanlarından biri hakkında çalışma bilgisine sahip olması beklenir. Bu araçlar, önde gelen büyük veri mühendislerinin kuruluşlarında mevcut olan ilişkisel verileri sorunsuz bir şekilde ele almalarına olanak tanır.
- Bugün, tüm veriler yapılandırılmış ve ilişkisel değildir. Bu kuruluşlarla ilgili verilerin çoğu ilişkisel değildir. Bu nedenle, NoSQL, HBase, HDFS, Cassandra, CouchDB, vb. gibi ilişkisel olmayan veritabanları bilgisi de büyük bir veri mühendisi için oldukça kullanışlıdır.
Veri toplama
- Veri toplama, bir Büyük Veri Mühendisinin temel görevlerinden birini oluşturur. Veri API'leri ile çalışmaları gerekir, ör. Veri ambarından veri almak için RESTful arayüzleri. Bunun için, bazı betik dili ile uygulamalı olmaları gerekir.
- Ayrıca, Büyük Veri Mühendislerinin SQL ve veri modelleme konusunda uzman olmaları gerekir. Bu, verileri toplarken son derece kullanışlıdır. Veri modelleme, büyük veri mühendislerinin verileri ve karşılıklı bağımlılıklarını net bir şekilde görmelerini sağlar.
Veri Dönüşümü ve Temizliği
- Veriler toplandıktan sonra, artık bir Büyük Veri Mühendisinin birincil sorumluluğu, onu veri bilimcisi için uygun bir formata dönüştürmektir. Bunun için Informatica, DataStage, Redpoint ve SSIS gibi çeşitli ETL Araçları gelir. Bu araçlardan herhangi birinde yeterlilik, Büyük Veri Mühendislerinin daha önce topladıkları verileri verimli bir şekilde dönüştürmelerine olanak tanır.
- Veri dönüştürüldüğünde, tüm anormallikler ve tutarsızlıklardan temizlenir. Önemli çünkü bu veriler bir Veri Bilimcisi tarafından daha fazla analiz edilecek ve analizi ancak aldığı veriler kadar iyi olacak.
Büyük Veri Mühendisliği, her geçen gün artan fırsatlarla nispeten daha yeni bir alandır. Bir Büyük Veri mühendisi, daha önce tartıştığımız becerilerin ustasıdır. Ancak, tüm Büyük Veri Mühendisleri bu becerilerin hepsini bilmiyor. Her rol farklıdır, bu nedenle bazıları bu alanlardan birinde diğerlerine göre daha fazla uzmanlık bilgisi gerektirebilir. Ancak, bu becerilerden birinde uzman olan biri için, bu becerileri diğer alanlara çevirmek genellikle çok zor değildir. Şimdi bir Büyük Veri Mühendisinin sorumlulukları ve görevleri konusunda aynı sayfadayız.

Haydi bir adım daha ileri gidelim ve yaşamları, meslekleri ve nitelikleri hakkında bazı yaygın mitleri yıkalım:
Efsane 1: Bir veri bilimcisinin sıradan bir günü ile bir büyük veri mühendisi arasında pek bir fark yoktur.
Serimizi takip ediyorsanız daha iyi bilirsiniz. Veri bilimcisi, bir verideki eğilimleri, anlamları ve kalıpları arayan ve bir kuruluşun işleyişini iyileştiren eyleme dönüştürülebilir içgörüler formüle etmeye çalışan kişidir. Bir Büyük Veri Mühendisi ise, oldukça açık bir şekilde, veriler analiz edilmeden önce çalışır. Verileri temizlemekten ve veri bilimcisine mümkün olduğunca bozulmamış bir biçimde sunmaktan sorumludur.

Efsane #2: Büyük Veri mühendisleri, veri bilimcilerinden çok daha değerlidir (veya tam tersi).
Bu iş rollerinin her ikisinin de bir kuruluşun işleyişi için kendi önemi vardır. Verimli bir Büyük Veri mühendisi olmadan, bir veri bilimcisi iyi sonuçlar elde etmekte zorlanır. Benzer şekilde, uzman bir Veri Bilimcisi olmadan, kuruluş verilerinden ne yapacağını asla bilemez. Dolayısıyla, günün sonunda bu profillerin her ikisi de herhangi bir başarılı veri bilimi ekibinin temel direklerini oluşturduğundan, bu iş rollerini önemlerine göre sıralayamayız.
Pop-Kültürde Büyük Veri UygulamalarıEfsane #3: Büyük Veri Mühendisleri yalnızca büyük işletmelerde gereklidir.
Daha önce de söylediğimiz gibi, kuruluşunuz Büyük Veri ile ilgileniyorsa, bir Büyük Veri Mühendisine ihtiyacınız vardır. Bugün, büyük veya küçük herhangi bir kuruluş, terabaytlarca müşteri verisine sahiptir. Alanı ne olursa olsun, Büyük Verilerini anlamlandırarak işlevlerini iyileştiremeyen hiçbir şirket yoktur. Büyük Veriyi çevreleyen araçlar ve teknolojiler daha ucuz ve daha erişilebilir hale geldikçe, giderek daha fazla sayıda KOBİ Büyük Veri yolunu takip ediyor ve eğrinin önünde kalmalarına yardımcı olmak için Büyük Veri Mühendisleri ve Bilim Adamları atadı.

Efsane #4: Bir Büyük Veri Mühendisinin uzman bir programcı olması gerekir.
Bir Büyük Veri Mühendisinin, temel programlamanın ötesinde, verileri yönetme konusunda uzman olması gerekir. Çoğu zaman, kendi durumlarına uyan bir kütüphane veya çerçeve ile çalışan Büyük Veri Mühendisleri bulacaksınız. Bunlar hazır olarak gelir ve ağır kaldırma programlamasının çoğunu yapar. Yine de bir Büyük Veri mühendisinin, programlamanın altında yatan temelleri net bir şekilde anlaması önerilir. Bu, özel kullanım durumlarına bağlı olarak herhangi bir algoritmayı/çerçeveyi/kütüphaneyi ince ayar yapmalarına/değiştirmelerine yardımcı olacaktır. Ayrıca, bu büyük veri mühendisleri, verileri depolardan almaktan ve komut dosyaları yazmayı gerektiren temizlemeden sorumlu olduklarından, bazı komut dosyası dili bilgisi bir zorunluluktur.
Efsane #5: Büyük Veri mühendislerine yalnızca teknoloji şirketlerinde ihtiyaç vardır
Günümüzde kuruluşlar, müşterilerini daha iyi hedeflemek de dahil olmak üzere her şey için verileri kullanıyor. Müşteri verilerine ilişkin ayrıntılı bir içgörü, herhangi bir kuruluşun başarılı bir pazarlama kampanyası düzenlemesine olanak tanır. Büyük Veri Mühendisleri, hem teknoloji hem de teknoloji dışı kuruluşlar tarafından gereklidir. Doğru verilere erişimleri varsa, hemen hemen her kuruluş işlerinde daha iyi ve daha verimli hale gelebilir.
Büyük Veri: Bilmeniz Gereken Araçlar ve Teknolojiler
toparlamak
Bununla, bugünlük efsane avcılarımızın sonuna geliyoruz. Bizi izlemeye devam edin, daha fazla Mythbusters ile geri döneceğiz. Bozulması gereken başka efsanelerle karşılaşırsanız bize bildirin!
Büyük Veri hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 7+ vaka çalışması ve proje sağlayan, 14 programlama dili ve aracını kapsayan, pratik uygulamalı Büyük Veride Yazılım Geliştirme Uzmanlığı programında PG Diplomamıza göz atın çalıştaylar, en iyi firmalarla 400 saatten fazla titiz öğrenim ve işe yerleştirme yardımı.
Dünyanın En İyi Üniversitelerinden Online Yazılım Geliştirme Kursları öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.
