R programlamada Veri Görselleştirme: Yeni Başlayanların Öğrenmesi İçin En İyi Görselleştirmeler

Yayınlanan: 2020-01-22

Veri Analizine dahil olan herkes, şüphesiz Veri Görselleştirmeyi duymuş ve hatta onunla uğraşmıştır. Acemiyseniz, veri görselleştirme hakkında her şeyi buradan öğrenin. Veri Görselleştirme, Veri Analizinin çok önemli bir parçasıdır ve verilerin bir grafik, çizelge, çubuk veya başka herhangi bir formatta görsel temsilini ifade eder. Esasen, Veri Görselleştirmenin amacı, veriler ve görüntüler arasındaki ilişkiyi temsil etmek veya tasvir etmektir.

Büyük Veri'nin yükselişi, Veri Bilimcileri ve Veri Analistlerinin, anlaşılmasını kolaylaştırmak için görsel temsiller yoluyla elde edilen içgörüleri basitleştirmesini zorunlu hale getirdi. Veri Bilimcileri ve Analistleri artık büyük miktarlarda karmaşık ve hacimli veri kümeleriyle çalıştığından, Veri Görselleştirme her zamankinden daha önemli hale geldi. Veri Görselleştirme, eldeki verilerin görsel veya resimli bir özetini sunar, böylece Veri Bilimi ve Büyük Veri profesyonellerinin verilerdeki gizli kalıpları ve eğilimleri tanımlamasını kolaylaştırır.

Veri Görselleştirme sayesinde, Veri Bilimi ve Büyük Veri alanlarındaki profesyonellerin, bir elektronik tablodaki binlerce satır ve sütuna kapsamlı bir şekilde göz atmasına gerek yoktur - ilgili tüm bilgilerin bir veri kümesi içinde nerede olduğunu anlamak için görselleştirmeye başvurabilirler.

Tableau, QlikView ve d3.js gibi çok sayıda bağımsız ve şık Veri Görselleştirme araçlarımız olmasına rağmen, bugün R programlama dilinde Veri Görselleştirme hakkında konuşacağız. R, neredeyse tüm Veri Görselleştirme ihtiyaçlarını karşılayan birçok yerleşik işlev ve kitaplıkla birlikte geldiğinden, Veri Görselleştirme için mükemmel bir araçtır.

Bu yazıda, tüm dünyadaki Veri Bilimcileri ve Analistleri tarafından kullanılan 8 R Veri Görselleştirme aracını tartışacağız!

İçindekiler

En İyi 8 Veri Görselleştirme Aracı

1. Çubuk Grafik

Okullarda ve kolejlerde öğretilen çubuk grafiklere herkes aşinadır. Çubuk grafikli R Veri Görselleştirme'de kavram ve amaç aynı kalır - iki veya daha fazla değişken arasında bir karşılaştırma göstermektir. Çubuk grafikler, çeşitli gruplardaki kümülatif toplam arasındaki karşılaştırmayı gösterir. R'de bir çubuk grafik oluşturmak için standart sözdizimi şöyledir:

barplot(H,xlab,ylab,main, name.arg,col)

Benzersiz amaçlara hizmet eden birçok farklı çubuk grafik türü vardır. Yatay ve dikey çubuk grafikler standart biçimler olsa da, R bir grafikte hem yatay hem de dikey çubuklar oluşturabilir. Ayrıca R, her kategoriye farklı değişkenler eklemenize izin veren yığınlanmış bir çubuk grafik de sunar. R'de barplot(), çubuk grafikler oluşturmak için kullanılır.

2. Histogram

Histogramlar en iyi şekilde R'deki kesin sayılarla veya sayılarla çalışır. Bu gösterim, verileri bölmelere (kesmelere) ayırır ve bu bölmelerin sıklık dağılımını gösterir. Kutuları ince ayarlayabilir ve görselleştirme deseni üzerinde ne gibi bir etkisi olduğunu görebilirsiniz. R kullanarak bir histogram oluşturmak için standart sözdizimi şöyledir:

hist(v,main,xlab,xlim,ylim,breaks,col,kenarlık)

Histogramlar, bir değişkenin, yani bir projenin tamamlanmasından önceki zaman periyodunun bir olasılık tahminini sağlar. Bir histogramdaki her çubuk, o aralıkta bulunan değerlerin sayısının yüksekliğini temsil eder. R dili, histogramlar oluşturmak için hist() işlevini kullanır.

Kaynak

3. Kutu Arsa

Bir Kutu grafiği, minimum, 25. yüzdelik, medyan, 75. yüzdelik ve maksimum dahil olmak üzere istatistiksel olarak anlamlı beş sayıyı gösterir. Bir kutu grafiği, bir çubuk grafikle birçok benzerliği paylaşsa da, bir kutu grafiği, yalnızca kategorik verilere odaklanmak yerine kategorik ve sürekli değişken veriler için görselleştirme sağlar. R'de bir kutu grafiği oluşturmak için standart sözdizimi şöyledir:

boxplot(x, veri, çentik, değişken genişlik, isimler, ana)

R, boxplot() işlevini kullanarak kutu grafikleri oluşturur. Bu fonksiyon herhangi bir sayıda sayısal vektörü alabilir ve her vektör için bir kutu grafiği çizebilir. Kutu çizimleri, verilerin yayılmasını görselleştirmek ve buna göre buna dayalı çıkarımlar yapmak için en uygun olanıdır.

Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.

4. Dağılım Grafiği

Dağılım grafikleri, Kartezyen düzlemde çok sayıda noktayı gösterir, burada her nokta iki değişkenin değerlerini temsil eder. Yatay eksende bir değişken, dikey eksende ikinci değişken seçebilirsiniz. Bir dağılım grafiğinin işlevi, zaman içinde iki sürekli değişkeni izlemektir. R'de, bir dağılım grafiği oluşturmak için plot() işlevi kullanılır. R'de dağılım grafiği oluşturmak için standart sözdizimi şöyledir:

arsa(x, y, ana, xlab, ylab, xlim, ylim, eksenler)

Dağılım grafikleri , görselleştirmede yanlış bilgiden kaçınmak istediğiniz durumlar için harikadır . Bunlar, basit veri denetimi için en uygun olanlardır.

5. Korelogram

Bir korelogram veya korelasyon matrisi, bir veri kümesindeki her bir sayısal değişken çifti arasındaki ilişkiyi analiz eder. Tüm veri kümesine hızlı bir genel bakış sağlar. Korelogramlar, zaman içinde çeşitli noktalarda veri kümeleri arasındaki korelasyon miktarını da vurgulayabilir.

R'de GGally paketi, korelogramlar oluşturmak için idealdir. Klasik bir korelasyon grafiği (dağılım grafiği, korelasyon katsayısı ve değişken dağılımı ile) oluşturmak için ggpairs() işlevini kullanabilirsiniz. Korelogramlar oluşturmak için bir başka harika paket de corrgram paketidir. Bu pakette, gösterimin üst, alt ve diyagonal kısmında neyin görüntüleneceğini (dağılım grafiği, pasta grafiği, metin, elips vb.) seçebilirsiniz. Aşağıdaki gibi corrgram paketini kullanarak bir korelogram oluşturmak için:

düzeltme(x, sıra = , panel=, alt.panel=, üst.panel=, metin.panel=, diag.panel=)

Kaynak

6. Isı Haritası

Isı haritaları, bir matriste yer alan bireysel değerlerin farklı renklerle temsil edildiği verilerin grafiksel temsilleridir. Isı haritaları, eksen olarak iki boyut ile keşifsel veri analizi yapmanızı sağlar ve renk yoğunluğu üçüncü boyutu gösterir. R'de, ısı haritaları oluşturmak için ısı haritası() işlevi kullanılır. Bir ısı haritası oluşturmadan önce, aşağıdaki kodu kullanarak veri kümesini bir matris biçimine dönüştürmelisiniz:

> ısı haritası(as.matrix(mtcars))

R'de etkileşimli ısı haritaları oluşturmak için üç seçenek vardır:

  • plotly – Plotly ile ggplot2 ile yapılmış herhangi bir ısı haritasını etkileşimli bir ısı haritasına dönüştürebilirsiniz.
  • d3heatmap – Bu paket, etkileşimli ısı haritaları oluşturmak için temel R heatmap() işleviyle aynı sözdizimini kullanır.
  • heatmaply – Bu, tüm R paketlerinin en özelleştirilebilir olanıdır. Birçok farklı türde özelleştirme seçeneğini tercih etmenize olanak tanır.

7. Altıgen Bölme

Altıgen gruplama, yapıyı büyük n'li veri kümelerinde görselleştirmek için en uygun iki değişkenli histogram türüdür. Buradaki temel kavram şudur:

  • Düzenli bir altıgen ızgarası, XY düzlemini [aralık(x), aralık(y)] kümesi üzerinde noktalar.
  • Her altıgene düşen noktaların sayısı sayılır ve bir veri yapısı içinde saklanır.
  • Sayısı > 0 olan altıgenler, ya bir renk rampası kullanılarak ya da altıgenin yarıçapı sayımlarla orantılı olarak değiştirilerek çizilir.

Okuyun: Farklı Veri Bilimci Türleri

Burada çalışan algoritma, n ≥ 106 olan veri kümelerinin yapısını görüntülemede hem hızlı hem de etkilidir. R'de, hexbin paketi altıgen kutular oluşturmak, işlemek ve çizmek için çeşitli işlevler içerir. Bu paket, temel altıgen gruplama konseptini, iki değişkenli düzleştirmeyi yürütmek, yaklaşık iki değişkenli medyanı bulmak ve aynı ölçekte iki kutu seti arasındaki farkı incelemek için diğer birçok işlevle bütünleştirir.

8. Mozaik Arsa

R programlamada, mozaik çizim, beklenmedik durum tablosundan veya iki yönlü frekans tablosundan gelen verileri görselleştirirken kullanışlı olur. İki veya daha fazla kategorik değişken arasındaki ilişkiyi temsil eden iki yönlü bir beklenmedik durum tablosunun grafiksel gösterimidir. R mozaik çizimi, yüksekliğin orantılı değeri temsil ettiği bir dikdörtgen oluşturur. R'de bir mozaik grafiği oluşturmanın standart sözdizimi şöyledir:

mozaik grafiği(x, renk = NULL, ana = “Başlık”)

Esasen, bir mozaik çizim, aynı uzunluğa sahip bir kayıtlar listesinde kategorik değerlerin birlikte meydana gelmesinin koşullu olasılıklarını özetleyen bir omurga grafiğinin çok boyutlu bir uzantısıdır. İki veya daha fazla nitel değişkenden gelen verileri görselleştirmeye yardımcı olur.

Okuyun: Veri Bilimi ve Analitik Maaş

Toplama

Endüstrinin tüm sektörleri, veriye dayalı iş ve pazarlamayı desteklemek için Büyük Veriye güvenmeye devam ettikçe, Veri Görselleştirmenin önemi de eş zamanlı olarak artacaktır. Çizelgeler ve grafikler gibi görselleştirme teknikleri, Veri Görselleştirme için geleneksel elektronik tablolar ve eski raporlara göre çok daha verimli araçlar olduğundan, R Veri Görselleştirme araçları, Veri Bilimi ve Büyük Veri çevrelerinde giderek popülerlik kazanmaktadır.

Veri bilimi hakkında bilgi edinmek istiyorsanız, çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, 1'e 1 ile 1'e 1 sunan Veri Biliminde PG Diplomamıza göz atın. endüstri danışmanları, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Hangisini öğrenmeliyim- R veya Python?

Python ve R'nin her ikisinin de öğrenmesi oldukça basit kabul edilir. Python, yazılım geliştirme düşünülerek oluşturuldu. Java veya C++ ile önceden uzmanlığınız varsa, Python size R.R'den daha kolay gelebilir, diğer yandan istatistik konusunda bir geçmişiniz varsa biraz daha kolay olabilir. Python'un anlaşılması kolay sözdizimi öğrenmeyi kolaylaştırır. R'nin başlangıçta daha yüksek bir öğrenme eğrisi vardır, ancak siz onu uygulamaya devam ettikçe önemli ölçüde daha kolay hale gelir.

Tableau, veri görselleştirme için en iyi araç mı?

Tableau, iki nedenden dolayı piyasadaki en popüler veri görselleştirme araçlarından biridir: hem kullanımı basit hem de oldukça güçlüdür. Program yüzlerce kaynaktan veri alabilir ve grafikler, haritalar ve çok daha fazlasını içeren düzinelerce görselleştirme stili oluşturabilir.

R ve RStudio arasındaki farklar nelerdir?

R, istatistiksel hesaplama için bir programlama dilidir ve RStudio, R'den yararlanan istatistiksel bir programlama ortamıdır. R'de bir program oluşturabilir ve başka bir yazılım kullanmadan çalıştırabilirsiniz. Ancak, RStudio'nun verimli çalışması için R ile birlikte kullanılması gerekir.