R'de En Sık Kullanılan Altı Veri Yapısı
Yayınlanan: 2020-02-03Bir yazılım programcısı ve kodlayıcı olarak, verileri depolamak için değişkenlere olan ihtiyacın farkında olmalısınız. Bu değişkenler, değerleri depolamak için farklı bellek konumlarında saklanır. Bu nedenle, bir değişken oluşturmak, bellekte bir miktar yer ayırmak anlamına gelir. Bir bilgisayarda verimli bir şekilde kullanılmak üzere veri yapıları tarafından düzenlenen bu verilerdir.
C ve Java gibi popüler programlama dillerinden farklı olarak, R'nin veri olarak bildirilecek değişkenleri yoktur. R, gerekli değişkenin veri türü haline gelen R nesnelerine (veri yapıları) sahiptir. R'de çeşitli veri yapıları vardır. Ama önce veri yapılarının ne olduğunu anlayalım!
İçindekiler
Veri Yapıları nedir?
R'de veri yapıları, birden çok değeri tutan bir araçtır. R programlamada, tek değerli verilerin neredeyse hiç kullanılmadığını unutmayın. Birden çok sayı, kelime veya farklı türdeki değerleri bir araya getirmek için R kullanmak daha uygundur. Bu, veri yapılarının resme girdiği yerdir. Aynı anda büyük miktarda veriyle çalışmayı kolaylaştırmak için bu çoklu değerleri bir arada gruplandırırlar.
Veri yapıları, zvalue içinde depolanan veri türünü tanımlayan veri türlerinden oluşur. Örneğin, 13 sayısı sayısal bir veri türüdür , " on üç " ise dize olarak da adlandırılan bir karakter veri türüne sahiptir.
Artık buna hakim olduğunuza göre, farklı veri yapısı türlerini görelim.
Veri Yapısı Türleri
Veri analizini ve işlemlerini kolay ve verimli hale getirmek için R programlamada beş ana veri yapısı türü vardır.

Her birine ayrıntılı olarak bir göz atalım.
- Vektör
R Vektörlerinin işlevi, aynı veri türünden birden çok değeri gruplamaktır. R'deki en temel veri yapısı türüdür ve iki bölümü vardır: Atomik Vektörler ve Listeler. Ortak özellikleri şunlardır:
- İşlev türü (ne olduğu)
- Fonksiyonun uzunluğu (eleman sayısı)
- İşlevin niteliği (ek isteğe bağlı meta veriler)
Şimdi, Atomik Vektörler aynı veri türünü gruplamak için tasarlanırken, listeler farklı veri türlerini gruplayabilir. Dört tür Atomik Vektör vardır:
- Sayısal Veri Türü
- Tamsayı Veri Türü
- Karakter Veri Türü
- Mantıksal Veri Türü
c() işlevini kullanarak Vektörler oluşturabilirsiniz.
Örneğin:
Yukarıdaki kodu çalıştırırsanız, 1'den 30'a kadar tüm sayıları içeren 'thisVector' adında bir vektör oluşturulacaktır.
Karakter değerlerini bir Vektörde saklamak için, şu şekilde çift tırnak kullanmanız gerekir:
Bir vektörde farklı veri türlerini saklayabilirsiniz, ancak tüm değerler bir karakter türüne dönüştürülmeyeceği için tavsiye edilmez.
- Listeler
Yukarıda bahsedildiği gibi, Listeler herhangi bir türde veri öğesini içerebilir – dizeler, sayılar, vektörler ve hatta başka bir liste. Örneğin, 80 sayı, 30 kelime ve 42 vektörden oluşan bir liste oluşturabilirsiniz. Kullanılacak fonksiyon bir list() işlevidir.
Örnek vermek:
Çıktı:
Listeler başka listelere de sahip olabileceğinden, bazen özyinelemeli Vektörler olarak adlandırılırlar . Bu yüzden Atomik Vektörlerden çok farklıdırlar.
- Faktörler
Basitçe söylemek gerekirse, faktör yalnızca önceden tanımlanmış değerlerin saklanabileceği bir vektör türüdür. Öncelikle kategorik verileri depolamak için kullanılır. “Erkek”, “Kadın”, “DOĞRU”, “YANLIŞ” vb. gibi sütun değerlerini kategorize ederler.
Faktörler, hem dizelerin hem de tam sayıların içlerinde saklanabilmesi açısından heterojendir. Faktörler oluşturmak için factor() işlevini kullanın. Belirli bir değişken için birçok olası değer olduğunda ve hepsini bildiğinizde çok kullanışlıdırlar.
R programlamada, karakter vektörleri otomatik olarak vektöre dönüştürülür. Bunu bastırmak için stringsAsFactors = FALSE komutunu kullanabilir ve ardından her karakter vektörünü manuel olarak faktörlere dönüştürebilirsiniz.

- Veri Çerçeveleri
R'deki bu veri yapısı, veri analizini kolaylaştırmak için verileri tablo biçiminde temsil etmek için kullanılır. Eşit uzunlukta vektörler içerir, böylece iki boyutlu bir yapı oluşturur. Bir değişkenin değerlerini içeren sütunlar ve her sütunun bir dizi değerini içeren satırlar vardır.
Doğal olarak, veri çerçeveleri farklı veri türlerinin değerlerini depolayabilir. Ancak, her sütun aynı sayıda öğeye sahip olmalıdır. Örneğin, 1. sütunda 5 öğe varsa, 2. sütunda da 5 değer olmalıdır.
Veri çerçevelerinin bazı özel özellikleri vardır:
- Hiçbir sütun adı boş bırakılmamalıdır.
- Her satırın adı benzersiz olmalıdır.
- Sayısal, faktör veya karakter tipi verilerini bir veri çerçevesinde saklayabilirsiniz.
- Tüm sütunlar aynı sayıda veri öğesi içermelidir.
R'de içe aktarılan tüm veri kümeleri, otomatik olarak veri çerçeveleri olarak depolanır.
- matrisler
R'deki matris veri yapısı, Vektörler ve Veri Çerçeveleri arasında bir yerde durur. Matrisler, yalnızca aynı veri türünden öğeler içerebilen iki boyutlu veri kümeleridir. matrix() fonksiyonunu kullanarak bir matris oluşturabilirsiniz.
Sözdizimi : matrix(veri, nrow, ncol, byrow, dimnames)
Burada,
data = vektör olarak girdi elemanları
nrow = satır sayısı
ncol = sütun sayısı
byrow = satır bazında düzenleme
dimnames = sütunların/satırların adları
Örnek vermek:
Çıktı:
Faktörler karakter vektörleri gibi görünüp davransalar da, aslında tam sayılardır. Faktörleri sokmalara dönüştürmek için gsub() ve grepl() gibi işlevleri kullanın. nchar() kullanmak bir hata verecektir.
- diziler
Diziler çok boyutlu matrislerdir. Bir matris, iki boyutlu olması bakımından dizilerin özel bir durumudur. Matrisler yaygın olarak kullanılırken, diziler çok nadirdir.
Dizi oluşturma işlevi bir dizidir().
Bir nesnenin matris mi yoksa dizi mi olduğunu test etmek oldukça basittir. Sadece is.matrix() veya is.array() işlevini kullanın.
Egzersizler
R'deki veri yapıları hakkında yeterli bilgi edindiğinize göre şimdi yanıtlamaya çalışabileceğiniz bazı sorular.
- Veri çerçevelerinin özellikleri nelerdir?
- Veri çerçeveleri 0 satır veya sütun içerebilir mi?
- R'deki farklı Atomik Vektör türleri nelerdir?
- Atomik Vektörler ve Listeler arasındaki fark nedir?
- R'de bir 4X3 matrisi oluşturun.
Cevaplarınızı bize e-posta ile gönderin veya aşağıdaki yorumlara yazın!

Çözüm
R dilini yeterince kullanmak için, veri türlerinin, veri yapılarının ve nasıl çalıştıklarının iyi bir şekilde anlaşılması önemlidir. Bu öğeler, R'deki tüm etkinliklerin öncülüdür. Örneğin, çoğu programcının karşılaştığı tipik bir sorun, iyi bir R nesneleri bilgisi ile ortadan kaldırılabilen nesne dönüşümleridir. R'de her şeyin bir nesne olduğunu ve işlemlerin fonksiyon çağrıları olarak ilerlediğini not etmek zorunludur.
R'deki veri yapıları iki farklı şekilde sıralanabilir. Veri yapılarını ayırmanın başlıca yöntemi, 1, 2 veya n boyutlu olabilen boyutsallıklarına göredir ve sonraki yol, homojen veya heterojen olabilen öğelerin doğasına göredir. Homojen bir yapıdaki öğelerin her birinin benzer türden olması gerekirken, heterojen bir yapıda çeşitli türlerde öğelere izin verilir.
R'deki veri yapılarının temellerini öğrendikten sonra, R'de programlamayı çok daha kolay bulacaksınız. Veri yapıları R'nin temelleridir. En sık kullanılan altı veri yapısından yukarıda bahsedilmiştir. Verileri analiz etmek ve işlemlerini yürütmek için her türün farklı özelliklerini hatırlamak ve uygulamak önemlidir.
Büyük Veri hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 7+ vaka çalışması ve proje sağlayan, 14 programlama dili ve aracını kapsayan, pratik uygulamalı Büyük Veride Yazılım Geliştirme Uzmanlığı programında PG Diplomamıza göz atın çalıştaylar, en iyi firmalarla 400 saatten fazla titiz öğrenim ve işe yerleştirme yardımı.
Dünyanın En İyi Üniversitelerinden Online Yazılım Geliştirme Kursları öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.