R Cheat Sheet: Elinizin Altında Tutmanız Gereken
Yayınlanan: 2020-05-29İçindekiler
Tanıtım
R programlama dilinin durumu, istatistiksel analiz için yapılmış basit bir programlama dili olmaktan çok daha güçlü bir çok yönlü araca dönüşmüştür. R'nin kullanıcı tabanı da son birkaç yılda büyüdü. Şimdi bir dizi programcı, bilim adamı ve uygulayıcı tarafından kullanılıyor. Herhangi bir programlama dilinden en iyi şekilde yararlanmak için, nasıl yardım alınacağını öğrenmek çok önemlidir çünkü hataların olması zorunludur.
Bu nedenle, sözdizimi bilgisi ile, R yardım dosyalarına nasıl erişileceği ve diğer kaynaklardan nasıl yardım alınacağı bilgisi, bir R programcısı olarak başarı için kritik öneme sahiptir. Şimdi, R hile sayfasının kullanışlı olacağı yer burasıdır . R hile sayfası , programcıların kolay referansı için çağrılarıyla birlikte tüm hayati işlevleri içerir.
Daha Fazla Bilgi Edinin: Yeni Başlayanlar için R Eğitimi: R Programlamada Uzman Olun
R programlama diliyle ilgili yardım alma
İnsanları R'de programlama dünyasına tanıtmak için en iyi kitaplar bile tek başına yeterli değildir. Bazen kişinin R yardım dosyalarını öğrenmesi ve bunlara erişmesi gerekir. Bahsettiğimiz bu yardım dosyası, kullanıcıya R'de çeşitli bağımlılıkların nasıl kullanılacağına dair bir parça ayrıntılı bilgi sunar. Her yerleşik işlev için belirli bir işlevin nasıl kullanılacağı bu yardım dosyalarında pişirilir. Belirli işlevin nasıl kullanılacağına ilişkin kod örnekleri de bu farklı yardım sayfalarının her birinde bulunmaktadır.
R yardım dosyalarına erişmek istiyorsanız, belirli bir özelliğin nasıl kullanılacağı konusunda yardım almak için aşağıda listelenen işlevlerden herhangi birini kullanmanız gerekecektir:
1. ?: Tek bir soru işaretinin kullanılması, kullanıcının yardım almak istediği herhangi bir işleve ait yardım dosyalarını görüntüler. Örneğin, “?data.frame”, data.frame() işlevinin nasıl kullanılacağına ilişkin belgeleri içeren R yardım dosyalarındaki sayfayı görüntüler.
2. ??: R yardım dosyalarında belirli bir alt diziyi aramak istiyorsanız, “??” işi sizin için yapacak. Yani, içinde “list” kelimesini içeren bir fonksiyonun isimlerini öğrenmek istiyorsanız, yapmanız gereken tek şey “??list” komutunu çalıştırmak ve probleminiz çözülmüş olacaktır.
3. RSiteSearch(): Bu fonksiyon RSiteSearch() esasen adını aldığı şeyi yapar. Esasen bu işlev için parametre olarak iletilen sorgu hakkında çevrimiçi bir arama yapar. Böylece, RSiteSearch(“doğrusal modeller”), “doğrusal modeller” dizesi için “RSiteSearch” web sitesindeki aramayı derleyecektir.
R için yardım almakta zorlanıyorsanız ve hazır belgeler size iyi gelmiyorsa, R ile ihtiyacınız olan tüm yardımı almak için yükleyebileceğiniz birçok eklenti paketi vardır. “sos” gibi paketler CRAN tarafından sunulan indirilebilir. Bu R paketi, “RSiteSearch” web sitesinde bulunan tüm yardım dosyaları aracılığıyla her türlü sorguyu aramayı sağlayacak bazı açık ve özlü işlevler içerir.
Paketin kurulumu da oldukça basittir. Tek yapmanız gereken R konsolunda install.packages(“sos”) kodunu çalıştırmak, ardından paketi yüklemektir. Paket yükleme, kütüphane (“sos”) kullanılarak yapılabilir.
“sos” paketinin kurulumu ile artık findFn() adlı fonksiyona erişiminiz olacak. Bu findFn() işlevi, bağımsız değişken olarak arama parametresini alır ve ardından iletilen bağımsız değişkeni içeren yüzlerce web sayfasının listesini döndürür. Örneğin, R konsolunuza findFn (“regresyon”) işlevini çalıştırırsanız, birçok bilgi içeren bir web sayfası ile karşılaşırsınız.
Bilgiler, adında regresyon kelimesi bulunan birçok fonksiyona bağlantılar içerir veya yardım metinlerinde regresyon tümcesi olsa bile, findFn() fonksiyonunu kullanırsanız buna bir referans da bulacaksınız.
Okuyun: Yeni Başlayanlar İçin 6 İlginç R Projesi Fikri
Veriler R'ye nasıl aktarılır
Aşağıdaki tablo, verileri R'ye aktarmak istediğinizde çok kullanışlı olacak bazı işlevleri içerdiğinden kullanışlıdır:
İşlev | Bu ne yapar | Örnek vermek |
okuma.tablo() | Bu işlev, sütunları birleştirilmemiş verileri okumaktan sorumludur. Genellikle bu işlev, okumak istediğiniz verilerin sütunları virgül veya sekme ile ayrıldığında kullanılır. Unutulmaması gereken bir şey, R'nin okumasını istediğiniz verileri doğru bir şekilde tanımlayan diğer bazı farklı argümanların yanı sıra ayırıcıyı kendiniz belirleyebilmenizdir. | read.table(dosya= “ dosyam”, sep= “ t”, başlık=YANLIŞ) |
oku.csv() | Bu işlev, basit terimlerle, read.table() yönteminin oldukça sadeleştirilmiş veya kısaltılmış bir versiyonudur. Bu işlev, bağımsız değişken olarak bu işleve geçirilen herhangi bir CSV dosyasındaki verileri okumak için sabit kodlanmıştır. CSV dosyaları tipik olarak elektronik tablolar ve MS Excel belgeleridir. | read.csv(dosya= “ dosyam”) |
okuma.csv2() | Bu işlev, esasen küçük ince ayarlara sahip bir read.csv() işlevidir. Read.csv2() işlevi, verilerin ayırıcısının noktalı virgül olduğu ve virgülün kayan nokta veya ondalık nokta işlevi gördüğü bir ön ayara sahiptir. | read.csv2(dosya= “ dosyam”, başlık=YANLIŞ) |
oku.delim() | Bu işlev, ana amaç sınırlandırılmış dosyaları okumak olduğunda kullanılır. Burada kullanılan varsayılan ayırıcı sekmedir. | read.delim(dosya= “ dosyam”, başlık=DOĞRU) |
tarama() | Bu işlev, söz konusu veriler tablo halinde değilse, R tarafından okunmasını istediğiniz veriler üzerinde size daha iyi ve çok daha kesin bir kontrol sağlar. | tara(“dosyam”,atla=1, nmaks=10) |
okumaLines() | Bu fonksiyon, bir metin dosyasından bir defada bir satır okurken, programın yapmasını istediğimiz gerekli iştir. | readLines(“dosyam”) |
oku.fwf | Sahip olduğunuz veriler sabit genişlikli formatta tarihlere sahipse, bu işlevi kullanmalısınız çünkü tarihleri sabit genişlikli formatta okur. Daha basit bir deyişle, sahip olduğunuz veriler her sütunda sabit sayıda karakter içeriyorsa, bu işlev kullanılmalıdır. | read.fwf(“dosyam”, genişlikler=c(1,2,3) |
Bu kod satırını çalıştırdıktan sonra erişeceğiniz ana işlev ve hizmet ettikleri amaç aşağıda listelenmiştir:

İşlev | Bu ne yapar | Örnek vermek |
oku.spss | Bu işlev, argüman olarak bir SPSS dosyasının adını alır ve onu R programına okur. | read.spss(“dosyam”) |
okuma.dta | Bu işlev, Stata ikili biçiminin dosya adının girişini alır ve bunu R programına okur. | read.dta(“dosyam”) |
oku.xport | Bu işlev, bir SAS dışa aktarma dosyasının adının bağımsız değişkenini alır ve dosyayı R programına okur. | read.export(“dosyam”) |
Kaynak
Şuna da bakın: Neden R Öğrenin? R Öğrenmek için En İyi 8 Neden
Farklı veri türleri ve tabloların temel manipülasyonu
1. Temel olarak, R'de programlama yaparken büyük önem taşıyan üç veri türü vardır. Bu üç tür şunlardır: sayısal, karakter ve faktör. Bunun ne tür bir veri türü olduğunu hızlıca araştırabilir veya sırasıyla is.factor() ve as.factor() olmak üzere aşağıdaki iki komutu kullanarak da tip ataması yapabilirsiniz.
2. Değişkenleri karakter olan bir veya birden fazla girdi içeren bir tabloyu içe aktarırsanız, R otomatik olarak tabloyu faktörün veri türü olarak yayınlayacaktır. Bununla birlikte, komutu = as.numeric(as.character(dat1$VAR1)) kullanarak R'yi zorlayarak verileri yine de sayısala çevirebileceğiniz söyleniyor.
3. Komut adları (dat1)=c(“ID”, “X”, “Y”, “Z”) aslında veri kümenizdeki değişkeni yeniden adlandırır. Aklınızda bulundurmanız gerekecek ve vektör uzunluğu, sahip olduğunuz değişkenlerin sayısıyla eşleşmelidir; aksi takdirde bir hatayla karşılaşırsınız.
4. Komut düzeltmesi (dat2), sahip olduğunuz tüm verileri, hücrelere basit bir çift tıklama ile hücreleri düzenleyebileceğiniz bir elektronik tablo belgesinde açar.
5. Elinizdeki veriler tabloda sadece sayısal değerler içeriyorsa tablonun transpozisyonunu alabilirsiniz. dat2 = t(dat1) kullanın ve dat2 olarak adlandırılan tablo, dat1'de bulunan veri tablosunun devrik (tüm satırları sütunlara dönüştürerek) içerecektir.
Rastgele verilerin nasıl oluşturulacağı ve rastgele örneklemenin nasıl yapılacağı hakkında ipuçları
1. rnorm(10) işlevi, 10'un argümanını alır ve on rastgele örnek oluşturur. Bu rastgele örnekler, sıfır ortalaması olan normal bir dağılımdan üretilir ve veri setinin standart sapması 1 olur.
2. runif(10) işlevi, tek tip ve değeri sıfır ile bir arasında olan bir dağılım oluşturmak için on farklı rastgele örnek alır.
3. Round(rnorm(10)*3+15) işlevi, ortalaması 15 olan bir normal dağılımdan rastgele olan on örnek alır ve sahip olduğu standart sapma 3'tür ve orada bulunan kayan noktalar. veriler yuvarlama işlevi yardımıyla kaldırılır.
4. round(runif(10)*5+15) işlevi, kullanıcıya 15 ile 20 arasında bir değere sahip rastgele tamsayılar verir. Bu değerlerin dağılımı tek tip olacaktır.
5. İşlev sample(c(“A”, “B”, “C”)), 10, replace=TRUE) örnekler ve bu işleve argüman olarak geçirilen herhangi bir vektörden rastgele bir örnek oluşturur.
Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.
Veri tablosunun içindeki verilerin nasıl dönüştürüleceğine ilişkin ipuçları
1. Bu şekilde yapılan transform fonksiyonunun fonksiyon çağrısı dat2=transform(dat1, VAR1=VAR1*0.4), VAR1'de saklanan değerleri 0,4 ile çarpar ve ardından çarpılan değeri tekrar VAR1'e atar.
2. İşlev dönüşümünün çağrısı, mevcut değişkenlere belirli bağımlılıkları olan değişkenler oluşturmak için de kullanılabilir. Fonksiyonu dat2=transform(dat1, VAR2=VAR1*2) gibi çağırırsanız, VAR2 adında yeni bir değişken yaratacaktır, bu VAR1 değerini iki faktörle çarpacaktır.
3. Ayrıca, istediğiniz herhangi bir sitedeki değerleri değiştirmek için dönüştürme işlevini de çağırabilirsiniz. Bu görevi gerçekleştirmek için dat2=transform(dat1, VAR1=ifelse(VAR3== “Site 1”, VAR1*0.4, VAR1)) gibi bir işlevi çağırmanız gerekecek. Dönüştürme işlevinden daha önce bahsedildiği gibi çağrı, site 1 olarak bilinen yer olan veri girişleri için VAR1'de depolanan verileri çarpar. VAR1 değişkeninin değeri diğer her yerde aynı kalır.
Okuyun: Yeni Başlayanlar İçin R'de 8 Şaşırtıcı Veri Bilimi Projesi
Çözüm
Programlama dünyası, son birkaç yılda bir dil patlaması gördü. Bu programlama dilleri, bilgisayarların bir yönünü ortadan kaldırmayı ve dikkatini bu konuya odaklamayı amaçlıyor. R gibi diller, temel olarak bu dilin sahip olduğu yerleşik özelliklerden dolayı sağlam bir istatistiksel ve veri bilimi merkezli yaklaşıma sahiptir.
Herhangi bir programlama dilinde çalışırken, her komutun parmaklarınızın ucunda olması kolay bir iş değildir. Şimdi, R hile sayfasının kurtarmaya geldiği yer burasıdır . Her zaman hatırlamanız gereken bir şey, en iyi R hile sayfasının sizin oluşturduğunuz sayfa olmasıdır.
R programlama dilinde C'nin anlamı nedir?
C işlevi, R programlama dilinde 'Birleştir' anlamına gelir. Bu fonksiyon, fonksiyonda parametreler geçirilerek çıktı almak için kullanılır. R'de C kullanımıyla verileri üç farklı şekilde ayıklayabilirsiniz: satırları çıkarmak için c(row) komutunu, sütunları çıkarmak için c(column) komutunu ve her iki sütunu çıkarmak için c(satır, sütun) komutunu kullanarak ve satırlar.
Burada, kullanmakta olduğunuz veri kümesinden fonksiyondaki satır ve sütunların değerini sağlamanız gerekir. İşlev, bu komuta karşılık bir vektör döndürür. Bunun dışında iki farklı vektörü birleştirmek için c() işlevini kullanabilirsiniz.
R fonksiyonları nelerdir?
İşlevler, belirli bir görevi gerçekleştirmek için kullanılan bağımsız kod modülleridir. Genellikle işlevler, değer, veri çerçevesi, vektör veya herhangi bir şey gibi belirli bir veri yapısını alır ve bir sonuç döndürmek için işler. Gereksinimleri belirtmek için argümanlar bu işlevlerde parantez içinde iletilir.
R'de kullanılan iki tür işlev vardır: temel ve kullanıcı tanımlı. Temel işlevler, R programlama dilinde zaten mevcut olan işlevlerdir. Bu işlevlere R'de bulunan çeşitli paketlerden veya kitaplıklardan erişebilirsiniz. Her işlev farklı bir amaç ve belirli bir görevi tamamlamak için kullanılır. R'deki temel işlevlerden bazıları sqrt(), round(), getwd() vb.'dir. Her işlemi temel işlevler yardımıyla tamamlamak mümkün olmadığından, kullanıcı tanımlı işlevlerden yardım almanız gerekir. belirli özelleştirilmiş görevleri gerçekleştirmek için kendi kodunuzu yazarak. Bu işlevler, belirli eylemleri birden çok kez gerçekleştirmeniz gerektiğinde geliştirilir. Bir işlev bunu sizin için kolaylaştırabilir.
R programlama dilinin temel özelliklerinden bazıları nelerdir?
R'nin veri analistlerine ve veri bilimcilerine yardımcı olmasının birçok yolu vardır. Temel özelliklerinden bazıları, genel istatistiksel diller kalabalığından sıyrılmasına yardımcı olur. Güçlü grafik yetenekleri, karmaşık istatistiksel hesaplamalar yapabilme, herhangi bir derleyiciye ihtiyaç duymadan kod çalıştırabilme, veri karıştırma, veri işleme ve depolama kapasiteleri ve istenilen formatlarda raporlar oluşturabilme özelliği temel özellikleridir.