R Cheat Sheet: Cel pe care ar trebui să-l ții la îndemână

Publicat: 2020-05-29

Cuprins

Introducere
Obține ajutor cu limbajul de programare R
Cum se importă date în R
Diferite tipuri de date și manipularea de bază a tabelelor
Sfaturi despre cum să creați date aleatorii și despre cum să faceți eșantionare aleatoare
Sfaturi despre cum să transformați datele care se află în interiorul tabelului de date
Concluzie
Care este semnificația lui C în limbajul de programare R?
Ce sunt funcțiile R?
Care sunt unele dintre caracteristicile cheie ale limbajului de programare R?

Introducere

Statutul limbajului de programare R a crescut de la un simplu limbaj de programare creat pentru analiză statistică la un instrument complet mai puternic. Baza de utilizatori a lui R a crescut, de asemenea, în ultimii ani. Acum este folosit de o mulțime de programatori, savanți și practicieni. Pentru a profita la maximum de orice limbaj de programare, învățarea cum să obțineți ajutor este esențială, deoarece erorile sunt neapărat să apară.

Deci, cu cunoștințele de sintaxă, cunoștințele despre cum să accesați fișierele de ajutor R și să găsiți ajutor din alte surse sunt esențiale pentru succesul ca programator R. Acum, iată unde va fi utilă foaia de înșelăciune R. Cheat sheet- ul R conține toate funcțiile vitale, împreună cu apelurile sale pentru o referință ușoară a programatorilor.

Aflați mai multe: Tutorial R pentru începători: Deveniți un expert în programare R

Obține ajutor cu limbajul de programare R

Chiar și cele mai bune cărți pentru a introduce oamenii și a le ușura drumul în lumea programării în R nu sunt suficiente singure. Uneori trebuie să înveți și să accesezi fișierele de ajutor R. Acest fișier de ajutor despre care tot vorbim îi prezintă utilizatorului o informație detaliată despre cum să folosească diferite dependențe în R. Cum să folosești o anumită funcție, pentru fiecare funcție încorporată este inclusă în aceste fișiere de ajutor. Exemplele de cod despre cum să utilizați funcția specifică sunt, de asemenea, acolo pe fiecare dintre aceste pagini de ajutor diferite.

Dacă doriți să accesați fișierele de ajutor R, pentru a obține ajutor cu privire la modul de utilizare a unei anumite caracteristici, va trebui să utilizați oricare dintre funcțiile enumerate mai jos:

1. ?: Utilizarea unui singur semn de întrebare afișează fișierele de ajutor referitoare la orice funcție pe care utilizatorul dorește să obțină ajutor. De exemplu, „?data.frame” ar vizualiza pagina din fișierele de ajutor R care conțin documentația despre cum să utilizați funcția data.frame().

2. ??: Dacă doriți să căutați un anumit subșir în fișierele de ajutor R, „???” va face treaba pentru tine. Deci, dacă vrei să știi numele unei funcții care conține cuvântul „listă” în ele, tot ce trebuie să faci este să rulezi „??list” și problema ta va fi rezolvată

3. RSiteSearch(): Această funcție RSiteSearch() face în esență după ce este numită. În esență, efectuează o căutare online despre interogarea care este transmisă ca parametru pentru această funcție. Deci, RSiteSearch(„modele liniare”) va compila căutarea pe site-ul web „RSiteSearch” pentru șirul „modele liniare”.

Dacă vă străduiți să obțineți ajutor pentru R și documentațiile integrate nu vă convin, există multe pachete suplimentare pe care le puteți instala pentru a obține tot ajutorul de care aveți nevoie cu R. Pachete precum „sos” sunt disponibil pentru descărcare, care este oferit de CRAN. Acest pachet R conține o funcție clară și concisă care ar face căutarea pentru tot felul de interogări prin toate fișierele de ajutor disponibile pe site-ul web „RSiteSearch”.

Instalarea pachetului este, de asemenea, destul de simplă. Tot ce trebuie să faceți este să rulați codul install.packages(„sos”) în consola R, apoi tot ce rămâne este să încărcați pachetul. Încărcarea pachetului se poate face prin utilizarea bibliotecii ("sos").

Odată cu instalarea pachetului „sos”, acum veți avea acces la funcția numită findFn(). Această funcție findFn() preia parametrul de căutare ca argument și apoi returnează lista cu sute de pagini web, care conțin argumentul care a fost transmis. Deci, de exemplu, dacă rulați funcția findFn („regresie”) în consola dvs. R, veți fi confruntat cu o pagină web care conține o mulțime de informații.

Informațiile includ link-uri către multe funcții care au cuvântul regresie în nume sau chiar dacă au expresia regresie în textul lor de ajutor, veți găsi și o referință la aceasta dacă utilizați funcția findFn().

Citiți: 6 idei interesante de proiecte R pentru începători

Cum se importă date în R

Următorul tabel este util deoarece conține câteva funcții care vă vor fi foarte utile atunci când doriți să importați date în R:

Funcţie	Ce face	Exemplu
citiți.tabel()	Această funcție este responsabilă pentru citirea datelor ale căror coloane nu sunt unite. De obicei, această funcție este folosită atunci când datele pe care doriți să le citiți au coloanele separate cu o virgulă sau o tabulatură. Un lucru de remarcat este faptul că puteți specifica singur separatorul alături de alte argumente diferite care descriu cu exactitate datele pe care doriți să le citească R.	read.table(fișier= „ fișierul meu”, sep= „ t”, antet=FALSE)
read.csv()	Această funcție în termeni bruti este o versiune foarte atenuată sau atenuată a metodei read.table(). Această funcție a fost codificată pentru a citi datele din orice fișier CSV care este transmis în această funcție ca argument. Fișierele CSV sunt de obicei foi de calcul și documente MS Excel.	read.csv(fișier= „ fișierul meu”)
read.csv2()	Această funcție este în esență o funcție read.csv() cu modificări minore. Funcția Read.csv2() are o presetare în care separatorul datelor este un punct și virgulă, iar virgula servește ca virgulă mobilă sau zecimală.	read.csv2(fișier= „ fișierul meu”, antet=FALSE)
read.delim()	Această funcție este utilizată atunci când motivul principal este citirea fișierelor care au fost delimitate. Separatorul implicit care este folosit aici este tab.	read.delim(fișier= „ fișierul meu”, antet=TRUE)
scaneaza()	Această funcție vă oferă un control mai fin și mult mai precis asupra datelor pe care doriți să le citiți de R dacă datele în cauză nu sunt tabelare.	scanare(„fișierul meu”, skip=1, nmax=10)
readLines()	Această funcție este utilizată atunci când citirea câte o linie dintr-un fișier text este sarcina necesară pe care vrem să o efectueze programul.	readLines(„fișierul meu”)
citeste.fwf	Dacă datele pe care le aveți au date în format fixed-width, atunci ar trebui să utilizați această funcție deoarece citește datele în format fixed-width. Cu cuvinte mai simple, dacă datele pe care le aveți au un număr fix de caractere în fiecare coloană, atunci această funcție ar trebui utilizată.	read.fwf(„fișierul meu”, lățimi=c(1,2,3)

Gazda funcției la care veți avea acces după ce rulați acea linie de cod și scopul pe care îl servesc sunt enumerate mai jos:

Funcţie	Ce face	Exemplu
citeste.spss	Această funcție preia numele unui fișier SPSS ca argument și îl citește în programul R.	read.spss(„fișierul meu”)
citeste.dta	Această funcție preia introducerea numelui fișierului în format binar Stata și îl citește în programul R.	read.dta(„fișierul meu”)
read.xport	Această funcție preia argumentul numelui unui fișier de export SAS și citește fișierul în programul R.	read.export ("fișierul meu")

Sursă

Consultați și: De ce să învățați R? Top 8 motive pentru a învăța R

Diferite tipuri de date și manipularea de bază a tabelelor

1. Practic, există trei tipuri de date care au o importanță majoră atunci când programați în R. Aceste trei tipuri sunt și anume: numerice, caractere și un factor. Puteți face rapid o căutare pentru ce tip de date este acesta sau puteți, de asemenea, să tipați folosind următoarele două comenzi, respectiv, is.factor() și as.factor().

2. Dacă se întâmplă să importați un tabel ale cărui variabile conțin una sau mai multe intrări, care sunt caractere, atunci R va arunca automat tabelul ca tipul de date al factorului. Cu toate acestea, acestea fiind spuse, puteți încă transforma datele în numere forțând R, folosind comanda= as.numeric(as.character(dat1$VAR1)).

3. Numele comenzii (dat1)=c(„ID”, „X”, „Y”, „Z”) redenumește de fapt variabila din setul de date. Va trebui să aveți în vedere și lungimea vectorului ar trebui să se potrivească cu numărul de variabile pe care le aveți; în caz contrar, vei întâlni o eroare.

4. Comanda fix (dat2) deschide toate datele pe care le aveți într-un document de foaie de calcul unde puteți edita celulele printr-un simplu dublu clic în celule.

5. Dacă datele pe care le aveți conțin doar valori numerice în tabel, puteți lua transpunerea tabelului. Utilizați, dat2 = t(dat1), iar tabelul numit dat2 va conține transpunerea (facerea tuturor rândurilor în coloane) a tabelului de date conținut în dat1.

Sfaturi despre cum să creați date aleatorii și despre cum să faceți eșantionare aleatoare

1. Funcția rnorm(10) preia argumentul lui 10 și creează zece eșantioane aleatorii. Aceste eșantioane aleatorii sunt generate dintr-o distribuție normală, care are o medie zero, iar abaterea standard a setului de date se întâmplă să fie 1.

2. Funcția runif(10) ia zece mostre aleatoare diferite pentru a crea o distribuție uniformă și a cărei valoare este între zero și unu.

3. Funcția round(rnorm(10)*3+15) ia zece eșantioane, care sunt aleatorii dintr-o distribuție normală a cărei medie este 15, iar abaterea standard pe care o are este de 3 și punctele mobile care sunt acolo în datele sunt eliminate cu ajutorul funcției de rotunjire.

4. Funcția round(runif(10)*5+15) îi dă utilizatorului înapoi numere întregi aleatorii, care au valoarea între valorile 15 și 20. Distribuția acestor valori va fi uniformă.

5. Funcția eșantion(c(“A”, “B”, “C”), 10, înlocuiți=TRUE) eșantionează și creează un eșantion aleatoriu din orice vector care a fost transmis ca argument acestei funcție.

Învață cursuri de știință a datelor de la cele mai bune universități din lume. Câștigă programe Executive PG, programe avansate de certificat sau programe de master pentru a-ți accelera cariera.

Sfaturi despre cum să transformați datele care se află în interiorul tabelului de date

1. Apelul de funcție al funcției de transformare făcut astfel dat2=transform(dat1, VAR1=VAR1*0.4), înmulțește valorile stocate în VAR1 cu 0,4 și apoi reatribuie din nou valoarea înmulțită la VAR1.

2. Apelul funcției de transformare poate fi folosit și pentru a crea variabile cu dependențe specifice de variabilele existente. Dacă apelați funcția astfel dat2=transform(dat1, VAR2=VAR1*2), aceasta va crea o nouă variabilă cu numele VAR2, care va conține valoarea lui VAR1 înmulțită cu un factor de doi.

3. De asemenea, puteți apela funcția de transformare pentru a modifica valorile la orice site specific de care aveți nevoie. Pentru a îndeplini această sarcină, va trebui să apelați funcția ca dat2=transform(dat1, VAR1=ifelse(VAR3== „Site 1”, VAR1*0.4, VAR1)). Apelul, așa cum sa menționat mai devreme al funcției de transformare, înmulțește datele stocate în VAR1 pentru intrările de date, care sunt locul cunoscut sub numele de site 1. Valoarea variabilei VAR1 rămâne aceeași peste tot.

Citiți: 8 proiecte uimitoare de știință a datelor în R pentru începători

Concluzie

Lumea programării a cunoscut un boom de limbaje în ultimii ani. Aceste limbaje de programare au ca scop eradicarea și concentrarea atenției asupra unui aspect al calculului. Limbile precum R au o abordare solidă statistică și centrată pe știința datelor, în principal datorită caracteristicilor integrate pe care le posedă acest limbaj.

În timp ce lucrați în orice limbaj de programare, să aveți fiecare comandă la îndemâna degetelor nu este o sarcină ușoară. Acum, aici este locul în care foaia de cheat R vine în ajutor. Un lucru de reținut întotdeauna este că cea mai bună foaie de cheat R este cea pe care o creați.

Care este semnificația lui C în limbajul de programare R?

Funcția C înseamnă „Combinare” în limbajul de programare R. Această funcție este utilizată pentru obținerea ieșirii prin trecerea parametrilor în funcție. Puteți extrage date în trei moduri diferite folosind C în R: folosind comanda c(row) pentru extragerea rândurilor, comanda c(coloana) pentru extragerea coloanelor și comanda c(row, column) pentru extragerea ambelor coloane și rânduri.

Aici, trebuie să furnizați valoarea rândurilor și coloanelor din funcția din setul de date pe care îl utilizați. Funcția va returna un vector la această comandă. În afară de asta, puteți utiliza funcția c() pentru a combina doi vectori diferiți.

Ce sunt funcțiile R?

Funcțiile sunt module de cod autonome care sunt utilizate pentru realizarea unei sarcini specifice. De obicei, funcțiile preiau o anumită structură de date, cum ar fi valoare, cadru de date, vector sau orice altceva și o procesează pentru a returna un rezultat. Argumentele sunt trecute în aceste funcții între paranteze pentru specificarea cerințelor.

Există două tipuri de funcții utilizate în R: de bază și definite de utilizator. Funcțiile de bază sunt cele care sunt deja disponibile în limbajul de programare R. Puteți accesa aceste funcții din diferite pachete sau biblioteci care sunt disponibile în R. Fiecare funcție este utilizată pentru un scop diferit și pentru a finaliza o anumită sarcină. Unele dintre funcțiile de bază din R sunt sqrt(), round(), getwd(), etc. Deoarece nu este posibil să finalizați fiecare acțiune cu ajutorul funcțiilor de bază, trebuie să luați ajutorul funcțiilor definite de utilizator. prin scrierea propriului cod pentru a efectua anumite sarcini personalizate. Aceste funcții sunt dezvoltate atunci când trebuie să efectuați anumite acțiuni de mai multe ori. O funcție vă poate face acest lucru mai ușor.

Care sunt unele dintre caracteristicile cheie ale limbajului de programare R?

Există o mulțime de moduri în care R poate ajuta analiștii de date și oamenii de știință de date. Unele dintre caracteristicile sale cheie îl ajută să iasă în evidență din mulțimea generală a limbajelor statistice. Caracteristicile cheie sunt capabilități grafice puternice, capacitatea de a efectua calcule statistice complexe, rularea codului fără a fi nevoie de vreun compilator, zbaterea datelor, capacitatea de manipulare și stocare a datelor și capacitatea de a genera rapoarte în formatele dorite.