Top 5 tipuri de date R | R Tipuri de date despre care ar trebui să știți

Publicat: 2020-09-28

Anumite variabile sunt necesare pentru a stoca datele pe care le utilizați în cadrul programului pentru a crea orice aplicație sau a reda orice programare în orice limbaj de programare. De asemenea, se poate observa (de obicei în limbajele tipice sau în majoritatea limbajelor de programare, cum ar fi C sau C++) că aceste variabile sunt atribuite unor categorii specifice. Aceste categorii sunt ceea ce ne referim ca tip de date.

Tipurile de date sunt un concept foarte important disponibil în aproape toate limbajele de programare. După cum indică și numele, un tip de date reprezintă un anumit tip de date care pot fi procesate folosind programul de calculator. Aflați despre diferitele tipuri de date din Python.

Spre deosebire de alte limbaje de programare, cum ar fi C, variabilele nu sunt pur și simplu declarate ca un tip de date R , ci sunt atribuite cu obiecte R. Tipul de date al obiectului R devine tipul de date al variabilei. Există mai multe tipuri de obiecte R, cele mai comune fiind:

  1. Vectori
  2. Matrici
  3. Liste
  4. Matrice
  5. Factori
  6. Cadre de date

Vectorii sunt cele mai elementare tipuri de date R care dețin elemente de diferite clase. Există cinci tipuri majore de date ale acestor vectori atomici. Celelalte R-Obiecte sunt construite pe vectorii atomici.

Învață cursuri de știință a datelor de la cele mai bune universități din lume. Câștigă programe Executive PG, programe avansate de certificat sau programe de master pentru a-ți accelera cariera.

Mai jos sunt menționate câteva dintre tipurile de date R utilizate în crearea vectorilor:

Cuprins

Tipuri de date de top R

1. Tip de date numerice

În limbajul de programare R, valorile zecimale se numesc numere. Este tipul de date implicit R atribuit tuturor valorilor din R. Să-l înțelegem cu ajutorul unui exemplu:

> y = 11,6 # atribuie o valoare zecimală variabilei y

> y # afișează valoarea lui y

[1] 11.6

> class(y) # afișează numele clasei lui y

[1] „numeric”

Aici, valoarea zecimală (11,6) a fost atribuită unei variabile „y”, al cărei tip de date este implicit numeric.

Chiar dacă dați variabilei o valoare non-zecimală, tipul ei de date implicit va fi în continuare numeric și nu un întreg. Iată un exemplu pentru tine:

> y = 1

> y # imprimă valoarea variabilei y

[1] 1

> class(y) # tipăriți numele clasei lui y

[1] „numeric”

Citiți: Variabile și tipuri de date în Python [Un ghid suprem pentru dezvoltatori]

2. Tip de date întreg

Numerele fără valori zecimale sunt declarate sub tipul de date întreg în limbajul de programare R. Pentru a crea o variabilă întreagă în R, funcția întreg este revocată. De asemenea, funcția is.integer poate fi aplicată pentru a se asigura că y este într-adevăr un întreg. Să ne uităm la câteva exemple pentru a înțelege tipul de date întreg:

> x = ca.întreg(5)

> x # imprimă valoarea lui x

[1] 5

> clasa(x)

[1] „întreg”

> is.integer(x) # pentru a se asigura dacă x este un număr întreg sau nu

[1] ADEVĂRAT

O altă modalitate de a declara un număr întreg este prin adăugarea unui sufix L.

> x = 5L

> is.integer(x) # pentru a se asigura dacă x este un număr întreg sau nu

[1] ADEVĂRAT

O valoare cu tip de date numerice poate fi forțată într-un tip de date întreg cu funcția as.integer.

> as.integer(7.16) # constrângerea unei valori numerice

[1] 7

Un șir cu valori zecimale poate fi, de asemenea, analizat folosind funcția as.integer.

> as.integer(“7.16”) # constrângerea unui șir zecimal

[1] 7

Cu toate acestea, ar fi greșit să analizați un șir non-zecimal la funcția întreg.

Checkout: Tipuri de date MATLAB

3. Tip de date complexe

O valoare complexă în limbajul de programare R este definită prin valoarea imaginară pură i.

> k = 1 + 2i # creând un număr complex

> k

[1] 1+2i

> clasa (k)

[1] „complex”

4. Tip de date logice

Tipurile de date logice din R iau valoare fie adevărată, fie falsă. Această valoare este generată după compararea celor două valori. Menționat mai jos este un exemplu pentru tine:

> l = 4; m = 2

> n = l > m # este l mai mare decât y?

> n # imprimarea valorii logice

[1] ADEVĂRAT

> class(n) # se imprimă numele clasei lui z

[1] „logic”

5. Tip de date caracter

Un tip de date caracter este utilizat pentru a reprezenta valorile șirurilor în limbajul de programare R. Obiectele sunt convertite în valori de caracter folosind funcția as.character (). Mai jos sunt menționate câteva exemple pentru a construi o înțelegere clară a tipului de date de caractere:

> y = ca.caracter(7.16)

> y # tipăriți șirul de caractere

[1] „7.16”

> class(y) # tipăriți numele clasei lui y

[1] „personaj”

Pentru a concatena două valori de caractere, poate fi utilizată o funcție de lipire.

> fname = „Riya”; lname =”Sharma”

> paste(fname, lname)

[1] „Riya Sharma”

Acum, deoarece ați dezvoltat o înțelegere a celor mai comune tipuri de date, să ne uităm la modul în care putem crea obiecte vectoriale și folosi tipurile de date pentru a declara valori.

Un vector este un set de elemente de date de același tip de date.

Mai jos este un vector care conține trei valori numerice 4, 5 și 6.

> c(4, 5, 6)

[1] 4 5 6

Și iată un vector de valori logice.

> c(FALS TRUE FALS TRUE)

[1] FALS ADEVĂRAT FALS ADEVĂRAT

Un vector poate conține și șiruri de caractere.

> c(„AA”, „BB”, „CC”, „DD”, „EE”)

[1] „AA” „BB” „CC” „DD” „EE”

Alte obiecte R

Matrici

Creează un set de date bidimensional. Iată un exemplu:

Creați o matrice.

M = matrice( c('q','w','e','r','t','y'), nrow = 2, ncol = 3, byrow = TRUE)

imprimare (M)

Ieșire –

[,1] [,2] [,3]

[1,] „q” „w” „e”

[2,] „r” „t” „y”

Liste

O listă este un tip de obiect care conține diferite tipuri de elemente: vectori, funcții și chiar alte liste.

Exemplu

# Creați o listă care să conțină vectori și valori numerice.

list1 <- list(c(2,5,3),7.9)

# Imprimați lista.

print(lista1)

Ieșire –

[[1]]

[1] 2 5 3

[[2]]

[1] 7.9

Matrice

Spre deosebire de matrice, tablourile pot avea n dimensiuni. Atributul dim folosit în matrice creează numărul necesar de dimensiuni. Menționat mai jos este un exemplu pentru a crea o matrice cu două elemente cu matrice 2X2.

Creați o matrice.

o matrice <-(c('roz','albastru'),dim = c(2,2,1))

imprima(a)

Când executăm codul de mai sus, acesta produce următorul rezultat -

, , 1

[,1] [,2]

[1,] „roz” „albastru”

[2,] „albastru” „roz”

Factori

Factorii sunt r-obiecte create folosind un vector. Factorii stochează vectorii cu valori distincte ale elementelor din vector sub formă de etichete. Etichetele au întotdeauna tipul de date caracter, indiferent de tipul de date din vectorul de intrare. Factorii sunt extrem de utili în realizarea modelării statistice.

Factorii pot fi creați folosind funcția factor().

# Creați un vector.

culori <- c('galben','albastru','roz')

# Creați un obiect factor.

factor_culori <- factor(culori)

# Imprimați factorul.

imprimare(factor_culori)

[1] galben albastru roz

Cadre de date

Cadrele de date sunt obiecte de date tabulare. Fiecare coloană dintr-un cadru de date poate conține diferite moduri de date. Toate cele trei coloane pot avea diferite tipuri de date, poate fi un întreg, numeric sau caracter.

Cadrele de date sunt create folosind funcția data.frame().

# Creați cadrul de date.

Date <- data.frame(

gen = c(„Bărbat”, „Femeie”),

înălțime = c(153, 160),

greutate = c(80, 78),

Vârsta = c(40 29)

)

imprimare (IMC)

Ieșire

sex înălțime greutate Vârsta

1 Masculin 153,0 80 40

2 Femeie 160,0 78 29

Citește și: Salariu pentru dezvoltatori R în India: pentru cei proaspăți și cu experiență

Ce urmează?

Dacă sunteți curios să aflați despre R, știința datelor, consultați Diploma noastră PG în știința datelor, care este creată pentru profesioniști care lucrează și oferă peste 10 studii de caz și proiecte, ateliere practice practice, mentorat cu experți din industrie, 1 cu mentori din industrie, peste 400 de ore de învățare și asistență profesională cu firme de top.

Care sunt dezavantajele utilizării limbajului de programare R?

În multe privințe, R este nesigur. Această caracteristică este disponibilă în majoritatea limbajelor de programare, inclusiv în Python. Ca rezultat, R are o varietate de dezavantaje, dintre care unul fiind incapacitatea de a fi utilizat într-o aplicație web. R este o limbă provocatoare de învățat. Curba de învățare este puțin complexă. Ca rezultat, învățarea lui R poate fi dificilă pentru persoanele care nu au mai codificat niciodată. R este conectat la limbajul de programare S, care este mult mai vechi. Aceasta înseamnă că pachetul de bază nu acceptă grafică dinamică sau 3D.

Ce sunt variabilele R?

Variabilele R sunt de obicei vectori (liste de date) și pot fi numerice sau text. Variabilele R sunt de obicei litere mici și folosim operatorul - pentru a le atribui valori. Utilizați funcția c pentru a crea un vector și apoi enumerați valorile.