Top 5 typów danych R | Typy danych R, o których powinieneś wiedzieć

Opublikowany: 2020-09-28

Pewne zmienne są potrzebne do przechowywania danych używanych w programie do tworzenia dowolnej aplikacji lub renderowania dowolnego programowania w dowolnym języku programowania. Można również zauważyć (zwykle w typowych lub większości języków programowania, takich jak C czy C++), że zmienne te są przypisane do określonych kategorii. Te kategorie są tym, co nazywamy typem danych.

Typy danych to bardzo ważna koncepcja dostępna w prawie wszystkich językach programowania. Jak sama nazwa wskazuje, typ danych reprezentuje określony rodzaj danych, które mogą być przetwarzane za pomocą programu komputerowego. Dowiedz się o różnych typach danych Pythona.

W przeciwieństwie do innych języków programowania, takich jak C, zmienne nie są po prostu deklarowane jako pewien typ danych R , ale są przypisywane obiektom R. Typ danych obiektu R staje się typem danych zmiennej. Istnieje kilka typów najczęściej używanych obiektów R:

Wektory
Matryce
Listy
Tablice
Czynniki
Ramki danych

Wektory to najbardziej podstawowe typy danych języka R, które zawierają elementy różnych klas. Istnieje pięć głównych typów danych tych wektorów atomowych. Inne obiekty R są zbudowane na wektorach atomowych.

Ucz się kursów nauki o danych z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.

Poniżej wymieniono niektóre typy danych R używanych do tworzenia wektorów:

Spis treści

Najlepsze typy danych R

1. Numeryczny typ danych

W języku programowania R wartości dziesiętne nazywane są numerami. Jest to domyślny typ danych R przypisany do wszystkich wartości w R. Zrozummy to za pomocą przykładu:

> y = 11,6 # przypisuje wartość dziesiętną do zmiennej y

> y # wypisuje wartość y

[1] 11,6

> class(y) # wyświetla nazwę klasy y

[1] „numeryczny”

Tutaj wartość dziesiętna (11,6) została przypisana do zmiennej „y”, której typ danych jest domyślnie numeryczny.

Nawet jeśli nadasz zmiennej wartość niedziesiętną, domyślnym typem danych nadal będzie liczba, a nie liczba całkowita. Oto przykład dla Ciebie:

> y = 1

> y # wypisz wartość zmiennej y

[1] 1

> class(y) # wypisz nazwę klasy y

[1] „numeryczny”

Przeczytaj: Zmienne i typy danych w Pythonie [Ostateczny przewodnik dla programistów]

2. Typ danych całkowitych

Liczby bez wartości dziesiętnych są deklarowane pod typem danych integer w języku programowania R. Aby utworzyć zmienną całkowitą w R, funkcja integer jest odwołana. Można również zastosować funkcję is.integer, aby upewnić się, że y jest rzeczywiście liczbą całkowitą. Spójrzmy na kilka przykładów, aby zrozumieć typ danych całkowitych:

> x = as.liczba całkowita(5)

> x # wypisz wartość x

[1] 5

> klasa(x)

[1] „liczba całkowita”

> is.integer(x) # funkcja zapewniająca, czy x jest liczbą całkowitą, czy nie

[1] PRAWDA

Innym sposobem zadeklarowania liczby całkowitej jest dodanie przyrostka L.

> x = 5L

> is.integer(x) # funkcja zapewniająca, czy x jest liczbą całkowitą, czy nie

[1] PRAWDA

Wartość o numerycznym typie danych można przekształcić w typ danych całkowitych za pomocą funkcji as.integer.

> as.integer(7.16) # wymuszenie wartości liczbowej

[1] 7

Łańcuch z wartościami dziesiętnymi można również przeanalizować za pomocą funkcji as.integer.

> as.integer(“7.16”) # przekształcenie ciągu dziesiętnego

[1] 7

Jednak błędem byłoby parsowanie ciągu niedziesiętnego do funkcji liczby całkowitej.

Zamówienie: typy danych MATLAB

3. Złożony typ danych

Złożona wartość w języku programowania R jest definiowana przez czystą wartość urojoną i.

> k = 1 + 2i # tworzenie liczby zespolonej

> k

[1] 1+2i

> klasa(k)

[1] „złożony”

4. Logiczny typ danych

Logiczne typy danych w R przyjmują wartość true lub false. Ta wartość jest generowana po porównaniu dwóch wartości. Wspomniany poniżej przykład dla Ciebie:

> l = 4; m = 2

> n = l > m # czy l jest większe niż y?

> n # drukowanie t wartości logicznej

[1] PRAWDA

> class(n) # wypisuje nazwę klasy z

[1] „logiczne”

5. Typ danych znaków

Typ danych znakowych jest używany do reprezentowania wartości ciągu w języku programowania R. Obiekty są konwertowane na wartości znakowe za pomocą funkcji as.character(). Poniżej wymieniono kilka przykładów pozwalających na zbudowanie jasnego zrozumienia typu danych znakowych:

> y = jako.znak(7.16)

> y # wypisz ciąg znaków

[1] „7.16”

> class(y) # wypisz nazwę klasy y

[1] „postać”

Aby połączyć dwie wartości znakowe, można użyć funkcji wklejania.

> fname = „Riya”; lname =”Sharma”

> wklej(fname, lname)

[1] „Riya Sharma”

Teraz, po zrozumieniu najpopularniejszych typów danych, przyjrzyjmy się, jak możemy tworzyć obiekty wektorowe i używać typów danych do deklarowania wartości.

Wektor to zbiór elementów danych tego samego typu.

Poniżej podano wektor zawierający trzy wartości liczbowe 4, 5 i 6.

> c(4, 5, 6)

[1] 4 5 6

A oto wektor wartości logicznych.

> c(FAŁSZ PRAWDA FAŁSZ PRAWDA)

[1] FAŁSZ PRAWDA FAŁSZ PRAWDA

Wektor może również zawierać ciągi znaków.

> c(„AA”, „BB”, „CC”, „DD”, „EE”)

[1] „AA” „BB” „CC” „DD” „EE”

Inne obiekty R

Matryce

Tworzy dwuwymiarowy zestaw danych. Oto przykład:

Utwórz macierz.

M = macierz( c('q','w','e','r','t','y'), nrow = 2, ncol = 3, byrow = TRUE)

drukuj (M)

Wyjście -

[,1] [,2] [,3]

[1,] „q” „w” „e”

[2,] „r” „t” „y”

Listy

Lista to typ obiektu zawierający różne typy elementów: wektory, funkcje, a nawet inne listy.

Przykład

# Utwórz listę zawierającą wektory i wartości liczbowe.

lista1 <- lista(c(2,5,3),7.9)

# Wydrukuj listę.

drukuj(lista1)

Wyjście -

[1]

[1] 2 5 3

[2]]

[1] 7,9

Tablice

W przeciwieństwie do macierzy, tablice mogą mieć n wymiarów. Atrybut dim używany w tablicach tworzy wymaganą liczbę wymiarów. Wspomniany poniżej przykład tworzenia tablicy z dwoma elementami z macierzami 2X2.

Utwórz tablicę.

a <- array(c('różowy','niebieski'),dim = c(2,2,1))

drukuj(a)

Kiedy wykonujemy powyższy kod, daje następujący wynik -

, , 1

[,1] [,2]

[1,] „różowy” „niebieski”

[2] „niebieski” „różowy”

Czynniki

Czynniki to r-obiekty utworzone za pomocą wektora. Współczynniki przechowują wektory z różnymi wartościami elementów w wektorze jako etykiety. Etykiety zawsze mają typ danych znakowych, niezależnie od typu danych w wektorze wejściowym. Czynniki są niezwykle przydatne w modelowaniu statystycznym.

Współczynniki można tworzyć za pomocą funkcji factor().

# Utwórz wektor.

kolory <- c('żółty','niebieski','różowy')

# Utwórz obiekt czynnikowy.

factor_colors <- factor(kolory)

# Wydrukuj współczynnik.

print(factor_colors)

[1] żółty niebieski różowy

Ramki danych

Ramki danych to obiekty danych tabelarycznych. Każda kolumna w ramce danych może zawierać różne tryby danych. Wszystkie trzy kolumny mogą mieć różne typy danych, może to być liczba całkowita, numeryczna lub znakowa.

Ramki danych są tworzone za pomocą funkcji data.frame().

# Utwórz ramkę danych.

Dane <- data.frame(

płeć = c(„Mężczyzna”, „Kobieta”),

wysokość = c(153, 160),

waga = c(80, 78),

Wiek = c(40 29)

)

drukuj (BMI)

Wyjście

płeć wzrost waga wiek

1 mężczyzna 153,0 80 40

2 Kobieta 160,0 78 29

Przeczytaj także: Wynagrodzenie programisty R w Indiach: dla świeżo upieczonych i doświadczonych

Co następne?

Jeśli jesteś ciekawy, aby dowiedzieć się o R, nauce o danych, sprawdź nasz dyplom PG w dziedzinie nauki o danych, który jest stworzony dla pracujących profesjonalistów i oferuje ponad 10 studiów przypadków i projektów, praktyczne warsztaty praktyczne, mentoring z ekspertami branżowymi, 1-na- 1 z mentorami branżowymi, ponad 400 godzin nauki i pomocy w pracy w najlepszych firmach.

Jakie są wady używania języka programowania R?

Pod wieloma względami R jest niepewny. Ta funkcja jest dostępna w większości języków programowania, w tym w Pythonie. W rezultacie R ma wiele wad, z których jedną jest niemożność użycia go w aplikacji internetowej. R to trudny język do nauki. Krzywa uczenia się jest nieco skomplikowana. W rezultacie nauka R może być trudna dla osób, które nigdy wcześniej nie kodowały. R jest połączony z językiem programowania S, który jest znacznie starszy. Oznacza to, że pakiet podstawowy nie obsługuje grafiki dynamicznej ani 3D.

Czym są zmienne języka R?

Zmienne R są zazwyczaj wektorami (listami danych) i mogą być numeryczne lub tekstowe. Zmienne R są zwykle małymi literami i używamy operatora - do przypisywania im wartości. Użyj funkcji c, aby utworzyć wektor, a następnie wypisz wartości.