R Ściągawka: ta, którą powinieneś mieć pod ręką

Opublikowany: 2020-05-29

Spis treści

Wstęp

Status języka programowania R wyrósł ze zwykłego języka programowania stworzonego do analizy statystycznej do potężniejszego, wszechstronnego narzędzia. Baza użytkowników R również wzrosła w ciągu ostatnich kilku lat. Obecnie jest używany przez wielu programistów, naukowców i praktyków. Aby jak najlepiej wykorzystać dowolny język programowania, nauka uzyskiwania pomocy jest kluczowa, ponieważ błędy na pewno się zdarzają.

Tak więc, dzięki znajomości składni, wiedza o tym, jak uzyskać dostęp do plików pomocy języka R i znaleźć pomoc z innych źródeł, ma kluczowe znaczenie dla sukcesu jako programista języka R. Teraz przyda się ściągawka R. Ściągawka R zawiera wszystkie niezbędne funkcje wraz z wezwaniami do łatwego odniesienia programistów.

Dowiedz się więcej: samouczek R dla początkujących: zostań ekspertem w programowaniu R

Uzyskiwanie pomocy z językiem programowania R

Nawet najlepsze książki wprowadzające ludzi i ułatwiające im wejście w świat programowania w R same w sobie nie wystarczą. Czasami trzeba się nauczyć i uzyskać dostęp do plików pomocy języka R. Ten plik pomocy, o którym ciągle mówimy, przedstawia użytkownikowi szczegółowe informacje o tym, jak używać różnych zależności w R. Jak korzystać z konkretnej funkcji, dla każdej wbudowanej funkcji jest wypiekane w tych plikach pomocy. Na każdej z tych różnych stron pomocy znajdują się również przykłady kodu dotyczące korzystania z określonej funkcji.

Jeśli chcesz uzyskać dostęp do plików pomocy R, aby uzyskać pomoc na temat korzystania z określonej funkcji, będziesz musiał użyć dowolnej z funkcji wymienionych poniżej:

1. ?: Użycie pojedynczego znaku zapytania wyświetla pliki pomocy dotyczące dowolnej funkcji, do której użytkownik chce uzyskać pomoc. Na przykład „?data.frame” wyświetli stronę w plikach pomocy języka R, które zawierają dokumentację dotyczącą korzystania z funkcji data.frame().

2. ??: Jeśli chcesz wyszukać określony podciąg w plikach pomocy języka R, „???” wykona pracę za Ciebie. Jeśli więc chcesz poznać nazwy funkcji zawierającej w sobie słowo „lista”, wystarczy, że uruchomisz „??lista”, a problem zostanie rozwiązany

3. RSiteSearch(): Ta funkcja RSiteSearch() zasadniczo robi to, od czego została nazwana. Zasadniczo przeprowadza wyszukiwanie online dotyczące zapytania, które jest przekazywane jako parametr tej funkcji. Tak więc RSiteSearch („modele liniowe”) skompiluje wyszukiwanie na stronie internetowej „RSiteSearch” dla ciągu „modele liniowe”.

Jeśli masz problemy z uzyskaniem pomocy dla R, a wbudowana dokumentacja nie pasuje do Ciebie, istnieje wiele pakietów dodatkowych, które możesz zainstalować, aby uzyskać całą pomoc, której potrzebujesz z R. Pakiety takie jak „sos” są dostępne do pobrania, które oferuje CRAN. Ten pakiet R zawiera jasną i zwięzłą funkcję, która umożliwiłaby wyszukiwanie wszelkiego rodzaju zapytań we wszystkich plikach pomocy dostępnych na stronie „RSiteSearch”.

Instalacja pakietu jest również dość prosta. Wszystko, co musisz zrobić, to uruchomić kod install.packages(„sos”) w konsoli R, a następnie wystarczy załadować pakiet. Ładowanie pakietów można wykonać za pomocą biblioteki („sos”).

Po zainstalowaniu pakietu „sos” będziesz miał teraz dostęp do funkcji o nazwie findFn(). Ta funkcja findFn() przyjmuje parametr wyszukiwania jako argument, a następnie zwraca listę setek stron internetowych zawierających przekazany argument. Na przykład, jeśli uruchomisz funkcję findFn („regresja”) na konsoli R, napotkasz stronę internetową zawierającą wiele informacji.

Informacje zawierają łącza do wielu funkcji, które mają w nazwie słowo regresja, a nawet jeśli mają w tekście pomocy wyrażenie regresja, znajdziesz również odwołanie do nich, jeśli użyjesz funkcji findFn().

Przeczytaj: 6 ciekawych pomysłów na projekty R dla początkujących

Jak zaimportować dane do R

Poniższa tabela jest przydatna, ponieważ zawiera kilka funkcji, które przydadzą się, gdy chcesz zaimportować dane do R:

Funkcjonować Co to robi Przykład
odczyt.tabela() Ta funkcja odpowiada za odczytywanie danych, których kolumny nie są ze sobą połączone. Zwykle ta funkcja jest używana, gdy dane, które chcesz odczytać, mają kolumny oddzielone przecinkiem lub tabulatorem. Należy zwrócić uwagę na to, że możesz samodzielnie określić separator wraz z innymi różnymi argumentami, które dokładnie opisują dane, które R ma odczytać. read.table(plik= mojplik”, sep= t”,
nagłówek=FAŁSZ)
odczyt.csv() Ta funkcja w prostych słowach jest bardzo stonowaną lub rozwodnioną wersją metody read.table(). Ta funkcja została zakodowana na stałe w celu odczytywania danych z dowolnego pliku CSV, który jest przekazywany do tej funkcji jako argument. Pliki CSV to zazwyczaj arkusze kalkulacyjne i dokumenty MS Excel. read.csv(plik= mojplik”)
odczyt.csv2() Ta funkcja jest zasadniczo funkcją read.csv() z drobnymi poprawkami. Funkcja Read.csv2() ma ustawienie wstępne, w którym separatorem danych jest średnik, a przecinek służy jako przecinek zmiennoprzecinkowy lub dziesiętny. read.csv2(plik= mojplik”,
nagłówek=FAŁSZ)
odczyt.delim() Funkcja ta jest wykorzystywana, gdy głównym motywem jest odczytanie rozdzielonych plików. Domyślnym separatorem, który jest tutaj używany, jest tabulator. read.delim(plik= mojplik”,
nagłówek=PRAWDA)
skanowanie() Ta funkcja daje ci dokładniejszą i bardziej precyzyjną kontrolę nad danymi, które chcesz odczytać przez R, jeśli dane dane nie są tabelaryczne. scan("mój plik", pomiń=1,
nmax=10)
przeczytajLinie() Ta funkcja jest używana, gdy odczytywanie jednej linii na raz z pliku tekstowego jest wymaganym zadaniem, jakie ma wykonać program. readLines("mojplik")
przeczytaj.fwf Jeśli dane, które posiadasz mają daty w formacie o stałej szerokości, powinieneś użyć tej funkcji, ponieważ odczytuje daty w formacie o stałej szerokości. Mówiąc prościej, jeśli dane, które posiadasz, mają stałą liczbę znaków w każdej kolumnie, należy użyć tej funkcji. read.fwf("mojplik",
szerokości=c(1,2,3)

Zestaw funkcji, do których uzyskasz dostęp po uruchomieniu tego wiersza kodu, oraz cel, któremu służą, są wymienione poniżej:

Funkcjonować Co to robi Przykład
przeczytaj.spss Ta funkcja przyjmuje nazwę pliku SPSS jako argument i wczytuje ją do programu w języku R. read.spss("mojplik")
przeczytaj.dta Ta funkcja pobiera nazwę pliku w formacie binarnym Stata i wczytuje go do programu R. read.dta("mojplik")
przeczytaj.export Ta funkcja przyjmuje jako argument nazwę pliku eksportu SAS i wczytuje plik do programu R. read.export("mojplik")

Źródło

Sprawdź także: Dlaczego warto uczyć się R? 8 najważniejszych powodów, dla których warto się uczyć R

Różne typy danych i podstawowa manipulacja tabelami

1. Zasadniczo istnieją trzy typy danych, które mają duże znaczenie podczas programowania w R. Te trzy typy to: numeryczny, znakowy i czynnik. Możesz szybko wyszukać, jaki to typ danych, lub możesz również rzutować typ za pomocą następujących dwóch poleceń, odpowiednio, is.factor() i as.factor().

2. Jeśli zdarzy ci się zaimportować tabelę, której zmienne zawierają jeden lub więcej wpisów, które są znakami, wówczas R automatycznie rzuci tabelę jako typ danych czynnika. Jednak biorąc to pod uwagę, nadal możesz rzutować dane na wartości liczbowe, wymuszając R, używając polecenia = as.numeric(as.character(dat1$VAR1)).

3. Nazwy poleceń (dat1)=c(„ID”, „X”, „Y”, „Z”) faktycznie zmieniają nazwę zmiennej w zestawie danych. Musisz pamiętać, że długość wektora powinna odpowiadać liczbie zmiennych, które masz; w przeciwnym razie napotkasz błąd.

4. Polecenie fix (dat2) otwiera wszystkie dane, które masz w dokumencie arkusza kalkulacyjnego, w którym możesz edytować komórki za pomocą prostego dwukrotnego kliknięcia komórek.

5. Jeśli dane, które posiadasz zawierają tylko wartości liczbowe w tabeli, możesz wykonać transpozycję tabeli. Użyj, dat2 = t(dat1), a tabela o nazwie dat2 będzie zawierać transpozycję (zamieniając wszystkie wiersze w kolumny) tabeli danych zawartych w dat1.

Wskazówki dotyczące tworzenia losowych danych i losowego próbkowania

1. Funkcja rnorm(10) przyjmuje argument 10 i tworzy dziesięć losowych próbek. Te losowe próbki są generowane z rozkładu normalnego, który ma zerową średnią, a standardowe odchylenie zbioru danych wynosi 1.

2. Funkcja runif(10) pobiera dziesięć różnych losowych próbek, aby utworzyć rozkład, który jest jednorodny i którego wartość mieści się w zakresie od zera do jednego.

3. Funkcja round(rnorm(10)*3+15) pobiera dziesięć próbek, które są losowe z rozkładu normalnego, którego średnia wynosi 15, a jej odchylenie standardowe wynosi 3 i zmiennoprzecinkowe, które znajdują się w dane są usuwane za pomocą funkcji zaokrąglania.

4. Funkcja round(runif(10)*5+15) zwraca użytkownikowi losowe liczby całkowite o wartości od 15 do 20. Rozkład tych wartości będzie jednolity.

5. Funkcja sample(c(„A”, „B”, „C”), 10, replace=TRUE) pobiera próbkę i tworzy losową próbkę z dowolnego wektora, który został przekazany jako argument tej funkcji.

Ucz się kursów nauki o danych z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.

Wskazówki dotyczące przekształcania danych znajdujących się w tabeli danych

1. Wywołanie funkcji funkcji transformacji wykonane w ten sposób dat2=transform(dat1, VAR1=VAR1*0,4) mnoży wartości przechowywane w VAR1 przez 0,4, a następnie ponownie przypisuje pomnożoną wartość do VAR1.

2. Wywołanie funkcji transform może być również wykorzystane do tworzenia zmiennych z określonymi zależnościami od istniejących zmiennych. Jeśli wywołasz taką funkcję dat2=transform(dat1, VAR2=VAR1*2), utworzy nową zmienną o nazwie VAR2, która będzie zawierać wartość VAR1 pomnożoną przez czynnik dwa.

3. Możesz również wywołać funkcję transformacji, aby zmodyfikować wartości w dowolnym miejscu, którego potrzebujesz. Aby wykonać to zadanie, będziesz musiał wywołać funkcję taką jak dat2=transform(dat1, VAR1=ifelse(VAR3== „Site 1”, VAR1*0.4, VAR1)). Jak wspomniano wcześniej, wywołanie funkcji transformacji mnoży dane przechowywane w VAR1 dla wpisów danych, czyli miejsca znanego jako site 1. Wartość zmiennej VAR1 pozostaje taka sama wszędzie indziej.

Przeczytaj: 8 zdumiewających projektów data science w R dla początkujących

Wniosek

W ciągu ostatnich kilku lat świat programowania przeżywał boom języków. Te języki programowania mają na celu wyeliminowanie i skupienie uwagi na jednym aspekcie informatyki. Języki takie jak R mają solidne podejście do statystyki i nauki o danych, głównie ze względu na wbudowane funkcje, które posiada ten język.

Pracując w dowolnym języku programowania, posiadanie każdej komendy na wyciągnięcie ręki nie jest łatwym zadaniem. Teraz na ratunek przychodzi ściągawka R. Jedną rzeczą do zapamiętania jest to, że najlepszą ściągawką R jest ta, którą tworzysz.

Jakie jest znaczenie C w języku programowania R?

Funkcja C oznacza „Połącz” w języku programowania R. Ta funkcja służy do uzyskiwania danych wyjściowych przez przekazanie parametrów w funkcji. Możesz wyodrębnić dane na trzy różne sposoby za pomocą C w R: za pomocą polecenia c(row) do wyodrębniania wierszy, polecenia c(kolumna) do wyodrębniania kolumn i polecenia c(wiersz, kolumna) do wyodrębniania obu kolumn i wiersze.

Tutaj musisz podać wartość wierszy i kolumn w funkcji z zestawu danych, którego używasz. W odpowiedzi na to polecenie funkcja zwróci wektor. Poza tym możesz użyć funkcji c() do połączenia dwóch różnych wektorów.

Czym są funkcje języka R?

Funkcje to samodzielne moduły kodu, które służą do wykonywania określonego zadania. Zwykle funkcje przyjmują określoną strukturę danych, taką jak wartość, ramka danych, wektor lub cokolwiek i przetwarzają ją w celu zwrócenia wyniku. Argumenty są podawane w tych funkcjach w nawiasach w celu określenia wymagań.

Istnieją dwa rodzaje funkcji używanych w R: podstawowe i zdefiniowane przez użytkownika. Podstawowe funkcje to te, które są już dostępne w języku programowania R. Możesz uzyskać dostęp do tych funkcji z różnych pakietów lub bibliotek dostępnych w R. Każda funkcja jest używana w innym celu i do wykonania określonego zadania. Niektóre z podstawowych funkcji w R to sqrt(), round(), getwd() itp. Ponieważ nie jest możliwe wykonanie każdej akcji za pomocą podstawowych funkcji, musisz skorzystać z funkcji zdefiniowanych przez użytkownika pisząc własny kod do wykonywania określonych niestandardowych zadań. Funkcje te rozwijają się, gdy musisz wielokrotnie wykonywać określone czynności. Funkcja może Ci to ułatwić.

Jakie są niektóre z kluczowych cech języka programowania R?

Istnieje wiele sposobów, w jakie R może pomóc analitykom danych i analitykom danych. Niektóre z jego kluczowych cech pomagają mu wyróżnić się z tłumu języków statystycznych. Kluczowymi cechami są silne możliwości graficzne, możliwość wykonywania złożonych obliczeń statystycznych, uruchamianie kodu bez konieczności stosowania kompilatora, przepychanie danych, możliwości obsługi i przechowywania danych oraz możliwość generowania raportów w żądanych formatach.