R 치트 시트: 보관해야 하는 정보

게시 됨: 2020-05-29

목차

소개

R 프로그래밍 언어의 위상은 통계 분석을 위해 만들어진 단순한 프로그래밍 언어에서 보다 강력한 만능 도구로 성장했습니다. R의 사용자 기반도 지난 몇 년 동안 성장했습니다. 현재 많은 프로그래머, 학자 및 실무자들이 사용하고 있습니다. 프로그래밍 언어를 최대한 활용하려면 오류가 발생하기 마련이므로 도움을 받는 방법을 배우는 것이 필수적입니다.

따라서 구문 지식과 함께 R 도움말 파일에 액세스하고 다른 소스에서 도움말을 찾는 방법에 대한 지식은 R 프로그래머로서 성공하는 데 중요합니다. 이제 R 치트 시트 가 유용할 것입니다. R 치트 시트 에는 프로그래머가 쉽게 참조할 수 있도록 모든 필수 기능이 포함되어 있습니다 .

자세히 알아보기: 초보자를 위한 R 자습서: R 프로그래밍 전문가가 되십시오.

프로그래밍 언어 R에 대한 도움말 얻기

사람들을 소개하고 R 프로그래밍의 세계로 쉽게 들어갈 수 있는 최고의 책들만으로는 충분하지 않습니다. 때때로 R 도움말 파일을 배우고 액세스해야 합니다. 우리가 계속 이야기하는 이 도움말 파일은 사용자에게 R에서 다양한 종속성을 사용하는 방법에 대한 자세한 정보를 제공합니다. 모든 내장 기능에 대해 특정 기능을 사용하는 방법은 이러한 도움말 파일에 포함되어 있습니다. 특정 기능을 사용하는 방법에 대한 코드 예제는 이러한 다양한 도움말 페이지에도 있습니다.

R 도움말 파일에 액세스하고 특정 기능을 사용하는 방법에 대한 도움말을 얻으려면 아래 나열된 기능 중 하나를 사용해야 합니다.

1. ?: 단일 물음표를 사용하면 사용자가 도움을 받고자 하는 기능과 관련된 도움말 파일을 표시합니다. 예를 들어, "?data.frame"은 함수 data.frame()을 사용하는 방법에 대한 문서가 포함된 R 도움말 파일의 페이지를 봅니다.

2. ??: R 도움말 파일에서 특정 부분 문자열을 검색하려면 "??" 당신을 위해 일을 할 것입니다. 따라서 "list"라는 단어가 포함된 함수의 이름을 알고 싶다면 "??list"를 실행하기만 하면 문제가 해결됩니다.

3. RSiteSearch(): 이 함수 RSiteSearch()는 기본적으로 이름을 따서 수행합니다. 본질적으로 이 함수의 매개변수로 전달된 쿼리에 대한 온라인 검색을 수행합니다. 따라서 RSiteSearch("선형 모델")는 "선형 모델" 문자열에 대해 "RSiteSearch" 웹사이트에서 검색을 컴파일합니다.

R에 대한 도움을 받기 위해 고군분투하고 기본 제공 문서가 잘 맞지 않는다면 R에 필요한 모든 도움을 얻기 위해 설치할 수 있는 많은 추가 기능 패키지가 있습니다. "sos"와 같은 패키지는 CRAN에서 제공하는 다운로드가 가능합니다. 이 R 패키지에는 "RSiteSearch" 웹사이트에서 사용할 수 있는 모든 도움말 파일을 통해 모든 종류의 쿼리를 검색할 수 있는 명확하고 간결한 기능이 포함되어 있습니다.

패키지 설치도 상당히 간단합니다. R 콘솔에서 install.packages("sos") 코드를 실행하기만 하면 패키지를 로드하기만 하면 됩니다. 패키지 로딩은 라이브러리("sos")를 사용하여 수행할 수 있습니다.

"sos" 패키지를 설치하면 이제 findFn()이라는 함수에 액세스할 수 있습니다. 이 findFn() 함수는 검색 매개변수를 인수로 받은 다음 전달된 인수가 포함된 수백 개의 웹 페이지 목록을 반환합니다. 따라서 예를 들어 findFn("회귀") 기능을 R 콘솔에 실행하면 많은 정보가 포함된 웹 페이지에 직면하게 됩니다.

정보에는 이름에 회귀라는 단어가 있는 많은 함수에 대한 링크가 포함되어 있습니다. 또는 도움말 텍스트에 회귀라는 문구가 있더라도 findFn() 함수를 사용하면 해당 함수에 대한 참조도 찾을 수 있습니다.

읽기: 초보자를 위한 6가지 흥미로운 R 프로젝트 아이디어

데이터를 R로 가져오는 방법

다음 표에는 데이터를 R로 가져올 때 매우 유용한 몇 가지 기능이 포함되어 있어 편리합니다.

함수 그것이 하는 일 예시
read.table() 이 함수는 열이 결합되지 않은 데이터를 읽는 역할을 합니다. 일반적으로 이 기능은 읽고자 하는 데이터의 열이 쉼표나 탭으로 구분된 경우에 사용됩니다. 한 가지 주목해야 할 점은 R이 읽기를 원하는 데이터를 정확하게 설명하는 다른 인수와 함께 구분 기호를 직접 지정할 수 있다는 것입니다. read.table(파일= " myfile", sep= " t",
헤더=거짓)
read.csv() 조잡한 용어로 이 함수는 read.table() 메서드의 매우 축소되거나 축소된 버전입니다. 이 함수는 인수로 이 함수에 전달되는 CSV 파일에서 데이터를 읽도록 하드 코딩되었습니다. CSV 파일은 일반적으로 스프레드시트 및 MS Excel 문서입니다. read.csv(파일= " 마이파일 ")
read.csv2() 이 함수는 본질적으로 약간의 조정이 있는 read.csv() 함수입니다. Read.csv2() 함수에는 데이터 구분 기호가 세미콜론이고 쉼표가 부동 소수점 또는 소수점 역할을 하는 사전 설정이 있습니다. read.csv2(파일= " 마이파일 ",
헤더=거짓)
read.delim() 이 기능은 구분된 파일을 읽는 것이 주된 동기일 때 사용합니다. 여기에서 사용되는 기본 구분 기호는 탭입니다. read.delim(파일= " 마이파일 ",
헤더=TRUE)
주사() 이 기능을 사용하면 문제의 데이터가 표 형식이 아닌 경우 R에서 읽고자 하는 데이터를 보다 정밀하고 정확하게 제어할 수 있습니다. scan("myfile", 건너뛰기=1,
nmax=10)
readLines() 이 함수는 텍스트 파일에서 한 번에 한 줄을 읽는 것이 프로그램이 수행하기를 원하는 필수 작업일 때 사용됩니다. readLines("myfile")
읽기.fwf 가지고 있는 데이터에 고정 너비 형식의 날짜가 있는 경우 고정 너비 형식의 날짜를 읽기 때문에 이 함수를 사용해야 합니다. 간단히 말해서, 보유하고 있는 데이터의 각 열에 고정된 수의 문자가 있는 경우 이 기능을 사용해야 합니다. read.fwf("마이파일",
너비=c(1,2,3)

해당 코드 줄을 실행한 후 액세스할 수 있는 기능의 호스트와 해당 기능이 제공하는 목적은 다음과 같습니다.

함수 그것이 하는 일 예시
읽기.spss 이 함수는 SPSS 파일의 이름을 인수로 받아 R 프로그램으로 읽어들입니다. read.spss("마이파일")
읽기.dta 이 함수는 Stata 바이너리 형식의 파일 이름을 입력받아 R 프로그램으로 읽어들입니다. read.dta("마이파일")
읽기.xport 이 함수는 SAS 내보내기 파일 이름의 인수를 취하고 파일을 R 프로그램으로 읽습니다. read.export("내 파일")

원천

또한 확인하십시오: 왜 R을 배우는가? R을 배워야 하는 8가지 이유

다양한 데이터 유형과 테이블의 기본 조작

1. 기본적으로 R로 프로그래밍할 때 중요한 세 가지 데이터 유형이 있습니다. 이 세 가지 유형은 즉, 숫자, 문자 및 인수입니다. 어떤 종류의 데이터 유형인지 빠르게 검색하거나 다음 두 명령을 각각 사용하여 유형 변환할 수도 있습니다. is.factor() 및 as.factor().

2. 변수에 문자인 하나 이상의 항목이 포함된 테이블을 가져오는 경우 R은 자동으로 테이블을 요인의 데이터 유형으로 캐스트합니다. 그러나 명령= as.numeric(as.character(dat1$VAR1))을 사용하여 R을 강제 실행하여 데이터를 숫자로 변환할 수 있다고 합니다.

3. 명령 이름 (dat1)=c("ID", "X", "Y", "Z")는 실제로 데이터 세트의 변수 이름을 바꿉니다. 명심해야 하며 벡터 길이는 가지고 있는 변수의 수와 일치해야 합니다. 그렇지 않으면 오류가 발생합니다.

4. 수정(dat2) 명령은 스프레드시트 문서에 있는 전체 데이터를 열어 셀을 간단히 두 번 클릭하여 셀을 편집할 수 있습니다.

5. 가지고 있는 데이터가 테이블에 숫자 값만 포함되어 있는 경우 테이블을 전치할 수 있습니다. dat2 = t(dat1)을 사용하고 dat2로 명명된 테이블은 dat1에 포함된 데이터 테이블의 전치(모든 행을 열로 만들기)를 포함합니다.

무작위 데이터를 생성하는 방법 및 무작위 샘플링을 수행하는 방법에 대한 팁

1. rnorm(10) 함수는 10의 인수를 받아 10개의 무작위 샘플을 생성합니다. 이 무작위 샘플은 평균이 0이고 데이터 세트의 표준 편차가 1인 정규 분포에서 생성됩니다.

2. runif(10) 함수는 10개의 다른 무작위 샘플을 취하여 균일하고 값이 0과 1 사이인 분포를 생성합니다.

3. round(rnorm(10)*3+15) 함수는 평균이 15이고 표준 편차가 3인 정규 분포에서 무작위로 추출한 10개의 샘플을 취합니다. 데이터는 반올림 함수의 도움으로 제거됩니다.

4. round(runif(10)*5+15) 함수는 15와 20 사이의 값을 갖는 임의의 정수를 사용자에게 제공합니다. 이러한 값의 분포는 균일합니다.

5. sample(c("A", "B", "C"), 10, replace=TRUE) 함수는 이 함수에 인수로 전달된 벡터에서 임의의 샘플을 샘플링하고 생성합니다.

세계 최고의 대학에서 데이터 과학 과정배우십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 획득하여 경력을 빠르게 추적하십시오.

데이터 테이블 내부에 있는 데이터를 변환하는 방법에 대한 팁

1. dat2=transform(dat1, VAR1=VAR1*0.4)과 같이 수행되는 변환 함수의 함수 호출은 VAR1에 저장된 값에 0,4를 곱한 다음 곱한 값을 VAR1에 다시 할당합니다.

2. 함수 변환 호출을 사용하여 기존 변수에 대한 특정 종속성을 가진 변수를 생성할 수도 있습니다. dat2=transform(dat1, VAR2=VAR1*2)과 같은 함수를 호출하면 VAR2라는 이름의 새 변수가 생성되며 여기에는 VAR1 값에 인수 2를 곱한 값이 포함됩니다.

3. 또한 변환 함수를 호출하여 필요한 특정 사이트에서 값을 수정할 수 있습니다. 해당 작업을 수행하려면 dat2=transform(dat1, VAR1=ifelse(VAR3== “Site 1”, VAR1*0.4, VAR1))과 같은 함수를 호출해야 합니다. 변환 함수의 앞에서 언급한 대로 호출은 데이터 항목에 대해 VAR1에 저장된 데이터를 곱합니다. 이 데이터는 사이트 1로 알려진 위치입니다. 변수 VAR1의 값은 다른 모든 위치에서 동일하게 유지됩니다.

읽기 : 초보자를 위한 R의 8가지 놀라운 데이터 과학 프로젝트

결론

프로그래밍 세계는 지난 몇 년 동안 언어의 붐을 보았습니다. 이러한 프로그래밍 언어는 컴퓨팅의 한 측면에 관심을 집중시키고 근절하기 위한 것입니다. R과 같은 언어는 주로 이 언어가 가지고 있는 기본 기능으로 인해 강력한 통계 및 데이터 과학 중심 접근 방식을 가지고 있습니다.

모든 프로그래밍 언어로 작업하는 동안 모든 명령을 손끝으로 사용하는 것은 쉬운 일이 아닙니다. 이제 R 치트 시트 가 구출됩니다. 항상 기억해야 할 한 가지는 최고의 R 치트 시트 는 여러분이 만드는 것이라는 것입니다.

R 프로그래밍 언어에서 C의 의미는 무엇입니까?

C 함수는 R 프로그래밍 언어에서 '결합'을 나타냅니다. 이 함수는 함수에 매개변수를 전달하여 출력을 얻는 데 활용됩니다. R에서 C를 사용하여 세 가지 방법으로 데이터를 추출할 수 있습니다. 행 추출을 위한 c(row) 명령, 열 추출을 위한 c(column) 명령, 두 열 추출을 위한 c(row, column) 명령 및 행.

여기에서 활용하고 있는 데이터셋에서 함수의 행과 열 값을 제공해야 합니다. 함수는 이 명령에 대한 대가로 벡터를 반환합니다. 그 외에 두 개의 다른 벡터를 결합하기 위해 c() 함수를 사용할 수 있습니다.

R 기능이란 무엇입니까?

함수는 특정 작업을 수행하는 데 사용되는 자체 포함된 코드 모듈입니다. 일반적으로 함수는 값, 데이터 프레임, 벡터 등과 같은 특정 데이터 구조를 가져와서 결과를 반환하기 위해 처리합니다. 요구 사항을 지정하기 위해 괄호 안에 인수가 이러한 함수에 전달됩니다.

R에서 사용되는 함수에는 기본 및 사용자 정의의 두 가지 유형이 있습니다. 기본 기능은 R 프로그래밍 언어에서 이미 사용할 수 있는 기능입니다. R에서 사용할 수 있는 다양한 패키지나 라이브러리에서 이러한 함수에 액세스할 수 있습니다. 모든 함수는 다른 목적과 특정 작업을 완료하는 데 사용됩니다. R의 기본 함수에는 sqrt(), round(), getwd() 등이 있습니다. 기본 함수의 도움으로 모든 작업을 완료할 수는 없으므로 사용자 정의 함수의 도움을 받아야 합니다. 특정 사용자 정의 작업을 수행하기 위해 고유한 코드를 작성합니다. 이러한 기능은 특정 작업을 여러 번 수행해야 할 때 개발되었습니다. 함수를 사용하면 이 작업을 더 쉽게 수행할 수 있습니다.

R 프로그래밍 언어의 주요 기능은 무엇입니까?

R이 데이터 분석가와 데이터 과학자를 도울 수 있는 방법은 많습니다. 주요 기능 중 일부는 통계 언어의 일반적인 군중에서 눈에 띄는 데 도움이 됩니다. 주요 기능은 강력한 그래픽 기능, 복잡한 통계 계산을 수행하는 기능, 컴파일러 없이 코드를 실행하는 기능, 데이터 랭글링, 데이터 처리 및 저장 용량, 원하는 형식으로 보고서를 생성하는 기능입니다.