R에서 가장 일반적으로 사용되는 6가지 데이터 구조

게시 됨: 2020-02-03

소프트웨어 프로그래머 및 코더로서 데이터를 저장하기 위한 변수의 필요성을 알고 있어야 합니다. 이러한 변수는 값을 저장하기 위해 다른 메모리 위치에 예약되어 있습니다. 따라서 변수를 생성한다는 것은 메모리에 일부 공간을 예약하는 것을 의미합니다. 컴퓨터에서 효율적으로 사용할 수 있도록 데이터 구조별로 정리한 것이 바로 이 데이터입니다.

C 및 Java와 같은 널리 사용되는 프로그래밍 언어와 달리 R에는 데이터로 선언할 변수가 없습니다. R에는 필요한 변수의 데이터 유형이 되는 R-객체(데이터 구조)가 있습니다. R에는 다양한 유형의 데이터 구조가 있습니다. 하지만 먼저 데이터 구조가 무엇인지 이해합시다!

목차

데이터 구조란 무엇입니까?

R에서 데이터 구조는 여러 값을 보유하는 도구입니다. R 프로그래밍에서 단일 값을 가진 데이터는 거의 사용되지 않습니다. R을 사용하여 여러 숫자, 단어 또는 다른 유형의 값을 함께 묶는 것이 더 실용적입니다. 여기에서 데이터 구조가 등장합니다. 한 번에 많은 양의 데이터를 쉽게 작업할 수 있도록 이러한 여러 값을 그룹화합니다.

데이터 구조는 zvalue에 저장되는 데이터의 종류를 정의하는 데이터 유형으로 구성됩니다. 예를 들어 숫자 13 숫자 데이터 유형 이고 " 13 "은 문자열이라고도 하는 문자 데이터 유형 입니다.

이제 이해했으므로 다양한 데이터 구조 유형을 살펴보겠습니다.

데이터 구조의 유형

데이터 분석 및 작업을 쉽고 효율적으로 만들기 위해 R 프로그래밍에는 5가지 주요 유형의 데이터 구조가 있습니다.

각각에 대해 자세히 살펴보겠습니다.

  • 벡터

R 벡터의 기능은 동일한 데이터 유형의 여러 값을 그룹화하는 것입니다. R에서 가장 기본적인 데이터 구조 유형이며 원자 벡터와 목록의 두 부분으로 구성됩니다. 다음은 공통 속성입니다.

  • 기능 유형(무엇인지)
  • 함수의 길이(요소의 수)
  • 기능 속성(추가 임의 메타데이터)

이제 Atomic Vector는 동일한 데이터 유형을 그룹화하기 위한 것이지만 목록은 다른 데이터 유형을 그룹화할 수 있습니다. 원자 벡터에는 네 가지 유형이 있습니다.

  • 숫자 데이터 유형
  • 정수 데이터 유형
  • 문자 데이터 유형
  • 논리적 데이터 유형

c() 함수를 사용하여 벡터를 만들 수 있습니다.

예를 들어:

위의 코드를 실행하면 1부터 30까지의 모든 숫자를 포함하는 'thisVector'라는 이름의 벡터가 생성됩니다.

벡터에 문자 값을 저장하려면 다음과 같이 큰따옴표를 사용해야 합니다.


벡터에 다른 유형의 데이터를 저장할 수 있지만 모든 값이 문자 유형으로 변환되지 않도록 하는 것이 좋습니다.

  • 기울기

위에서 언급했듯이 목록에는 문자열, 숫자, 벡터 및 다른 목록과 같은 모든 유형의 데이터 요소가 포함될 수 있습니다. 예를 들어 숫자 80개, 단어 30개, 벡터 42개로 구성된 목록을 만들 수 있습니다. 사용할 함수는 list()입니다.

예시:


산출:

목록에는 다른 목록도 있을 수 있으므로 재귀 벡터 라고도 합니다. 이것이 원자 벡터와 매우 다른 이유입니다.

  1. 요인

간단히 말해서 factor는 미리 정의된 값만 저장할 수 있는 벡터 유형입니다. 주로 범주형 데이터를 저장하는 데 사용됩니다. "남성", "여성", "TRUE", "FALSE" 등과 같은 열 값을 분류합니다.

요소는 문자열과 정수를 모두 저장할 수 있다는 점에서 이질적입니다. 요인을 생성하려면 factor() 함수를 사용하십시오. 특정 변수에 대해 가능한 값이 많고 모두 알고 있을 때 매우 유용합니다.

R 프로그래밍에서 문자 벡터는 자동으로 벡터로 변환됩니다. stringAsFactors = FALSE사용 하여 이를 억제한 다음 수동으로 각 문자 벡터를 인수로 변환할 수 있습니다.

  • 데이터 프레임

R의 이 데이터 구조는 데이터 분석을 더 쉽게 하기 위해 테이블 ​​형식으로 데이터를 나타내는 데 사용됩니다. 동일한 길이의 벡터를 포함하므로 2차원 구조를 형성합니다. 변수 값을 포함하는 열과 각 열의 값 집합을 포함하는 행이 있습니다.

당연히 데이터 프레임은 다른 데이터 유형의 값을 저장할 수 있습니다. 그러나 각 열에는 동일한 수의 요소가 있어야 합니다. 예를 들어 열 1에 5개의 요소가 있으면 열 2에도 5개의 값이 있어야 합니다.

데이터 프레임에는 몇 가지 특별한 특성이 있습니다.

  • 열 이름은 비워 둘 수 없습니다.
  • 각 행의 이름은 고유해야 합니다.
  • 데이터 프레임에 숫자, 인수 또는 문자 유형 데이터를 저장할 수 있습니다.
  • 모든 열에는 동일한 수의 데이터 요소가 포함되어야 합니다.

R에서 가져온 모든 데이터 세트는 자동으로 데이터 프레임으로 저장됩니다.

  • 행렬

R의 행렬 데이터 구조는 벡터와 데이터 프레임 사이 어딘가에 있습니다. 행렬은 동일한 데이터 유형의 요소만 포함할 수 있는 2차원 데이터 세트입니다. 행렬() 함수를 사용하여 행렬을 만들 수 있습니다.

구문 : matrix(data, nrow, ncol, byrow, dimnames)

여기,

데이터 = 벡터로 입력 요소

nrow = 행 수

ncol = 열 수

byrow = 행 단위 배열

dimnames = 열/행의 이름

예시:

산출:

요소는 문자형 벡터처럼 보이고 동작하지만 실제로는 정수입니다. 요인을 스팅으로 변환하려면 gsub() 및 grepl()과 같은 함수를 사용하십시오. nchar()를 사용하면 오류가 발생합니다.

  • 배열

배열은 다차원 행렬입니다. 행렬은 2차원을 갖는다는 점에서 배열의 특수한 경우입니다. 행렬이 일반적으로 사용되지만 배열은 매우 드뭅니다.

배열을 생성하는 함수는 array()입니다.

객체가 행렬인지 배열인지 테스트하는 것은 매우 간단합니다. is.matrix() 또는 is.array() 함수를 사용하십시오.

수업 과정

다음은 R의 데이터 구조에 대한 충분한 지식을 얻었으므로 답을 시도할 수 있는 몇 가지 질문입니다.

  1. 데이터 프레임의 속성은 무엇입니까?
  2. 데이터 프레임에 0개의 행이나 열이 포함될 수 있습니까?
  3. R에서 원자 벡터의 다른 유형은 무엇입니까?
  4. 원자 벡터와 목록의 차이점은 무엇입니까?
  5. R에서 4X3 행렬을 만듭니다.

이메일을 통해 답변을 보내거나 아래 의견에 작성하십시오!

결론

R 언어를 적절하게 활용하려면 데이터 유형, 데이터 구조 및 작동 방식에 대한 적절한 이해가 중요합니다. 이러한 항목은 R의 모든 활동의 전제입니다. 예를 들어, 대부분의 프로그래머가 직면하는 일반적인 문제는 R 개체에 대한 지식이 있으면 처리할 수 있는 개체 변환입니다. R에서는 모든 것이 객체이며 작업은 함수 호출로 진행된다는 점에 유의해야 합니다.

R의 데이터 구조는 두 가지 다른 방식으로 정렬할 수 있습니다. 데이터 구조를 분류하는 주요 방법은 1, 2 또는 n 차원이 될 수 있는 차원을 기준으로 하고 후속 경로는 동종 또는 이종일 수 있는 요소의 특성에 따라 결정됩니다. 동종 구조의 모든 요소는 유사한 종류여야 하며 이종 구조의 경우 다양한 종류의 요소가 허용됩니다.

R에서 데이터 구조의 기초를 배운 후에는 R로 프로그래밍하는 것이 훨씬 더 쉽다는 것을 알게 될 것입니다. 데이터 구조는 R의 기본입니다. 가장 일반적으로 사용되는 6가지 데이터 구조가 위에서 언급되었습니다. 각 유형의 다른 특성을 기억하고 이를 구현하여 데이터를 분석하고 해당 작업을 수행하는 것이 중요합니다.

빅 데이터에 대해 더 알고 싶다면 PG 디플로마 빅 데이터 소프트웨어 개발 전문화 프로그램을 확인하세요. 이 프로그램은 실무 전문가를 위해 설계되었으며 7개 이상의 사례 연구 및 프로젝트를 제공하고 14개 프로그래밍 언어 및 도구, 실용적인 실습을 다룹니다. 워크샵, 400시간 이상의 엄격한 학습 및 최고의 기업과의 취업 지원.

세계 최고의 대학에서 온라인으로 소프트웨어 개발 과정배우십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 획득하여 경력을 빠르게 추적하십시오.

자신의 기술을 향상시키고 미래를 준비하십시오

IIT Bangalore의 빅 데이터 고급 인증 프로그램