상관 관계 대 회귀: 상관 관계와 회귀의 차이점
게시 됨: 2020-12-17두 용어 간의 차이에 대한 기본적인 필요성은 두 변수 간의 상호 연결을 찾기 위해 제공하는 통계적 분석 접근 방식과 관련이 있습니다. 이러한 각 연결의 측정값과 이러한 예측의 영향은 일상 생활에서 이러한 분석 패턴을 식별하는 데 사용됩니다.
두 용어 사이를 혼동하는 것은 매우 쉽습니다. 키노트로 차이점을 강조하는 방법은 다음과 같습니다. 상관 관계 대 회귀 의 주요 차이점 은 두 변수 간의 관계 정도를 측정한다는 것입니다. 그것들을 x와 y라고 하자. 여기서 상관관계는 정도의 측정을 위한 반면 회귀는 한 변수가 다른 변수에 미치는 영향을 결정하는 매개변수입니다.
세계 최고의 대학에서 온라인으로 제공하는 최고의 AI 과정 - 석사, 대학원 대학원 과정, ML 및 AI 고급 인증 프로그램을 통해 경력을 빠르게 추적할 수 있습니다.
반드시 읽어야 함: R의 다중 선형 회귀
목차
상관 계수
상관 계수는 변수 의 연관성 정도 를 측정하기 위해 적용되며 일반적으로 Pearson의 상관 계수라고 하며 이는 원래 소스에서 파생됩니다. 이 방법은 선형 연관 문제에 사용됩니다. 두 변수 간의 연결, 즉 상관 관계를 의미하는 단어의 조합으로 생각하십시오.
변수가 직접적이든 간접적이든 간에 서로 변경되는 경향이 있으면 상관 관계가 있는 것으로 간주됩니다. 한 변수가 다른 변수에 미치는 영향이 없는 것과 같이 레이블이 지정됩니다. 이 품질을 더 잘 표현하기 위해 이러한 변수를 가정하고 이름을 x와 y로 지정하겠습니다.

상관 계수는 +1에서 0 및 -1 사이의 값을 갖는 척도로 측정됩니다. 두 변수가 모두 증가하면 상관관계가 양수이고, 한 변수가 증가하고 다른 변수가 감소하면 상관관계가 음수입니다.
이 두 단위 각각의 변화를 측정하기 위해 양과 음으로 간주됩니다.
양의 변화는 변수 x와 y가 같은 방향으로 움직인다는 것을 의미합니다.
음의 변화는 변수 x와 y가 반대 방향으로 움직이고 있음을 의미합니다.
변수에 긍정적 또는 부정적 영향이 있는 경우 향후 추세의 특성을 이해하고 최적의 요구에 맞게 예측할 수 있는 기회를 제공합니다. 이 가설은 변수의 특성에 완전히 기초하고 물리적 또는 디지털 이벤트의 특성을 정의합니다.
상관관계의 주요 이점은 두 변수의 특성을 정의하는 간결하고 명확한 요약의 비율이 회귀 방법에 비해 상당히 높다는 것입니다.
회귀
회귀는 두 개의 개별 변수 간의 관계를 설명하는 매개변수로 정의할 수 있습니다. 그것은 한 변수의 행동이 다른 변수의 결과에 영향을 미치는 종속적인 특징에 가깝습니다. 가장 간단한 용어로 회귀 분석은 변수가 서로 어떻게 영향을 미치는지 식별하는 데 도움이 됩니다.
회귀 기반 분석은 x와 y를 가정하여 두 변수 간의 관계 상태를 파악하는 데 도움이 됩니다. 이는 이벤트 및 구조에 대한 추정을 생성하여 향후 예측을 보다 관련성 있게 만드는 데 도움이 됩니다.

회귀 기반 분석의 의도는 x와 y라는 두 변수에 전적으로 기반을 둔 확률 변수의 값을 추정하는 것입니다. 선형 회귀 분석은 가장 정렬되고 적합하며 거의 모든 데이터 포인트에 맞습니다. 회귀를 기반으로 하는 주요 이점은 그것이 생성하는 상세한 분석이며 이는 상관 관계보다 더 정교합니다. 이것은 미래 시나리오에 대한 데이터 구조를 최적화하는 데 사용할 수 있는 방정식을 만듭니다.

읽기: ML의 6가지 유형의 회귀 모델
상관 관계 대 회귀
아래에는 두 가지를 구별하고 이해하는 데 더 나은 관점을 만드는 데 도움이 되는 몇 가지 주요 예가 나와 있습니다.
- 회귀는 x가 y에 미치는 영향을 이해하기 위한 관계를 제공하고 그 반대의 경우도 마찬가지입니다. 적절한 상관 관계를 사용하면 x와 y를 교환하여 동일한 결과를 얻을 수 있습니다.
- 상관 관계는 단일 통계 형식 또는 데이터 포인트를 기반으로 하는 반면 회귀는 방정식과 완전히 다른 측면이며 선으로 표시됩니다.
- 상관 관계는 두 변수 간의 관계를 만들고 정의하는 데 도움이 되며 회귀는 한 변수가 다른 변수에 어떻게 영향을 미치는지 알아내는 데 도움이 됩니다.
- 회귀분석에 나타난 데이터는 변수에 변화가 발생했을 때 원인과 결과 패턴을 설정합니다. 변화가 두 변수에 대해 같은 방향이거나 반대일 때 여기서 상관 관계를 위해 변수는 임의의 방향으로 단일 이동을 갖습니다.
- 상관 관계에서 x와 y는 교환될 수 있습니다. 회귀에서는 적용되지 않습니다.
- 예측 및 최적화는 회귀 방법에서만 작동하며 상관 분석에서는 실행 가능하지 않습니다.
- 원인과 결과 방법론은 회귀에 의해 확립하려고 시도하지만 그렇지는 않습니다.
사용 시기
- 상관관계 – 이해해야 할 방향에 대한 즉각적인 요구 사항이 있는 경우 둘 이상의 변수 간의 관계가 관련됩니다.
- 회귀 – y에서 x까지의 수치 응답을 최적화하고 설명해야 하는 경우. y가 x에 미치는 영향에 대한 근사치를 이해하고 생성합니다.
요약
강력한 모델, 방정식을 구축하거나 응답을 예측하기 위한 솔루션을 찾을 때 회귀가 가장 좋은 방법입니다. 관계의 강도를 식별하기 위해 요약에 대한 빠른 응답을 찾고 있다면 상관 관계가 최상의 대안이 될 것입니다.
머신 러닝에 대해 자세히 알아보려면 IIIT-B & upGrad의 기계 학습 및 AI 경영자 PG 프로그램을 확인하세요. 이 프로그램은 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT를 제공합니다. -B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.
회귀 분석과 상관 분석의 차이점은 무엇입니까?
상관 관계 및 회귀는 여러 변수의 분포를 기반으로 하는 두 가지 유형의 분석입니다. 두 개의 연속적인 양적 변수 간의 연결 유형과 정도를 설명하는 데 유용합니다. 이 두 가지 수학적 개념이 동시에 연구되지만, 상관 관계와 회귀 사이에는 상당한 차이가 있음이 앞의 설명에서 분명합니다. 연구자가 조사 중인 변수가 연관되어 있는지 여부와 연관되어 있는 경우 해당 관계가 얼마나 강한지 확인하려는 경우 상관 관계가 사용됩니다. Pearson의 상관 계수는 종종 가장 정확한 상관 측정으로 간주됩니다. 회귀 분석에서는 미래의 사건을 추정하기 위해 두 변수 사이의 기능적 관계가 형성됩니다.
회귀 분석은 언제 사용해야 합니까?
독립 요인 집합에서 연속 종속 값을 추정하려면 회귀 분석을 사용합니다. 종속변수가 이분형인 경우 로지스틱 회귀를 사용해야 합니다. (로지스틱 회귀 및 선형 회귀는 여기에서 종속 변수의 두 수준 간의 분할이 50-50에 가까우면 유사한 결과를 생성합니다.) 회귀에서 독립 변수는 연속형 또는 이분형일 수 있습니다. 회귀 분석에서는 수준이 2개 이상인 독립 변수를 사용할 수 있지만 먼저 수준이 2개인 변수로 변환해야 합니다.
상관 관계와 회귀 기울기의 차이점은 무엇입니까?
두 숫자 변수 X와 Y 사이의 연관성의 방향과 강도는 항상 -1.0과 1.0 사이인 상관 관계로 측정됩니다. Y = a + bX는 X와 Y를 연결하는 단순 선형 회귀 방정식입니다. 둘 다 두 숫자 변수 간의 연결 정도와 방향을 측정합니다. 상관 관계(r)가 음수이면 회귀 기울기(b)는 음수가 됩니다. 상관관계가 양수이면 회귀 기울기는 양수입니다.