기계 학습에서 알아야 할 6가지 유형의 회귀 모델

게시 됨: 2020-07-27

소개

선형 회귀 및 로지스틱 회귀는 기계 학습을 사용하여 회귀 문제를 해결하는 데 사용되는 두 가지 유형의 회귀 분석 기술입니다. 그것들은 회귀의 가장 두드러진 기술입니다. 그러나 머신 러닝에는 많은 유형의 회귀 분석 기법이 있으며 관련 데이터의 특성에 따라 사용법이 다릅니다.

이 기사에서는 머신 러닝의 다양한 회귀 유형과 각 회귀 유형을 어떤 조건에서 사용할 수 있는지 설명합니다. 기계 학습을 처음 접하는 경우 이 기사는 회귀 모델링 개념을 이해하는 데 확실히 도움이 될 것입니다.

회귀 분석이란 무엇입니까?

회귀 분석은 데이터 세트에서 대상 또는 종속 변수와 독립 변수 간의 관계를 분석하는 예측 모델링 기법입니다. 대상 변수와 독립 변수가 서로 선형 또는 비선형 관계를 나타내고 대상 변수에 연속 값이 포함된 경우 다양한 유형의 회귀 분석 기법이 사용됩니다. 회귀 기법은 주로 예측 변수의 강도, 예측 추세, 시계열을 결정하고 인과 관계의 경우에 사용됩니다.

회귀 분석은 데이터 모델링을 사용하여 기계 학습에서 회귀 문제를 해결하는 기본 기술입니다. 여기에는 각 데이터 점에서 선의 거리가 최소화되는 방식으로 모든 데이터 점을 통과하는 선인 최적선이 결정됩니다.

회귀 분석 기법의 유형

회귀 분석 기법 에는 여러 가지 유형이 있으며 각 방법의 사용은 요인의 수에 따라 다릅니다. 이러한 요인에는 대상 변수의 유형, 회귀선의 모양 및 독립 변수의 수가 포함됩니다.

다음은 다양한 회귀 기술입니다.

선형 회귀
로지스틱 회귀
능선 회귀
올가미 회귀
다항식 회귀
베이지안 선형 회귀

머신 러닝 기술의 다양한 유형의 회귀가 아래에 자세히 설명되어 있습니다.

1. 선형 회귀

선형 회귀는 기계 학습에서 가장 기본적인 회귀 유형 중 하나입니다 . 선형 회귀 모델은 서로 선형적으로 관련된 예측 변수와 종속 변수로 구성됩니다. 데이터에 둘 이상의 독립 변수가 포함된 경우 선형 회귀를 다중 선형 회귀 모델이라고 합니다.

아래 주어진 방정식은 선형 회귀 모델을 나타내는 데 사용됩니다.

y=mx+c+e

여기서 m은 선의 기울기, c는 절편, e는 모델의 오차를 나타냅니다.

원천

가장 적합한 선은 m 및 c 값을 변경하여 결정됩니다. 예측 변수 오차는 관찰된 값과 예측된 값의 차이입니다. m과 c의 값은 최소 예측 오차를 제공하는 방식으로 선택됩니다. 단순 선형 회귀 모델은 이상값에 취약하다는 점에 유의하는 것이 중요합니다. 따라서 데이터가 큰 경우에는 사용하지 않아야 합니다.

2. 로지스틱 회귀

로지스틱 회귀는 종속 변수가 이산적일 때 사용되는 회귀 분석 기법의 한 유형입니다. 예: 0 또는 1, 참 또는 거짓 등. 이는 대상 변수가 두 개의 값만 가질 수 있음을 의미하며 시그모이드 곡선은 대상 변수와 독립 변수 간의 관계를 나타냅니다.

Logit 함수는 Logistic Regression에서 대상 변수와 독립 변수 간의 관계를 측정하는 데 사용됩니다. 다음은 로지스틱 회귀를 나타내는 방정식입니다.

로짓(p) = ln(p/(1-p)) = b0+b1X1+b2X2+b3X3….+bkXk

여기서 p는 특징의 발생 확률입니다.

원천

로지스틱 회귀분석을 선택하기 위해서는 회귀분석기법으로서 데이터의 크기가 크고 대상변수에 나오는 값이 거의 동일하게 발생한다는 점에 유의해야 한다. 또한 다중공선성이 없어야 하며, 이는 데이터세트에서 독립변수 간에 상관관계가 없어야 함을 의미합니다.

3. 능선 회귀

원천

이것은 독립 변수 간의 상관 관계가 높을 때 일반적으로 사용되는 기계 학습의 회귀 유형 중 하나입니다 . 이는 다중 공선 데이터의 경우 최소 제곱 추정치가 편향되지 않은 값을 제공하기 때문입니다. 그러나 공선성이 매우 높은 경우 약간의 편향 값이 있을 수 있습니다. 따라서 릿지 회귀 방정식에 편향 행렬이 도입됩니다. 이것은 모델이 과적합에 덜 민감한 강력한 회귀 방법입니다.

다음은 λ(람다)의 도입으로 다중 공선성 문제를 해결하는 능선 회귀를 나타내는 데 사용되는 방정식입니다.

β = (X^{T}X + λ*I)^{-1}X^{T}y

확인: 기계 학습의 5가지 획기적인 응용 프로그램

4. 올가미 회귀

올가미 회귀는 특징 선택과 함께 정규화를 수행하는 기계 학습의 회귀 유형 중 하나입니다. 회귀 계수의 절대 크기를 금지합니다. 결과적으로 계수 값은 0에 가까워지는데, 이는 Ridge Regression의 경우에는 발생하지 않습니다.

이 때문에 기능 선택은 올가미 회귀에서 사용되며, 이를 통해 데이터 세트에서 기능 세트를 선택하여 모델을 작성할 수 있습니다. Lasso Regression의 경우 필요한 기능만 사용하고 나머지는 0으로 만듭니다. 이는 모델의 과적합을 피하는 데 도움이 됩니다. 독립 변수가 매우 공선적인 경우 올가미 회귀는 하나의 변수만 선택하고 다른 변수는 0으로 축소합니다.

원천

다음은 올가미 회귀 방법을 나타내는 방정식입니다.

N^{-1}Σ^{N}_{i=1}f(x_{i}, y_{I}, α, β)

5. 다항식 회귀

다항식 회귀(Polynomial Regression)는 기계 학습에서 회귀 분석 기법 의 또 다른 유형으로 , 약간의 수정만 가하면 다중 선형 회귀(Multiple Linear Regression)와 동일합니다. 다항식 회귀에서 독립변수와 종속변수의 관계, 즉 X와 Y는 n차로 표시됩니다.

추정기로서의 선형 모델입니다. 최소 평균 제곱법은 다항식 회귀에서도 사용됩니다. 모든 데이터 포인트를 통과하는 다항식 회귀에서 가장 적합한 선은 직선이 아니라 X의 거듭제곱 또는 n의 값에 따라 달라지는 곡선입니다.

원천

평균 제곱 오차를 최소로 줄이고 최적의 선을 얻으려고 하는 동안 모델이 과적합되기 쉽습니다. 더 높은 다항식은 외삽에서 이상한 결과를 줄 수 있으므로 끝으로 향하는 곡선을 분석하는 것이 좋습니다.

아래 방정식은 다항식 회귀를 나타냅니다.

l = β0+ β0x1+ε

읽기: 기계 학습 프로젝트 아이디어

6. 베이지안 선형 회귀

베이지안 회귀는 베이지안 정리를 사용하여 회귀 계수의 값을 찾는 기계 학습의 회귀 유형 중 하나입니다. 이 회귀 방법에서는 최소 제곱을 찾는 대신 특징의 사후 분포가 결정됩니다. 베이지안 선형 회귀는 선형 회귀 및 능선 회귀와 비슷하지만 단순 선형 회귀보다 더 안정적입니다.

원천

세계 최고의 대학에서 온라인으로 AI 및 ML 과정 을 배우십시오 . 석사, 대학원 대학원 과정, ML 및 AI 고급 인증 프로그램을 통해 경력을 빠르게 추적할 수 있습니다.

결론

위의 회귀 방법 외에도 Elastic Net Regression, JackKnife Regression, Stepwise Regression 및 Ecological Regression을 포함하여 기계 학습에는 다른 많은 유형의 회귀가 있습니다.

이러한 다양한 유형의 회귀 분석 기술을 사용하여 사용 가능한 데이터의 종류 또는 최대 정확도를 제공하는 데이터의 종류에 따라 모델을 작성할 수 있습니다. 이러한 기술을 더 자세히 살펴보거나 웹사이트 에서 지도 학습 과정을 진행할 수 있습니다 .

머신 러닝에 대해 자세히 알아보려면 IIIT-B & upGrad의 기계 학습 및 AI 경영자 PG 프로그램을 확인하세요. 이 프로그램은 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT를 제공합니다. -B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

회귀의 다른 유형은 무엇입니까?

회귀에는 5가지 유형이 있습니다. 즉 1. 선형 회귀, 2. 로지스틱 회귀, 3. 능선 회귀, 4. 올가미 회귀, 5. 다항 회귀는 다양한 유형의 회귀입니다.

회귀란 무엇입니까? 회귀 유형에는 어떤 것이 있습니까?

회귀는 연속 값을 예측하는 데 사용되는 지도 머신 러닝 기술입니다. 회귀 알고리즘의 궁극적인 목표는 데이터와 선형 회귀, 로지스틱 회귀, 능선 회귀, 올가미 회귀, 다항식 회귀 사이의 최적선 또는 곡선을 그리는 것입니다. 회귀의 유형입니다.

회귀 분석은 언제 사용해야 합니까?

회귀 분석은 여러 독립 변수에서 연속 종속 변수를 예측하려는 경우에 사용됩니다. 종속 변수가 이분법이면 로지스틱 회귀를 사용해야 합니다.