Korelacja a regresja: różnica między korelacją a regresją
Opublikowany: 2020-12-17Podstawowa potrzeba różnicy między obydwoma terminami jest związana ze statystycznym podejściem analitycznym, które oferuje, aby znaleźć wzajemne powiązania między dwiema zmiennymi. Miara każdego z tych połączeń i wpływ tych przewidywań są wykorzystywane do identyfikacji tych wzorców analitycznych w naszym codziennym życiu.
Łatwo jest pomylić te dwa terminy. Oto, jak ich różnica zostałaby podkreślona kluczową uwagą. Główna różnica między korelacją a regresją polega na tym, że miary stopnia związku między dwiema zmiennymi; niech będą x i y. Tutaj korelacja służy do pomiaru stopnia, podczas gdy regresja jest parametrem określającym, w jaki sposób jedna zmienna wpływa na inną.
Najlepsze internetowe kursy sztucznej inteligencji na najlepszych światowych uniwersytetach — studia magisterskie, programy dla absolwentów studiów podyplomowych i program zaawansowanych certyfikatów w zakresie uczenia maszynowego i sztucznej inteligencji, aby przyspieszyć karierę.
Trzeba przeczytać: Wielokrotna regresja liniowa w R
Spis treści
Współczynnik korelacji
Współczynnik korelacji jest stosowany do pomiaru stopnia powiązania zmiennych i jest zwykle nazywany współczynnikiem korelacji Pearsona, który pochodzi od źródła jego pochodzenia. Ta metoda jest używana do rozwiązywania problemów z asocjacjami liniowymi. Pomyśl o tym jako o kombinacji słów oznaczających, związku między dwiema zmiennymi, tj. korelacji.
Kiedy zmienna ma tendencję do zmiany jednej z drugą, czy to bezpośrednio, czy pośrednio, uważa się ją za skorelowaną. Jest oznaczony jako brak wpływu jednej zmiennej na drugą. Aby stworzyć lepszą reprezentację tej jakości, przyjmijmy takie zmienne i nazwijmy je x i y.

Współczynnik korelacji jest mierzony w skali o wartościach od +1 do 0 i -1. Gdy obie zmienne wzrastają, korelacja jest dodatnia, a jeśli jedna zmienna wzrasta, a druga spada, korelacja jest ujemna.
Aby zmierzyć zmiany w każdej z tych dwóch jednostek, uważa się je za dodatnie i ujemne.
Dodatnia zmiana oznacza, że zmienne x i y poruszają się w tym samym kierunku.
Ujemna zmiana oznacza, że zmienne x i y poruszają się w przeciwnych kierunkach.
Jeśli istnieje pozytywny lub negatywny wpływ na zmienne, stwarza to okazję do zrozumienia charakteru trendów w przyszłości i przewidzenia go w najlepszy możliwy sposób. Ta hipoteza byłaby całkowicie oparta na naturze zmiennych i określałaby naturę wszelkich zdarzeń fizycznych lub cyfrowych.
Głównym korzystnym źródłem korelacji jest to, że wskaźnik zwięzłego i jasnego podsumowania określającego charakter obu zmiennych jest dość wysoki w porównaniu z metodą regresji.
Regresja
Regresję można zdefiniować jako parametr wyjaśniający związek między dwiema oddzielnymi zmiennymi. Jest to raczej cecha zależna, w której działanie jednej zmiennej wpływa na wynik drugiej zmiennej. Mówiąc najprościej, regresja pomaga określić, w jaki sposób zmienne wpływają na siebie nawzajem.
Analiza oparta na regresji pomaga określić status związku między dwiema zmiennymi, załóżmy, że x i y. Pomaga to w oszacowaniu zdarzeń i struktur, aby przyszłe prognozy były bardziej powiązane.

Intencją analizy opartej na regresji jest oszacowanie wartości zmiennej losowej, która w całości opiera się na dwóch zmiennych, tj. x i y. Analiza regresji liniowej jest najbardziej wyrównana i odpowiednia i pasuje do prawie wszystkich punktów danych. Główną zaletą regresji jest tworzona przez nią szczegółowa analiza, która jest bardziej wyrafinowana niż korelacja. Tworzy to równanie, którego można użyć do optymalizacji struktur danych dla przyszłych scenariuszy.

Przeczytaj: 6 typów modeli regresji w ML
Korelacja a regresja
Poniżej wymieniono kilka kluczowych przykładów, które pomogą stworzyć lepszą perspektywę na rozróżnianie i zrozumienie między nimi.
- Regresja da relację do zrozumienia wpływu, jaki x ma na y, aby się zmienić i vice versa. Przy odpowiedniej korelacji x i y można zamienić i uzyskać, aby uzyskać te same wyniki.
- Korelacja opiera się na pojedynczym formacie statystycznym lub punkcie danych, podczas gdy regresja jest zupełnie innym aspektem równania i jest reprezentowana za pomocą linii.
- Korelacja pomaga stworzyć i zdefiniować związek między dwiema zmiennymi, a regresja z drugiej strony pomaga dowiedzieć się, jak jedna zmienna wpływa na inną.
- Dane przedstawione w regresji ustanawiają wzorzec przyczynowo-skutkowy, gdy zmiana zachodzi w zmiennych. Gdy zmiany są w tym samym kierunku lub przeciwnie dla obu zmiennych, dla korelacji tutaj zmienne mają pojedynczy ruch w dowolnym kierunku.
- W korelacji x i y mogą być zamienione; w regresji nie będzie miała zastosowania.
- Przewidywanie i optymalizacja będą działać tylko z metodą regresji i nie będą opłacalne w analizie korelacji.
- Metodologia przyczyny i skutku byłaby próbą ustalenia przez regresję, podczas gdy nie.
Kiedy użyć
- Korelacja — gdy istnieje natychmiastowe zapotrzebowanie na kierunek do zrozumienia, w grę wchodzi związek między dwiema lub więcej zmiennymi.
- Regresja – Gdy istnieje potrzeba optymalizacji i wyjaśnienia odpowiedzi liczbowej od y do x. Aby zrozumieć i stworzyć przybliżenie, w jaki sposób y wpływa na x.
Podsumowując
Podczas poszukiwania rozwiązania do budowy solidnego modelu, równania lub przewidywania odpowiedzi, najlepszym podejściem jest regresja. Jeśli szukasz szybkiej odpowiedzi na podsumowanie, aby określić siłę związku, korelacja byłaby najlepszą alternatywą.
Jeśli chcesz dowiedzieć się więcej o uczeniu maszynowym, zapoznaj się z programem IIIT-B i upGrad Executive PG w zakresie uczenia maszynowego i sztucznej inteligencji, który jest przeznaczony dla pracujących profesjonalistów i oferuje ponad 450 godzin rygorystycznych szkoleń, ponad 30 studiów przypadków i zadań, IIIT Status -B Alumni, ponad 5 praktycznych praktycznych projektów zwieńczenia i pomoc w pracy z najlepszymi firmami.
Jaka jest różnica między regresją a analizą korelacji?
Korelacja i regresja to dwa rodzaje analiz, które opierają się na rozkładzie kilku zmiennych. Przydają się do opisu rodzaju i stopnia związku między dwiema ciągłymi zmiennymi ilościowymi. Chociaż te dwie koncepcje matematyczne są badane jednocześnie, z powyższego opisu jasno wynika, że istnieje istotne rozróżnienie między korelacją a regresją. Kiedy badacz chce ustalić, czy badane zmienne są ze sobą powiązane, a jeśli tak, to jak silny jest ich związek, stosuje się korelację. Współczynnik korelacji Pearsona jest często uważany za najdokładniejszą miarę korelacji. W analizie regresji tworzy się funkcjonalna relacja między dwiema zmiennymi w celu dokonania oszacowań przyszłych zdarzeń.
Kiedy powinienem używać analizy regresji?
Jeśli chcesz oszacować ciągłą wartość zależną z zestawu niezależnych czynników, stosujesz analizę regresji. Regresję logistyczną należy stosować, jeśli zmienna zależna jest dychotomiczna. (Zarówno regresja logistyczna, jak i liniowa przyniosą podobne wyniki, jeśli podział tutaj między dwoma poziomami zmiennej zależnej jest bliski 50-50.) W regresji zmienne niezależne mogą być ciągłe lub dychotomiczne. W analizie regresji można zastosować zmienne niezależne o znacznie więcej niż dwóch poziomach, ale należy je najpierw przekonwertować na zmienne o zaledwie dwóch poziomach.
Jaka jest różnica między nachyleniem korelacji i regresji?
Kierunek i siłę powiązania między dwiema zmiennymi liczbowymi, X i Y, mierzy się za pomocą korelacji, która zawsze wynosi od -1,0 do 1,0. Y = a + bX to proste równanie regresji liniowej, które łączy X z Y. Oba mierzą stopień i kierunek powiązania między dwiema zmiennymi liczbowymi. Nachylenie regresji (b) będzie ujemne, jeśli korelacja (r) jest ujemna. Nachylenie regresji będzie dodatnie, jeśli korelacja jest dodatnia.