相關與回歸:相關與回歸之間的區別
已發表: 2020-12-17兩個術語之間差異的基本需求與它提供的統計分析方法有關,以找到兩個變量之間的相互聯繫。 這些聯繫中的每一個的度量以及這些預測的影響被用來識別我們日常生活中的那些分析模式。
這兩個術語很容易混淆。 以下是如何通過關鍵註釋突出顯示它們的差異。 相關性與回歸的主要區別在於衡量兩個變量之間關係的程度; 讓他們成為 x 和 y。 在這裡,相關性用於衡量程度,而回歸是確定一個變量如何影響另一個變量的參數。
來自世界頂級大學的最佳在線 AI 課程- 碩士、高級管理人員研究生課程和 ML 和 AI 高級證書課程,以加快您的職業生涯。
必讀: R 中的多元線性回歸
目錄
相關係數
相關係數用於衡量變量的關聯程度,通常稱為皮爾遜相關係數,它來源於其來源。 該方法用於線性關聯問題。 將其視為單詞含義的組合,兩個變量之間的聯繫,即相關性。
當一個變量傾向於從一個變量變為另一個變量時,無論是直接的還是間接的,它都被認為是相關的。 它被標記為一個變量對另一個變量沒有影響。 為了更好地表示這種質量,讓我們假設這些變量並將它們命名為 x 和 y。

相關係數的測量範圍為 +1 到 0 和 -1。 當兩個變量都增加時,相關性為正,如果一個變量增加,另一個變量減少,則相關性為負。
為了衡量這兩個單位中的每一個的變化,它們被認為是積極的和消極的。
正變化意味著變量 x 和 y 沿相同方向移動。
負變化意味著變量 x 和 y 正朝著相反的方向移動。
如果對變量有正面或負面的影響,它就會創造一個機會來了解未來趨勢的性質並預測它以滿足最佳需求。 該假設將完全基於變量的性質,並將定義任何物理或數字事件的性質。
相關性的主要有益來源是,與回歸方法相比,定義兩個變量性質的簡潔明了的總結率相當高。
回歸
回歸可以定義為解釋兩個獨立變量之間關係的參數。 它更像是一個依賴特徵,其中一個變量的作用會影響另一個變量的結果。 用最簡單的術語來說,回歸有助於確定變量如何相互影響。
基於回歸的分析有助於找出兩個變量之間的關係狀態,假設 x 和 y。 這有助於創建對事件和結構的估計,以使未來的預測更具相關性。

基於回歸分析的目的是估計完全基於兩個變量即 x 和 y 的隨機變量的值。 線性回歸分析是最一致和最合適的,幾乎適合所有數據點。 基於回歸的主要優勢是它創建的詳細分析,這比相關性更複雜。 這創建了一個方程,可用於優化未來場景的數據結構。

閱讀: ML 中的 6 種回歸模型
相關與回歸
下面列出了一些關鍵示例,這些示例將有助於更好地區分和理解兩者。
- 回歸將給出關係以了解 x 對 y 的影響,反之亦然。 通過適當的相關性,x 和 y 可以互換並獲得相同的結果。
- 相關性基於單一統計格式或數據點,而回歸是與方程完全不同的方面,並用一條線表示。
- 相關性有助於創建和定義兩個變量之間的關係,另一方面,回歸有助於找出一個變量如何影響另一個變量。
- 當變量發生變化時,回歸中顯示的數據建立了因果模式。 當兩個變量的變化方向相同或相反時,對於此處的相關性,變量在任何方向上都有奇異的運動。
- 在相關性中,x 和 y 可以互換; 在回歸中,它將不適用。
- 預測和優化僅適用於回歸方法,在相關分析中不可行。
- 因果方法將試圖通過回歸來建立,而不是它。
何時使用
- 相關性——當迫切需要理解一個方向時,就會涉及兩個或多個變量之間的關係。
- 回歸——當需要優化和解釋從 y 到 x 的數值響應時。 理解和創建 y 如何影響 x 的近似值。
總結
在尋找構建穩健模型、方程或預測響應的解決方案時,回歸是最好的方法。 如果在摘要中尋找快速響應來確定關係的強度,則相關性將是最佳選擇。
如果您有興趣了解有關機器學習的更多信息,請查看 IIIT-B 和 upGrad 的機器學習和 AI 執行 PG 計劃,該計劃專為工作專業人士設計,提供 450 多個小時的嚴格培訓、30 多個案例研究和作業、IIIT -B 校友身份,5 個以上實用的實踐頂點項目和頂級公司的工作協助。
回歸分析和相關分析有什麼區別?
相關性和回歸是基於多個變量分佈的兩種類型的分析。 它們對於描述兩個連續定量變量之間聯繫的類型和程度很有用。 雖然這兩個數學概念是同時研究的,但從前面的描述中可以清楚地看出,相關性和回歸之間存在顯著區別。 當研究人員想要確定被調查的變量是否相關時,如果是,它們的關係有多強,就會使用相關性。 皮爾遜相關係數通常被認為是最準確的相關性度量。 在回歸分析中,形成兩個變量之間的函數關係,以便對未來事件進行估計。
什麼時候應該使用回歸分析?
當您希望從一組獨立因素中估計一個連續的相關值時,您可以使用回歸分析。 如果因變量是二分類的,則應使用邏輯回歸。 (如果因變量的兩個水平之間的分裂接近 50-50,邏輯回歸和線性回歸都會產生類似的結果。)在回歸中,自變量可以是連續的或二分的。 在回歸分析中,可以使用遠多於兩個水平的自變量,但必須首先將它們轉換為只有兩個水平的變量。
相關性和回歸斜率有什麼區別?
兩個數值變量 X 和 Y 之間關聯的方向和強度通過相關性來衡量,相關性始終介於 -1.0 和 1.0 之間。 Y = a + bX 是一個簡單的線性回歸方程,將 X 與 Y 連接起來。兩者都測量兩個數值變量之間聯繫的程度和方向。 如果相關性 (r) 為負,則回歸斜率 (b) 將為負。 如果相關性為正,則回歸斜率將為正。
