相関と回帰:相関と回帰の違い
公開: 2020-12-17両方の項の違いの基本的な必要性は、2つの変数間の相互接続を見つけるために提供する統計分析アプローチに関連しています。 これらの接続のそれぞれの測定値とそれらの予測の影響は、私たちの日常生活におけるそれらの分析パターンを識別するために使用されます。
2つの用語の間で混乱するのは非常に簡単です。 キーノートでそれらの違いを強調する方法は次のとおりです。 相関と回帰の主な違いは、2つの変数間の関係の程度の測定値です。 それらをxとyとします。 ここで、相関は次数の測定用ですが、回帰は1つの変数が別の変数にどのように影響するかを決定するパラメーターです。
世界のトップ大学からのオンラインで最高のAIコース–修士、エグゼクティブ大学院プログラム、ML&AIの高度な証明書プログラムでキャリアを早めます。
必読: Rの重回帰
目次
相関係数
相関係数は、変数の関連度を測定するために適用され、通常、ピアソンの相関係数と呼ばれ、その発生源から導出されます。 この方法は、線形関連の問題に使用されます。 これは、2つの変数間の接続、つまり相関を意味する単語の組み合わせと考えてください。
変数が直接または間接にかかわらず、ある変数から別の変数に変化する傾向がある場合、それは相関していると見なされます。 ある変数が他の変数に影響を与えないなどのラベルが付けられています。 この品質のより良い表現を作成するために、そのような変数を想定し、それらにxとyという名前を付けましょう。

相関係数は、+1から0および-1までの値のスケールで測定されます。 両方の変数が増加すると、相関は正になり、一方の変数が増加し、もう一方が減少すると、相関は負になります。
これら2つの単位のそれぞれの変化を測定するために、それらは正と負と見なされます。
正の変化は、変数xとyが同じ方向に移動することを意味します。
負の変化は、変数xとyが反対方向に移動していることを意味します。
変数にプラスまたはマイナスの影響がある場合、それは将来の傾向の性質を理解し、最良のニーズのためにそれを予測する機会を生み出します。 この仮説は、変数の性質に完全に基づいており、物理的またはデジタルイベントの性質を定義します。
相関の主な有益な情報源は、2つの変数の性質を定義する簡潔で明確な要約の割合が、回帰法と比較して非常に高いことです。
回帰
回帰は、2つの別々の変数間の関係を説明するパラメーターとして定義できます。 これは、一方の変数のアクションがもう一方の変数の結果に影響を与える、より依存的な機能です。 簡単に言えば、回帰は変数が互いにどのように影響するかを特定するのに役立ちます。
回帰ベースの分析は、xとyを想定した2つの変数間の関係ステータスを把握するのに役立ちます。 これは、イベントと構造の見積もりを作成して、将来の予測をより関連性のあるものにするのに役立ちます。

回帰ベースの分析の目的は、2つの変数、つまりxとyに完全に基づく確率変数の値を推定することです。 線形回帰分析は最も整合性が高く適切であり、ほとんどすべてのデータポイントに適合します。 回帰に基づく主な利点は、相関よりも高度な詳細な分析を作成することです。 これにより、将来のシナリオのためにデータ構造を最適化するために使用できる方程式が作成されます。

読む: MLの6種類の回帰モデル
相関と回帰
以下にリストされているのは、両者を区別して理解する上でより良い視点を作成するのに役立ついくつかの重要な例です。
- 回帰は、xがyに与える影響を理解するための関係を与え、その逆も同様です。 適切な相関関係があれば、xとyを交換して取得し、同じ結果を得ることができます。
- 相関は単一の統計形式またはデータポイントに基づいていますが、回帰は方程式とはまったく異なる側面であり、線で表されます。
- 相関は2つの変数間の関係を作成および定義するのに役立ち、一方、回帰は1つの変数が別の変数にどのように影響するかを見つけるのに役立ちます。
- 回帰で示されるデータは、変数に変更が発生した場合の原因と結果のパターンを確立します。 変化が両方の変数で同じ方向または反対方向にある場合、ここでの相関関係のために、変数は任意の方向に特異な動きをします。
- 相関関係として、xとyは交換できます。 回帰では、それは適用されません。
- 予測と最適化は回帰法でのみ機能し、相関分析では実行できません。
- 因果関係の方法論は回帰によって確立しようとしますが、そうではありません。
いつ使用するか
- 相関関係–方向性をすぐに理解する必要がある場合、2つ以上の変数間の関係が関係します。
- 回帰–yからxへの数値応答を最適化して説明する必要がある場合。 yがxにどのように影響するかを理解して近似を作成する。
要約する
堅牢なモデル、方程式を構築するため、または応答を予測するためのソリューションを探す場合、回帰が最良のアプローチです。 関係の強さを特定するために要約に対する迅速な応答を探している場合は、相関関係が最良の代替手段になります。
機械学習について詳しく知りたい場合は、IIIT-BとupGradの機械学習とAIのエグゼクティブPGプログラムをご覧ください。このプログラムは、働く専門家向けに設計されており、450時間以上の厳格なトレーニング、30以上のケーススタディと課題、IIITを提供しています。 -B卒業生のステータス、5つ以上の実践的なキャップストーンプロジェクト、トップ企業との雇用支援。
回帰分析と相関分析の違いは何ですか?
相関と回帰は、いくつかの変数の分布に基づく2種類の分析です。 これらは、2つの連続する量的変数間の接続のタイプと程度を説明するのに役立ちます。 これらの2つの数学的概念は同時に研究されますが、前述の説明から、相関と回帰の間に有意な違いがあることは明らかです。 研究者が調査対象の変数が関連付けられているかどうか、関連付けられている場合はそれらの関係がどの程度強いかを判断する場合は、相関が使用されます。 ピアソンの相関係数は、相関の最も正確な尺度と見なされることがよくあります。 回帰分析では、将来のイベント推定を行うために、2つの変数間の関数関係が形成されます。
回帰分析はいつ使用する必要がありますか?
一連の独立した因子から連続従属値を推定する場合は、回帰分析を利用します。 従属変数が二分法である場合は、ロジスティック回帰を使用する必要があります。 (ここで従属変数の2つのレベル間の分割が50-50に近い場合、ロジスティック回帰と線形回帰の両方で同様の結果が得られます。)回帰では、独立変数は連続または二分である可能性があります。 回帰分析では、2レベルをはるかに超える独立変数を使用できますが、最初に2レベルのみの変数に変換する必要があります。
相関と回帰の傾きの違いは何ですか?
2つの数値変数XとYの間の関連付けの方向と強さは、相関によって測定されます。相関は常に-1.0から1.0の間です。 Y = a + bXは、XとYを接続する単純な線形回帰方程式です。どちらも、2つの数値変数間のリンクの次数と方向を測定します。 相関(r)が負の場合、回帰勾配(b)は負になります。 相関が正の場合、回帰勾配は正になります。