一般化線形モデルが注目に値する合成モデルである理由を知ってください!
公開: 2020-11-17目次
基本を理解する
GLMは、古典的な線形回帰モデルから生存分析用のモデルまで、さまざまな回帰モデルを扱う個人の間で非常に有名です。 一般化線形モデル(GLIMまたはGLM)という用語は、McCullagh(1982)とNelder(1989年第2版)によって造られ、よく知られています。 GLM 、Rutherford 2001で説明されている最も単純な形式では、データ=モデル+エラー。 さまざまな統計的検定の基礎となる便利なフレームワークがあります。
モデルのクラスを再考する
- 古典的線形回帰(CLR)モデル、線形回帰モデルとも呼ばれます
- 分散分析(ANOVA)モデル。
- 機械の故障の確率のように勝つ確率を予測するモデル
- イベント数の説明と予測に使用されるモデル
- 加工業者や植物の生物学的年齢など、生きているものと生きていないものの寿命を推定するためのモデル。
一般化線形モデルは、その名前が示すように、計算と近似が改善された、上記のすべてのモデルの天蓋のようなものです。
一般化線形モデルの構造
一般化線形モデル(またはGLM1)は、次の3つの主要コンポーネントで構成されます。
- ランダム成分:ノイズモデルまたはエラーモデルと呼ばれるランダム成分は、応答変数(Y)の確率分布です。
- 系統的コンポーネント:線形予測子は、以下で説明するように、リグレッサーの線形関数です。
ηi=α+β1Xi1+β2Xi2+···+βkXik
- リンク関数( ηまたはg(μ)で示される):名前が示すように、体系的コンポーネントとランダムコンポーネント間のリンク
例: μi= E(Yi)、線形予測子g(μi)=ηi=α+β1Xi1+β2Xi2+···+βkXik
一般化線形モデルは、最尤法によってデータに適用されます。 これにより、回帰係数の推定値と係数の推定漸近標準誤差が提供されます。

カウントデータの基本的なGLMは、ログリンクを持つポアソンモデルです。 ただし、応答変数がカウントの場合、その条件付き分散は平均よりも急速に増加し、過分散と呼ばれる条件を生成し、ポアソン分布の使用を無効にします。 準ポアソンGLMは、分散パラメーターを追加して、過剰分散されたカウントデータを処理します。

一般的に、準尤度推定は、過剰分散を可能にする1つの方法であり、使用される統計モデルから予想されるよりもデータの変動が大きくなります。
同様のモデルは、指数型分布族ではない負の二項分布に基づいています。 一般化線形モデルの負の二項分布は、最尤法では決定できません。 ゼロ膨張ポアソン回帰モデルは、ポアソン分布と一致するよりも多くのゼロがデータにある場合に最適な場合があります。
読む:機械学習モデルの説明

従来の通常最小二乗(OLS)回帰に対する一般化線形モデルの利点
OLS回帰に対する一般線形モデルには多くの利点があり、以下のように要約できます。
- OLS回帰とは異なり、応答Yは、正規分布にするために毎回変換する必要はありません。
- リンクの選択はランダムなコンポーネントの選択とは異なるため、モデリングはより柔軟です。
- リンクが相加効果を与える場合、一定の分散は必要ありません。
- モデルは最尤推定を介して添付されるため、推定量の最適なプロパティがあります。
- 対数線形およびロジスティック回帰モデルのすべての推論ツールとモデル検査は、他のGLMにも適用されます。
- 上記の表にリストされているすべてのモデルをキャプチャするためのソフトウェアパッケージには、通常、1つのプロセス(手順または機能)しかありません。 たとえば、glm()(R言語)またはPROC GENMOD(SAS)を使用します。
一般化線形モデルのデメリット
上記の利点とは別に、知っておくべき2つの大きな欠点があります。
- 一次関数のようないくつかの制限は、系統的コンポーネントに線形予測子しか持てません。
- 応答は相互に依存することはできません。
必読:機械学習プロジェクトのアイデアの説明
結論
上記のすべての情報を要約すると、 GLMは複雑さが少なく便利であることがわかりました。 GLMを使用すると、応答変数は任意の形式の指数分布タイプを持つことができます。 これとは別に、カテゴリ別の予測子を処理できます。 一般線形モデルは、解釈が容易な関連性であり、各予測子が結果にどのように影響しているかを明確に理解できます。
機械学習について詳しく知りたい場合は、IIIT-BとupGradの機械学習とAIのPGディプロマをご覧ください。これは、働く専門家向けに設計されており、450時間以上の厳格なトレーニング、30以上のケーススタディと課題、IIIT-を提供します。 B卒業生のステータス、5つ以上の実践的なキャップストーンプロジェクト、トップ企業との仕事の支援。
ポアソン回帰モデルとは何ですか?
一般化線形モデルは一般化線形モデルとどのように異なりますか?
一般化線形モデルが行う仮定のいくつかは何ですか?
GLMの仮定の大部分は線形回帰モデルに匹敵しますが、線形回帰の仮定の一部が変更されています。 GLMのデータは、独立していてランダムであると想定されています。 エラーは、定期的に配布する必要はありませんが、独立していると見なされます。 応答変数は独立している必要はありませんが、分布は指数型分布族に属している必要があります。