確率分布の種類[例を挙げて説明]

公開: 2020-12-24

データサイエンスに興味のある人は、確率分布について知っている必要があります。 ベイジアンネットワークへの推論統計などのデータサイエンスの概念は、確率の基本的な概念に基づいて開発されています。 したがって、統計の世界に入るには、学習確率が必須です。

目次

統計とは何ですか?

統計は、さまざまな方法を使用して数学的な数字を分析しています。

これにより、さまざまな数値の全体像を把握できます。 データサイエンスの統計は非常に重要です。 データサイエンスはすべて数字に関するものであり、統計によってデータサイエンスはよりシンプルで包括的なものになります。

確率とは何ですか?

確率は直感的な概念です。 知らず知らずのうちに使っています。 確率は、イベントが発生する可能性の尺度です。 たとえば、明日雨が降る確率が60%の場合、確率は60%です。

確率分布とは何ですか?

確率分布は、表または方程式の形式で表されます。 表または方程式は、統計実験のすべての結果とその発生確率に対応しています。

コイントスなどの単純なイベントでも確率分布を計算できます。

次の表は、コインを投げた各結果の確率分布とその確率を示しています。

頭の数確率
0 0.25
1 0.50
2 0.25

また、特定のワクチンがCOVID-19の治療に成功する確率など、複雑なイベントにも使用できます。

確率分布の前提条件

確率分布について知るには、変数と確率変数について知る必要があります。

  • 変数はシンボル(A、B、x、yなど)です。 指定された値のセットのいずれかを取ります。
  • 統計実験では、確率変数は変数の値です。

通常、大文字は確率変数を示し、小文字はその値の1つを示します。

例えば、

  • Xは確率変数Xを示します。
  • P(X)はXの確率を示します。
  • P(X = x)は、確率変数Xがxで表される特定の値に等しい確率です。

たとえば、P(X = 1)は、確率変数Xが1に等しい確率です。

チェックアウト:データサイエンススキル

確率分布の種類

統計家は、確率分布を次のタイプに分類します。

  • 離散確率分布
  • 連続確率分布

離散確率分布

離散確率関数は、質量関数の確率です。 離散的な数の値を想定しています。

たとえば、コインを投げると、間に値がないため、イベントのカウントは離散関数になります。 コイントスには頭か尾しかありません。 同様に、図書館で1時間あたりに借りた本の数を数える場合、31冊または32冊の本を数えることができ、その間に何もありません。

離散確率分布のタイプ

  • 二項分布–ベルヌーイ分布の結果は1と0の2つだけです。したがって、確率変数Xは、成功の確率がpの値1と、失敗の確率がqまたは1-pの値0を取ります。

したがって、コインを投げた場合、頭の出現は成功を示し、尾の出現は失敗を示します。

確率関数はpx(1-p)1-xです。ここでx€(0、1)

  • 正規分布–正規分布は最も基本的な状況に対応しています。 次の特徴があります。
  1. 平均、中央値、および最頻値は一致します。
  2. 分布曲線はベル型です。
  3. 分布曲線はx=μに沿って対称です。
  4. 曲線の下の面積は1です。
  • ポアソン分布s–図書館で本の数を数えることは確率分布に分類されます。

ポアソン分布には、次の仮定があります。

  • 成功したイベントは、別の成功したイベントの結果に影響を与えません。
  • 短期間の成功の確率は、長期にわたる成功の確率と同じです。
  • 期間が短くなるにつれて、期間の成功の確率はゼロに近づきます。

また読む:データサイエンスとデータ分析

連続確率分布

これは、確率密度関数とも呼ばれます。 変数が任意の2つの値の間に無限の数の値を持つと想定する場合、連続分布があります。 連続変数は、身長、体重、体温などの尺度で測定されます。

すべての値がゼロ以外の結果である離散確率分布と比較すると、連続分布では特定の関数の確率がゼロになります。 たとえば、正確に40度の温度を測定する場合、確率はゼロです。

世界のトップ大学から機械学習コース学びましょう。 マスター、エグゼクティブPGP、または高度な証明書プログラムを取得して、キャリアを迅速に追跡します。

連続確率分布の種類

  • 一様分布–サイコロを振った場合、結果は1から6になります。これらの結果の確率は等しく、それは一様分布です。

確率変数Xがk個の異なる値を想定していると仮定します。 また、P(X = xk)は一定です。

P(X = xk)= 1 / k

  • 累積確率分布–確率変数Xの値が指定された範囲内にある確率が、累積確率になります。

コインを投げたとすると、結果が1つ以下の頭になる確率はどのくらいですか。 これは累積確率です。

頭の数:x 確率P(X = x) 累積確率:P(X≤x)
0 0.25 0.25
1 0.50 0.75
2 0.25 1.00

最終的な考え

  • 確率分布は、特定のデータ生成プロセスで可能な値の期待される結果を示します。
  • 確率分布は、さまざまな特性を持つさまざまなタイプです。 特性は、主に平均と標準偏差によって定義されます。
  • 投資家は、時間の経過に伴う株式などの資産の収益を予測し、そのリスクを予測するために、確率分布に大きく依存しています。

情熱があり、人工知能についてもっと知りたい場合は、機械学習とディープラーニングでIIIT-BとupGradのPGディプロマを受講できます。これは、400時間以上の学習、実践的なセッション、仕事の支援などを提供します。

確率分布の特性は何ですか?

確率分布を確率分布と呼ぶ必要がある3つのプロパティがあります。 まず、可換である必要があります。 これは、分布から任意の2つの用語を合計すると、最初に追加した用語に関係なく、同じ合計が得られることを意味します。 次に、完全に単調である必要があります。つまり、各項は前の項以上である必要があります。 そして第3に、分布は連続的である必要があります。これは、異なる数の確率の間にギャップがないことを意味します。

意思決定で確率分布はどのように使用されますか?

意思決定では、確率分布は、プロセスの結果が不確実な幅広いアプリケーションで使用されます。 カジノでは、確率分布を使用して特定の結果のオッズを決定します。 医療分野では、確率分布を使用して特定の病気の可能性を判断します。 ビジネスでは、確率分布を使用して、アクションに対する特定の結果の可能性を判断します。 これらの確率分布の適用は無限です。

確率分布とは何ですか?

確率分布は、確率変数が特定の値である確率を与える数学関数です。 確率変数の概念は、確率論の中心です。 離散確率変数の確率分布は、その個々の可能な値の確率のリストの形式を取ります。 一般に、確率分布は、特定の空間で確率変数の特定の値(または範囲)が発生する確率を表す数学関数です。