概率分佈的類型 [舉例說明]

已發表: 2020-12-24

任何對數據科學感興趣的人都必須了解概率分佈。 貝葉斯網絡的推論統計等數據科學概念是在概率的基本概念之上發展起來的。 所以要進入統計學的世界,學習概率是必須的。

目錄

什麼是統計?

統計學正在使用不同的方法分析數學數字。

它讓我們更全面地了解不同的數字。 數據科學的統計數據非常重要。 數據科學都是關於數字的,而統計數據使它更簡單、更全面。

什麼是概率?

概率是一個直觀的概念。 我們在日常生活中不知不覺地使用它。 概率是事件發生可能性的度量。 例如,如果明天有 60% 的概率下雨,那麼概率是 60%。

什麼是概率分佈?

概率分佈以表格或方程的形式表示。 表格或方程式對應於統計實驗的每個結果及其發生概率。

即使是簡單的事件,例如拋硬幣,也可以計算概率分佈。

下表顯示了拋硬幣的每個結果的概率分佈,每個結果及其概率。

頭數可能性
0 0.25
1 0.50
2 0.25

它們也可以用於復雜事件,例如某種疫苗成功治療 COVID-19 的概率。

概率分佈的先決條件

要了解概率分佈,您必須了解變量和隨機變量。

  • 變量是一個符號(A、B、x、y 等)。 它採用任何指定的值集。
  • 在統計實驗中,隨機變量是變量的值。

通常,大寫字母表示隨機變量,小寫字母表示其中一個值。

例如,

  • X 表示隨機變量 X。
  • P(X) 表示 X 的概率。
  • P(X = x) 是隨機變量 X 等於特定值的概率,用 x 表示。

例如,P(X = 1) 是隨機變量 X 等於 1 的概率。

結帳:數據科學技能

概率分佈的類型

統計學家將概率分佈分為以下類型:

  • 離散概率分佈
  • 連續概率分佈

離散概率分佈

離散概率函數是質量函數的概率。 它假定離散數量的值。

例如,當您擲硬幣時,事件計數是離散函數,因為沒有中間值。 拋硬幣時只有正面或反面。 同樣,在計算圖書館每小時藉書的數量時,您可以數 31 或 32 本書,中間什麼也沒有。

離散概率分佈的類型

  • 二項分佈——伯努利分佈只有兩個結果,1 和 0。因此,隨機變量 X 取值為 1,成功概率為 p,值為 0,失敗概率為 q 或 1-p。

因此,如果你擲硬幣,出現正面表示成功,出現尾部表示失敗。

概率函數是 px(1-p)1-x 其中 x € (0, 1)

  • 正態分佈——正態分佈適用於最基本的情況。 它具有以下特點:
  1. 均值、中位數和眾數重合。
  2. 分佈曲線呈鐘形。
  3. 分佈曲線沿 x = μ 對稱。
  4. 曲線下面積為 1。
  • 泊松分佈s – 計算圖書館的圖書數量屬於概率分佈。

泊松分佈具有以下假設:

  • 一個成功的事件不會影響另一個成功事件的結果。
  • 短期內成功的概率等於長期內成功的概率。
  • 隨著持續時間變小,在持續時間中成功的概率接近於零。

另請閱讀:數據科學與數據分析

連續概率分佈

它也被稱為概率密度函數。 如果變量假定在任意兩個值之間具有無限個值,則存在連續分佈。 連續變量是在尺度上測量的,如身高、體重和溫度。

與每個值都是非零結果的離散概率分佈相比,連續分佈對於特定函數的概率為零。 例如,當測量正好是 40 度的溫度時,概率為零。

向世界頂尖大學學習機器學習課程獲得碩士、Executive PGP 或高級證書課程以加快您的職業生涯。

連續概率分佈的類型

  • 均勻分佈——擲骰子時,結果是 1 到 6。這些結果的概率是相等的,這就是均勻分佈。

假設隨機變量 X 假設有 k 個不同的值。 此外,P(X=xk) 是常數。

P(X=xk) = 1/k

  • 累積概率分佈——當隨機變量 X 的值在指定範圍內的概率時,累積概率就出現了。

假設你擲硬幣,那麼結果是正面朝上的概率是多少。 這是一個累積概率。

頭數:x 概率 P(X=x) 累積概率:P(X ≤ x)
0 0.25 0.25
1 0.50 0.75
2 0.25 1.00

最後的想法

  • 概率分佈顯示給定數據生成過程的可能值的預期結果。
  • 概率分佈是具有不同特徵的不同類型。 特徵主要由均值和標準差定義。
  • 投資者嚴重依賴概率分佈來預測股票等資產隨著時間的推移的回報並預測其風險。

如果您有熱情並想了解更多關於人工智能的信息,您可以參加 IIIT-B 和 upGrad 的機器學習和深度學習 PG 文憑,該文憑提供 400 多個小時的學習、實踐課程、工作幫助等等。

概率分佈的性質是什麼?

概率分佈必須具有三個屬性才能稱為概率分佈。 首先,它應該是可交換的。 這只是意味著當您將分佈中的任何兩個術語相加時,無論您首先添加哪個術語,您都應該得到相同的總數。 其次,它應該是完全單調的,這意味著每一項必須大於或等於前一項。 第三,分佈應該是連續的,這意味著你不能在不同數字的概率之間存在差距。

如何在決策中使用概率分佈?

在決策制定中,概率分佈用於過程結果不確定的廣泛應用中。 在賭場中,概率分佈用於確定特定結果的機率。 在醫學領域,概率分佈用於確定特定疾病的可能性。 在商業中,概率分佈用於確定某一行動的特定結果的可能性。 這些概率分佈的應用是無限的。

什麼是概率分佈?

概率分佈是一個數學函數,它給出隨機變量是任何特定值的概率。 隨機變量的概念是概率論的核心。 離散隨機變量的概率分佈採用其各個可能值的概率列表的形式。 一般來說,概率分佈是一個數學函數,它描述給定空間中隨機變量的特定值(或範圍)出現的概率。