Rodzaje rozkładu prawdopodobieństwa [wyjaśnione z przykładami]

Opublikowany: 2020-12-24

Każdy zainteresowany nauką o danych musi wiedzieć o dystrybucji prawdopodobieństwa. Koncepcje Data Science, takie jak statystyki inferencyjne dla sieci bayesowskich, są opracowywane na szczycie podstawowych koncepcji prawdopodobieństwa. Aby wejść w świat statystyki, prawdopodobieństwo uczenia się jest koniecznością.

Spis treści

Co to są statystyki?

Statystyka to analiza liczb matematycznych przy użyciu różnych metod.

Daje nam bardziej holistyczny pogląd na różne liczby. Statystyki dla nauki o danych są bardzo istotne. Nauka o danych to przede wszystkim liczby, a statystyki czynią ją prostszą i wszechstronniejszą.

Co to jest prawdopodobieństwo?

Prawdopodobieństwo to pojęcie intuicyjne. Używamy go nieświadomie w naszym codziennym życiu. Prawdopodobieństwo to miara prawdopodobieństwa wystąpienia zdarzenia. Na przykład, jeśli istnieje 60% szansa na deszcz jutro, to prawdopodobieństwo wynosi 60%.

Co to jest rozkład prawdopodobieństwa?

Rozkład prawdopodobieństwa przedstawiany jest w postaci tabeli lub równania. Tabela lub równanie odpowiada każdemu wynikowi eksperymentu statystycznego z prawdopodobieństwem jego wystąpienia.

Rozkłady prawdopodobieństwa można obliczyć nawet dla prostych zdarzeń, takich jak rzut monetą.

Poniższa tabela przedstawia rozkład prawdopodobieństwa każdego wyniku rzucania monetą, każdy wynik wraz z jego prawdopodobieństwem.

Liczba głów Prawdopodobieństwo
0 0,25
1 0,50
2 0,25

Mogą również dotyczyć złożonych zdarzeń, takich jak prawdopodobieństwo, że pewna szczepionka skutecznie wyleczy COVID-19.

Warunki wstępne rozkładu prawdopodobieństwa

Aby poznać rozkłady prawdopodobieństwa, musisz znać zmienne i zmienne losowe.

  • Zmienna to symbol (A, B, x, y itd.). Przyjmuje dowolny z określonego zestawu wartości.
  • W eksperymencie statystycznym zmienna losowa jest wartością zmiennej.

Zwykle wielka litera oznacza zmienną losową, a mała litera oznacza jedną z jej wartości.

Na przykład,

  • X oznacza zmienną losową X.
  • P(X) oznacza prawdopodobieństwo wystąpienia X.
  • P(X = x) to prawdopodobieństwo, że zmienna losowa X jest równa określonej wartości, oznaczonej przez x.

Na przykład P(X = 1) to prawdopodobieństwo, że zmienna losowa X jest równa 1.

Zamówienie: umiejętności analizy danych

Rodzaje rozkładów prawdopodobieństwa

Statystycy dzielą rozkłady prawdopodobieństwa na następujące typy:

  • Dyskretne rozkłady prawdopodobieństwa
  • Ciągłe rozkłady prawdopodobieństwa

Dyskretne rozkłady prawdopodobieństwa

Dyskretne funkcje prawdopodobieństwa to prawdopodobieństwo funkcji masy. Przyjmuje dyskretną liczbę wartości.

Na przykład, gdy rzucasz monetą, liczenie zdarzeń jest funkcjami dyskretnymi, ponieważ nie ma wartości pośrednich. W rzucie monetą masz tylko orły lub reszki. Podobnie, licząc liczbę książek wypożyczonych na godzinę w bibliotece, można policzyć 31 lub 32 książki i nic pomiędzy.

Rodzaje dyskretnych rozkładów prawdopodobieństwa

  • Rozkłady dwumianowe – Rozkład Bernoulliego ma tylko dwa wyniki, 1 i 0. Dlatego zmienna losowa X przyjmuje wartość 1 z prawdopodobieństwem sukcesu jako p, a wartość 0 z prawdopodobieństwem niepowodzenia jako q lub 1-p.

Tak więc, jeśli rzucasz monetą, pojawienie się głowy oznacza sukces, a ogon oznacza porażkę.

Funkcja prawdopodobieństwa to px(1-p)1-x, gdzie x € (0, 1)

  • Rozkłady normalne — rozkłady normalne dotyczą najbardziej podstawowych sytuacji. Ma następujące cechy:
  1. Średnia, mediana i tryb pokrywają się.
  2. Krzywa rozkładu ma kształt dzwonu.
  3. Krzywa rozkładu jest symetryczna wzdłuż x = μ.
  4. Pole pod krzywą wynosi 1.
  • Rozkład Poissona s — liczenie liczby książek w bibliotece mieści się w rozkładzie prawdopodobieństwa.

Rozkłady Poissona mają następujące założenia:

  • Udane wydarzenie nie wpływa na wynik innego udanego wydarzenia.
  • Prawdopodobieństwo sukcesu w krótkim czasie jest równe prawdopodobieństwu sukcesu w dłuższym okresie.
  • Prawdopodobieństwo sukcesu w czasie trwania zbliża się do zera, gdy czas trwania zmniejsza się.

Przeczytaj także: Nauka o danych a analiza danych

Ciągłe rozkłady prawdopodobieństwa

Jest również znany jako funkcje gęstości prawdopodobieństwa. Rozkład ciągły występuje, jeśli zmienna zakłada, że ​​ma nieskończoną liczbę wartości między dowolnymi dwiema wartościami. Zmienne ciągłe są mierzone na wadze, takie jak wzrost, waga i temperatura.

W porównaniu z dyskretnymi rozkładami prawdopodobieństwa, w których każda wartość jest wynikiem niezerowym, rozkłady ciągłe mają zerowe prawdopodobieństwo dla określonych funkcji. Na przykład prawdopodobieństwo wynosi zero przy pomiarze temperatury, która wynosi dokładnie 40 stopni.

Ucz się kursu uczenia maszynowego z najlepszych uniwersytetów na świecie. Zdobywaj programy Masters, Executive PGP lub Advanced Certificate Programy, aby przyspieszyć swoją karierę.

Rodzaje ciągłych rozkładów prawdopodobieństwa

  • Rozkłady równomierne – podczas rzucania kostką wyniki wynoszą od 1 do 6. Prawdopodobieństwo tych wyników jest równe i jest to rozkład jednolity.

Załóżmy, że zmienna losowa X przyjmuje k różnych wartości. Ponadto P(X=xk) jest stałe.

P(X=xk) = 1/k

  • Rozkłady prawdopodobieństwa skumulowanego — gdy prawdopodobieństwo, że wartość zmiennej losowej X mieści się w określonym zakresie, pojawia się prawdopodobieństwo skumulowane.

Załóżmy, że rzucasz monetą, jakie jest prawdopodobieństwo, że wynikiem będzie jedna lub mniej reszek. To jest skumulowane prawdopodobieństwo.

Liczba głowic: x Prawdopodobieństwo P(X=x) Prawdopodobieństwo skumulowane: P(X ≤ x)
0 0,25 0,25
1 0,50 0,75
2 0,25 1,00

Końcowe przemyślenia

  • Rozkład prawdopodobieństwa pokazuje oczekiwane wyniki możliwych wartości dla danego procesu generowania danych.
  • Rozkłady prawdopodobieństwa są różnych typów i mają różne cechy. Charakterystyki są określane głównie przez średnią i odchylenie standardowe.
  • Inwestorzy w dużym stopniu polegają na rozkładach prawdopodobieństwa, aby prognozować zwroty z aktywów, takich jak akcje, w czasie i przewidywać ryzyko.

Jeśli masz pasję i chcesz dowiedzieć się więcej o sztucznej inteligencji, możesz podjąć studia IIIT-B i upGrad's PG Diploma in Machine Learning and Deep Learning, które oferuje ponad 400 godzin nauki, sesje praktyczne, pomoc w pracy i wiele więcej.

Jakie są właściwości rozkładu prawdopodobieństwa?

Istnieją trzy właściwości, które należy nazwać rozkładem prawdopodobieństwa rozkładem prawdopodobieństwa. Po pierwsze, powinno być przemienne. Oznacza to po prostu, że gdy dodasz dowolne dwa terminy z dystrybucji, otrzymasz taką samą sumę bez względu na to, który termin dodasz jako pierwszy. Po drugie, powinien być całkowicie monotoniczny, co oznacza, że ​​każdy termin musi być większy lub równy poprzedniemu terminowi. I po trzecie, rozkład powinien być ciągły, co po prostu oznacza, że ​​nie możesz mieć przerw między prawdopodobieństwem dla różnych liczb.

Jak wykorzystywane są rozkłady prawdopodobieństwa w podejmowaniu decyzji?

Przy podejmowaniu decyzji rozkłady prawdopodobieństwa są wykorzystywane w szerokim spektrum zastosowań, w których wynik procesu jest niepewny. W kasynie rozkłady prawdopodobieństwa służą do określenia szans na konkretny wynik. W medycynie rozkłady prawdopodobieństwa służą do określenia prawdopodobieństwa wystąpienia konkretnej choroby. W biznesie rozkłady prawdopodobieństwa są używane do określenia możliwości określonego wyniku działania. Zastosowania tych rozkładów prawdopodobieństwa są nieograniczone.

Co to jest rozkład prawdopodobieństwa?

Rozkład prawdopodobieństwa to funkcja matematyczna, która podaje prawdopodobieństwo, że zmienna losowa ma określoną wartość. Pojęcie zmiennej losowej ma kluczowe znaczenie dla teorii prawdopodobieństwa. Rozkład prawdopodobieństwa dyskretnej zmiennej losowej ma postać listy prawdopodobieństw jej poszczególnych możliwych wartości. Ogólnie rzecz biorąc, rozkład prawdopodobieństwa jest funkcją matematyczną opisującą prawdopodobieństwo wystąpienia określonej wartości (lub zakresu) dla zmiennej losowej w danej przestrzeni.