Arten der Wahrscheinlichkeitsverteilung [an Beispielen erklärt]
Veröffentlicht: 2020-12-24Jeder, der sich für Data Science interessiert, muss über Wahrscheinlichkeitsverteilung Bescheid wissen. Data-Science-Konzepte wie Inferenzstatistik bis hin zu Bayes'schen Netzen werden auf Basis der grundlegenden Wahrscheinlichkeitskonzepte entwickelt. Um in die Welt der Statistik einzusteigen, ist die Lernwahrscheinlichkeit also ein Muss.
Inhaltsverzeichnis
Was ist Statistik?
Statistik analysiert mathematische Zahlen mit unterschiedlichen Methoden.
Es gibt uns eine ganzheitlichere Sicht auf verschiedene Zahlen. Statistik für Data Science ist sehr wichtig. Bei Data Science dreht sich alles um Zahlen, und Statistiken machen es einfacher und umfassender.
Was ist Wahrscheinlichkeit?
Wahrscheinlichkeit ist ein intuitives Konzept. Wir verwenden es unwissentlich in unserem täglichen Leben. Die Wahrscheinlichkeit ist das Maß dafür, wie wahrscheinlich ein Ereignis eintritt. Wenn beispielsweise morgen eine Regenwahrscheinlichkeit von 60 % besteht, beträgt die Wahrscheinlichkeit 60 %.
Was ist Wahrscheinlichkeitsverteilung?
Eine Wahrscheinlichkeitsverteilung wird in Form einer Tabelle oder einer Gleichung dargestellt. Die Tabelle bzw. die Gleichung entspricht jedem Ausgang eines statistischen Experiments mit seiner Eintrittswahrscheinlichkeit.
Wahrscheinlichkeitsverteilungen können sogar für einfache Ereignisse wie das Werfen einer Münze berechnet werden.

Die folgende Tabelle zeigt die Wahrscheinlichkeitsverteilung jedes Ergebnisses des Werfens einer Münze, jedes Ergebnis mit seiner Wahrscheinlichkeit.
Anzahl der Köpfe | Wahrscheinlichkeit |
0 | 0,25 |
1 | 0,50 |
2 | 0,25 |
Sie können auch für komplexe Ereignisse gelten, wie z. B. die Wahrscheinlichkeit, dass ein bestimmter Impfstoff COVID-19 erfolgreich behandelt.
Voraussetzungen der Wahrscheinlichkeitsverteilung
Um etwas über Wahrscheinlichkeitsverteilungen zu wissen, müssen Sie sich mit Variablen und Zufallsvariablen auskennen.
- Eine Variable ist ein Symbol (A, B, x, y usw.). Es nimmt einen der angegebenen Wertesätze an.
- In einem statistischen Experiment ist eine Zufallsvariable der Wert einer Variablen.
Normalerweise bezeichnet ein Großbuchstabe eine Zufallsvariable und ein Kleinbuchstabe einen ihrer Werte.
Zum Beispiel,
- X bezeichnet die Zufallsvariable X.
- P(X) bezeichnet die Wahrscheinlichkeit von X.
- P(X = x) ist die Wahrscheinlichkeit, dass die Zufallsvariable X gleich einem bestimmten Wert ist, der mit x bezeichnet wird.
Beispielsweise ist P(X = 1) die Wahrscheinlichkeit, dass die Zufallsvariable X gleich 1 ist.
Checkout: Data Science-Fähigkeiten
Arten von Wahrscheinlichkeitsverteilungen
Statistiker unterteilen Wahrscheinlichkeitsverteilungen in die folgenden Typen:
- Diskrete Wahrscheinlichkeitsverteilungen
- Kontinuierliche Wahrscheinlichkeitsverteilungen
Diskrete Wahrscheinlichkeitsverteilungen
Diskrete Wahrscheinlichkeitsfunktionen sind die Wahrscheinlichkeit von Massenfunktionen. Es nimmt eine diskrete Anzahl von Werten an.
Wenn Sie beispielsweise eine Münze werfen, handelt es sich bei der Anzahl der Ereignisse um diskrete Funktionen, da es keine Zwischenwerte gibt. Bei einem Münzwurf gibt es nur Kopf oder Zahl. In ähnlicher Weise können Sie beim Zählen der pro Stunde in einer Bibliothek ausgeliehenen Bücher 31 oder 32 Bücher und nichts dazwischen zählen.
Arten diskreter Wahrscheinlichkeitsverteilungen
- Binomialverteilungen – Eine Bernoulli-Verteilung hat nur zwei Ergebnisse, 1 und 0. Daher nimmt die Zufallsvariable X den Wert 1 mit der Erfolgswahrscheinlichkeit als p und den Wert 0 mit der Ausfallwahrscheinlichkeit als q oder 1-p an.
Wenn Sie also eine Münze werfen, bedeutet das Auftreten von „Kopf“ einen Erfolg und eine „Zahl“ einen Misserfolg.
Die Wahrscheinlichkeitsfunktion ist px(1-p)1-x wobei x € (0, 1)
- Normalverteilungen – Normalverteilungen sind für die grundlegendsten Situationen. Es hat die folgenden Eigenschaften:
- Mittelwert, Median und Modus stimmen überein.
- Die Verteilungskurve ist glockenförmig.
- Die Verteilungskurve ist symmetrisch entlang x = μ.
- Die Fläche unter der Kurve ist 1.
- Poisson-Verteilung s – Das Zählen der Anzahl der Bücher in einer Bibliothek fällt unter die Wahrscheinlichkeitsverteilung.
Poisson-Verteilungen haben die folgenden Annahmen:

- Ein erfolgreiches Ereignis beeinflusst nicht das Ergebnis eines anderen erfolgreichen Ereignisses.
- Die Erfolgswahrscheinlichkeit über einen kurzen Zeitraum ist gleich der Erfolgswahrscheinlichkeit über einen längeren Zeitraum.
- Die Erfolgswahrscheinlichkeit in einer Dauer nähert sich Null, wenn die Dauer kleiner wird.
Lesen Sie auch: Data Science vs. Data Analytics
Kontinuierliche Wahrscheinlichkeitsverteilungen
Sie wird auch als Wahrscheinlichkeitsdichtefunktion bezeichnet. Eine kontinuierliche Verteilung liegt vor, wenn die Variable davon ausgeht, dass sie zwischen zwei beliebigen Werten unendlich viele Werte hat. Kontinuierliche Variablen werden auf Skalen gemessen, wie Größe, Gewicht und Temperatur.
Im Vergleich zu diskreten Wahrscheinlichkeitsverteilungen, bei denen jeder Wert ein Ergebnis ungleich Null ist, haben kontinuierliche Verteilungen für bestimmte Funktionen eine Wahrscheinlichkeit von Null. Beispielsweise ist die Wahrscheinlichkeit null, wenn eine Temperatur gemessen wird, die genau 40 Grad beträgt.

Lernen Sie maschinelles Lernen von den besten Universitäten der Welt. Erwerben Sie Master-, Executive PGP- oder Advanced Certificate-Programme, um Ihre Karriere zu beschleunigen.
Arten von kontinuierlichen Wahrscheinlichkeitsverteilungen
- Gleichverteilung – Beim Würfeln sind die Ergebnisse 1 bis 6. Die Wahrscheinlichkeiten dieser Ergebnisse sind gleich, und das ist eine Gleichverteilung.
Angenommen, die Zufallsvariable X nimmt k verschiedene Werte an. Außerdem ist P(X=xk) konstant.
Das P(X=xk) = 1/k
- Kumulative Wahrscheinlichkeitsverteilungen – Wenn die Wahrscheinlichkeit, dass der Wert einer Zufallsvariablen X innerhalb eines bestimmten Bereichs liegt, kommt die kumulative Wahrscheinlichkeit ins Spiel.
Angenommen, Sie werfen eine Münze, wie hoch ist dann die Wahrscheinlichkeit, dass das Ergebnis ein oder weniger Kopf ist. Dies ist eine kumulative Wahrscheinlichkeit.
Anzahl der Köpfe: x | Wahrscheinlichkeit P(X=x) | Kumulative Wahrscheinlichkeit: P(X ≤ x) |
0 | 0,25 | 0,25 |
1 | 0,50 | 0,75 |
2 | 0,25 | 1.00 |
Abschließende Gedanken
- Die Wahrscheinlichkeitsverteilung zeigt die erwarteten Ergebnisse der möglichen Werte für einen bestimmten Datengenerierungsprozess.
- Wahrscheinlichkeitsverteilungen sind von unterschiedlicher Art und weisen unterschiedliche Eigenschaften auf. Die Eigenschaften werden hauptsächlich durch den Mittelwert und die Standardabweichung definiert.
- Anleger verlassen sich stark auf Wahrscheinlichkeitsverteilungen, um die Renditen von Vermögenswerten wie Aktien im Laufe der Zeit zu prognostizieren und ihr Risiko vorherzusehen.
Wenn Sie die Leidenschaft haben und mehr über künstliche Intelligenz erfahren möchten, können Sie das PG-Diplom von IIIT-B & upGrad in maschinellem Lernen und tiefem Lernen absolvieren, das mehr als 400 Stunden Lernen, praktische Sitzungen, Arbeitsunterstützung und vieles mehr bietet.
Welche Eigenschaften hat eine Wahrscheinlichkeitsverteilung?
Es gibt drei Eigenschaften, die eine Wahrscheinlichkeitsverteilung haben muss, um als Wahrscheinlichkeitsverteilung bezeichnet zu werden. Erstens sollte es kommutativ sein. Dies bedeutet lediglich, dass Sie beim Addieren von zwei beliebigen Termen aus der Verteilung dieselbe Summe erhalten sollten, unabhängig davon, welchen Term Sie zuerst hinzufügen. Zweitens sollte es vollständig monoton sein, was bedeutet, dass jeder Term größer oder gleich dem vorherigen Term sein muss. Und drittens sollte die Verteilung kontinuierlich sein, was nur bedeutet, dass Sie keine Lücken zwischen den Wahrscheinlichkeiten für verschiedene Zahlen haben können.
Wie werden Wahrscheinlichkeitsverteilungen bei der Entscheidungsfindung verwendet?
Bei der Entscheidungsfindung werden die Wahrscheinlichkeitsverteilungen in einem breiten Spektrum von Anwendungen verwendet, bei denen das Ergebnis eines Prozesses ungewiss ist. Im Casino werden die Wahrscheinlichkeitsverteilungen verwendet, um die Quoten eines bestimmten Ergebnisses zu bestimmen. Im medizinischen Bereich werden die Wahrscheinlichkeitsverteilungen verwendet, um die Wahrscheinlichkeit einer bestimmten Krankheit zu bestimmen. In der Wirtschaft werden die Wahrscheinlichkeitsverteilungen verwendet, um die Möglichkeit eines bestimmten Ergebnisses einer Handlung zu bestimmen. Die Anwendungen dieser Wahrscheinlichkeitsverteilungen sind grenzenlos.
Was ist eine Wahrscheinlichkeitsverteilung?
Eine Wahrscheinlichkeitsverteilung ist eine mathematische Funktion, die die Wahrscheinlichkeit angibt, dass eine Zufallsvariable einen bestimmten Wert hat. Das Konzept einer Zufallsvariablen ist zentral in der Wahrscheinlichkeitstheorie. Die Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariablen hat die Form einer Liste von Wahrscheinlichkeiten ihrer einzelnen möglichen Werte. Im Allgemeinen ist eine Wahrscheinlichkeitsverteilung eine mathematische Funktion, die die Wahrscheinlichkeit des Auftretens eines bestimmten Werts (oder Bereichs) für eine Zufallsvariable in einem bestimmten Raum beschreibt.