Типы распределения вероятностей [объяснено с примерами]

Опубликовано: 2020-12-24

Любой, кто интересуется наукой о данных, должен знать о распределении вероятностей. Концепции науки о данных, такие как вывод статистики для байесовских сетей, разрабатываются на основе основных концепций вероятности. Таким образом, чтобы войти в мир статистики, необходимо изучить вероятность.

Оглавление

Что такое статистика?

Статистика анализирует математические фигуры с использованием различных методов.

Это дает нам более целостное представление о различных числах. Статистика для науки о данных очень важна. Наука о данных — это цифры, а статистика делает ее более простой и всеобъемлющей.

Что такое вероятность?

Вероятность — интуитивное понятие. Мы неосознанно используем его в повседневной жизни. Вероятность – это мера того, насколько вероятно событие. Например, если завтра вероятность дождя составляет 60 %, то вероятность равна 60 %.

Что такое распределение вероятностей?

Распределение вероятностей представляется в виде таблицы или уравнения. Таблица или уравнение соответствует каждому результату статистического эксперимента с его вероятностью возникновения.

Распределения вероятностей можно рассчитать даже для простых событий, таких как подбрасывание монеты.

В следующей таблице показано распределение вероятностей каждого исхода подбрасывания монеты для каждого исхода с его вероятностью.

Количество головок Вероятность
0 0,25
1 0,50
2 0,25

Они также могут относиться к сложным событиям, таким как вероятность того, что определенная вакцина успешно вылечит COVID-19.

Предпосылки распределения вероятностей

Чтобы знать о распределениях вероятностей, вы должны знать о переменных и случайных величинах.

  • Переменная — это символ (A, B, x, y и т. д.). Он принимает любое из указанного набора значений.
  • В статистическом эксперименте случайной величиной является значение переменной.

Обычно заглавная буква обозначает случайную величину, а строчная — одно из ее значений.

Например,

  • X обозначает случайную величину X.
  • P(X) обозначает вероятность X.
  • P(X = x) — это вероятность того, что случайная величина X равна определенному значению, обозначаемому x.

Например, P(X = 1) — это вероятность того, что случайная величина X равна 1.

Оформление заказа: навыки работы с данными

Типы вероятностных распределений

Статистики делят распределения вероятностей на следующие типы:

  • Дискретные распределения вероятностей
  • Непрерывные распределения вероятностей

Дискретные распределения вероятностей

Дискретные функции вероятности — это вероятности массовых функций. Он предполагает дискретное число значений.

Например, когда вы подбрасываете монету, количество событий является дискретной функцией, потому что между ними нет промежуточных значений. При подбрасывании монеты выпадает только орел или решка. Точно так же, подсчитывая количество книг, выдаваемых в час в библиотеке, вы можете насчитать 31 или 32 книги и ничего между ними.

Типы дискретных вероятностных распределений

  • Биномиальные распределения . Распределение Бернулли имеет только два результата: 1 и 0. Следовательно, случайная величина X принимает значение 1 с вероятностью успеха как p и значение 0 с вероятностью неудачи как q или 1-p.

Таким образом, если вы подбрасываете монету, выпадение орла означает успех, а решки — неудачу.

Функция вероятности равна px(1-p)1-x, где x € (0, 1)

  • Нормальные распределения . Нормальные распределения предназначены для самых простых ситуаций. Он имеет следующие характеристики:
  1. Среднее значение, медиана и мода совпадают.
  2. Кривая распределения имеет колоколообразную форму.
  3. Кривая распределения симметрична вдоль x = µ.
  4. Площадь под кривой равна 1.
  • Распределение Пуассона s - Подсчет количества книг в библиотеке подпадает под распределение вероятностей.

Распределения Пуассона имеют следующие предположения:

  • Успешное событие не влияет на исход другого успешного события.
  • Вероятность успеха в течение короткого промежутка времени равна вероятности успеха в течение более длительного времени.
  • Вероятность успеха в длительности приближается к нулю по мере того, как продолжительность становится меньше.

Читайте также: Наука о данных против аналитики данных

Непрерывные распределения вероятностей

Она также известна как функция плотности вероятности. Существует непрерывное распределение, если предполагается, что переменная имеет бесконечное число значений между любыми двумя значениями. Непрерывные переменные измеряются на шкалах, таких как рост, вес и температура.

По сравнению с дискретными распределениями вероятностей, где каждое значение является ненулевым результатом, непрерывные распределения имеют нулевую вероятность для определенных функций. Например, вероятность равна нулю при измерении температуры, равной ровно 40 градусам.

Изучите курс машинного обучения от лучших университетов мира. Заработайте программы Masters, Executive PGP или Advanced Certificate Programs, чтобы ускорить свою карьеру.

Типы непрерывных распределений вероятностей

  • Равномерное распределение . При бросании игральной кости результаты равны от 1 до 6. Вероятности этих результатов равны, и это равномерное распределение.

Предположим, что случайная величина X принимает k различных значений. Кроме того, P(X=xk) постоянна.

P(X=xk) = 1/k

  • Кумулятивные распределения вероятностей . Когда вероятность того, что значение случайной величины X находится в пределах заданного диапазона, появляется кумулятивная вероятность.

Предположим, вы подбрасываете монету, какова тогда вероятность того, что выпадет один или меньше решек. Это кумулятивная вероятность.

Количество головок: х Вероятность P(X=x) Кумулятивная вероятность: P(X ≤ x)
0 0,25 0,25
1 0,50 0,75
2 0,25 1,00

Последние мысли

  • Распределение вероятностей показывает ожидаемые результаты возможных значений для данного процесса генерации данных.
  • Распределения вероятностей бывают разных типов с разными характеристиками. Характеристики в основном определяются средним значением и стандартным отклонением.
  • Инвесторы в значительной степени полагаются на распределения вероятностей, чтобы прогнозировать доходность активов, таких как акции, с течением времени и предвидеть их риск.

Если у вас есть страсть и вы хотите узнать больше об искусственном интеллекте, вы можете получить диплом IIIT-B & upGrad PG в области машинного обучения и глубокого обучения, который предлагает более 400 часов обучения, практические занятия, помощь в работе и многое другое.

Каковы свойства распределения вероятностей?

Есть три свойства, которыми должно обладать распределение вероятностей, чтобы его можно было назвать распределением вероятностей. Во-первых, оно должно быть коммутативным. Это просто означает, что когда вы складываете любые два термина из распределения, вы должны получить одинаковую сумму независимо от того, какой термин вы добавляете первым. Во-вторых, он должен быть полностью монотонным, что означает, что каждый член должен быть больше или равен предыдущему члену. И в-третьих, распределение должно быть непрерывным, что как раз и означает, что у вас не может быть разрывов между вероятностью для разных чисел.

Как распределения вероятностей используются при принятии решений?

При принятии решений распределения вероятностей используются в широком спектре приложений, где результат процесса неясен. В казино распределения вероятностей используются для определения шансов на конкретный результат. В медицине распределения вероятностей используются для определения вероятности того или иного заболевания. В бизнесе распределения вероятностей используются для определения возможности конкретного результата действия. Применение этих вероятностных распределений безгранично.

Что такое распределение вероятностей?

Распределение вероятностей — это математическая функция, которая дает вероятность того, что случайная величина представляет собой какое-либо конкретное значение. Понятие случайной величины занимает центральное место в теории вероятностей. Распределение вероятностей дискретной случайной величины принимает форму списка вероятностей ее отдельных возможных значений. В общем случае распределение вероятностей — это математическая функция, описывающая вероятность возникновения определенного значения (или диапазона) для случайной величины в заданном пространстве.