확률 분포의 유형 [예시와 함께 설명]
게시 됨: 2020-12-24데이터 과학에 관심이 있는 사람은 확률 분포에 대해 알아야 합니다. 베이지안 네트워크에 대한 추론 통계와 같은 데이터 과학 개념은 확률의 기본 개념 위에 개발됩니다. 따라서 통계의 세계에 들어가기 위해서는 학습 확률이 필수입니다.
목차
통계란 무엇입니까?
통계는 다양한 방법을 사용하여 수학적 수치를 분석하는 것입니다.
다양한 숫자에 대한 보다 전체적인 관점을 제공합니다. 데이터 과학에 대한 통계는 매우 중요합니다. 데이터 과학은 수치에 관한 것이며 통계는 데이터 과학을 더 단순하고 포괄적으로 만듭니다.
확률이란 무엇입니까?
확률은 직관적인 개념입니다. 우리는 일상 생활에서 무의식적으로 그것을 사용합니다. 확률은 이벤트가 발생할 가능성을 측정한 것입니다. 예를 들어 내일 비가 올 확률이 60%라면 확률은 60%입니다.
확률 분포란 무엇입니까?
확률 분포는 표 또는 방정식의 형태로 표현됩니다. 표 또는 방정식은 발생 확률이 있는 통계 실험의 모든 결과에 해당합니다.
확률 분포는 동전 던지기와 같은 간단한 이벤트에 대해서도 계산할 수 있습니다.

다음 표는 각 결과에 대한 확률과 함께 동전을 던진 각 결과의 확률 분포를 보여줍니다.
헤드 수 | 개연성 |
0 | 0.25 |
1 | 0.50 |
2 | 0.25 |
또한 특정 백신이 COVID-19를 성공적으로 치료할 확률과 같은 복잡한 이벤트에 대한 것일 수도 있습니다.
확률 분포의 전제 조건
확률 분포에 대해 알기 위해서는 변수와 확률 변수에 대해 알아야 합니다.
- 변수는 기호(A, B, x, y 등)입니다. 지정된 값 집합을 사용합니다.
- 통계 실험에서 확률 변수는 변수의 값입니다.
일반적으로 대문자는 확률 변수를 나타내고 소문자는 값 중 하나를 나타냅니다.
예를 들어,
- X는 확률 변수 X를 나타냅니다.
- P(X)는 X의 확률을 나타냅니다.
- P(X = x)는 확률 변수 X가 x로 표시되는 특정 값과 같을 확률입니다.
예를 들어, P(X = 1)은 확률 변수 X가 1일 확률입니다.
체크아웃: 데이터 과학 기술
확률 분포의 유형
통계학자는 확률 분포를 다음 유형으로 나눕니다.
- 이산 확률 분포
- 연속 확률 분포
이산 확률 분포
이산 확률 함수는 질량 함수의 확률입니다. 이산 값의 수를 가정합니다.
예를 들어, 동전을 던질 때 중간 값이 없기 때문에 이벤트 수는 이산 함수입니다. 동전 던지기에는 앞면과 뒷면만 있습니다. 마찬가지로 도서관에서 시간당 빌린 책의 수를 계산할 때 31권 또는 32권을 셀 수 있고 그 사이에는 아무 것도 셀 수 없습니다.
이산 확률 분포의 유형
- 이항 분포 – 베르누이 분포에는 1과 0의 두 가지 결과만 있습니다. 따라서 확률 변수 X는 성공 확률이 p인 값 1과 실패 확률이 q 또는 1-p인 값 0을 취합니다.
따라서 동전을 던졌을 때 앞면이 나오면 성공을, 뒷면이 나오면 실패를 의미합니다.

확률 함수는 px(1-p)1-x입니다. 여기서 x € (0, 1)
- 정규 분포 – 정규 분포는 가장 기본적인 상황을 위한 것입니다. 다음과 같은 특징이 있습니다.
- 평균, 중앙값 및 최빈값이 일치합니다.
- 분포 곡선은 종 모양입니다.
- 분포 곡선은 x = μ를 따라 대칭입니다.
- 곡선 아래의 면적은 1입니다.
- 포아송 분포 s - 도서관에서 책의 수를 세는 것은 확률 분포에 속합니다.
포아송 분포에는 다음과 같은 가정이 있습니다.
- 성공적인 이벤트는 다른 성공적인 이벤트의 결과에 영향을 미치지 않습니다.
- 짧은 기간 동안의 성공 확률은 더 긴 기간 동안의 성공 확률과 같습니다.
- 지속 시간이 작아질수록 지속 시간의 성공 확률은 0에 가까워집니다.
더 읽어보기: 데이터 과학과 데이터 분석
연속 확률 분포
확률 밀도 함수라고도 합니다. 변수가 두 값 사이에 무한한 수의 값을 갖는다고 가정하면 연속 분포가 있습니다. 연속 변수는 키, 체중 및 온도와 같은 척도로 측정됩니다.
모든 값이 0이 아닌 결과인 이산 확률 분포와 비교할 때 연속 분포는 특정 기능에 대한 확률이 0입니다. 예를 들어, 정확히 40도인 온도를 측정할 때 확률은 0입니다.

세계 최고의 대학에서 기계 학습 과정 을 배우십시오 . 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.
연속 확률 분포의 유형
- 균일 분포 – 주사위를 던질 때 결과는 1에서 6입니다. 이러한 결과의 확률은 동일하며 균일 분포입니다.
확률 변수 X가 k개의 다른 값을 가정한다고 가정합니다. 또한 P(X=xk)는 일정합니다.
P(X=xk) = 1/k
- 누적 확률 분포 – 확률 변수 X의 값이 지정된 범위 내에 있을 확률이 있을 때 누적 확률이 나타납니다.
동전을 던졌다고 가정하고 앞면이 한 개 이하일 확률은 얼마입니까? 이것은 누적 확률입니다.
헤드 수: x | 확률 P(X=x) | 누적 확률: P(X ≤ x) |
0 | 0.25 | 0.25 |
1 | 0.50 | 0.75 |
2 | 0.25 | 1.00 |
마지막 생각들
- 확률 분포 는 주어진 데이터 생성 프로세스에 대해 가능한 값의 예상 결과를 보여줍니다.
- 확률 분포 는 특성이 다른 여러 유형입니다. 특성은 주로 평균과 표준편차로 정의됩니다.
- 투자자들은 시간이 지남에 따라 주식과 같은 자산의 수익을 예측하고 위험을 예측하기 위해 확률 분포에 크게 의존합니다.
열정이 있고 인공 지능에 대해 더 배우고 싶다면 400시간 이상의 학습, 실습 세션, 직업 지원 등을 제공하는 IIIT-B & upGrad의 기계 학습 및 딥 러닝 PG 디플로마를 수강할 수 있습니다.
확률 분포의 속성은 무엇입니까?
확률분포가 확률분포라고 불려야 하는 세 가지 속성이 있다. 첫째, 교환 가능해야 합니다. 이것은 분포에서 두 항을 더할 때 어떤 항을 먼저 추가하든 상관없이 동일한 합계를 얻어야 함을 의미합니다. 둘째, 각 항이 이전 항보다 크거나 같아야 함을 의미하는 완전히 단조적이어야 합니다. 셋째, 분포는 연속적이어야 합니다. 즉, 다른 숫자에 대한 확률 사이에 간격이 없어야 합니다.
의사 결정에 확률 분포가 어떻게 사용됩니까?
의사 결정에서 확률 분포는 프로세스의 결과가 불확실한 광범위한 응용 분야에서 사용됩니다. 카지노에서 확률 분포는 특정 결과의 확률을 결정하는 데 사용됩니다. 의료 분야에서 확률 분포는 특정 질병의 가능성을 결정하는 데 사용됩니다. 비즈니스에서 확률 분포는 행동에 대한 특정 결과의 가능성을 결정하는 데 사용됩니다. 이러한 확률 분포의 적용은 무궁무진합니다.
확률 분포란 무엇입니까?
확률 분포는 확률 변수가 특정 값일 확률을 제공하는 수학 함수입니다. 확률 변수의 개념은 확률 이론의 핵심입니다. 이산 확률 변수의 확률 분포는 개별 가능한 값의 확률 목록 형식을 취합니다. 일반적으로 확률 분포는 주어진 공간에서 임의의 변수에 대한 특정 값(또는 범위)의 발생 확률을 설명하는 수학 함수입니다.