베이지안 대 빈도론자: 다음 문제에 대해 어느 것을 선택해야 합니까?
게시 됨: 2020-12-23통계에 관심이 있다면 베이지안 vs. 빈도주의라는 큰 논쟁에 대해 읽었을 가능성이 있습니다. 이들 각각은 확률과 관련된 통계적 문제를 해결하기 위한 접근 방식일 뿐입니다. 이제 베이지안 통계학자들은 그들의 방법에 대해 빈도주의자들을 비난하고 그 반대의 경우도 마찬가지입니다. 이 논쟁은 끝이 없습니다. 둘 다 장단점이 있습니다.
이 기사에서 우리는 두 가지 접근 방식을 모두 살펴보고 다음 통계 문제에 대해 둘 중 어느 것이 당신에게 좋은지 알아낼 것입니다.
목차
베이지안 대 빈도론자 - 확률 정의 측면에서
정의 1: Frank Ramsey의 믿음의 정도로서의 확률(베이지안 접근법)
사건의 확률은 주관적인 믿음의 정도에 의해 측정됩니다. '논리적 확률'이라고도 합니다. 이것은 다른 사람이 당신보다 더 많은 증거를 가지고 있다면 확률에 대한 당신의 정의가 다른 사람의 것과 다를 수 있음을 의미합니다. 이것은 완전히 괜찮고 상대방은 자신이 원하는 대로 생각할 수 있습니다.
정의 2: Ronald Fisher의 장기 빈도로서의 확률(Frequentists Approach)
사건의 확률은 그 사건이 여러 번 반복될 때 그 사건의 장기적 빈도와 같습니다. 보편적인 대답은 하나이며 정의 1과 달리 사건의 확률에 대한 의견은 증거가 더 많거나 적더라도 사람마다 다를 수 없습니다.

예시:
한쪽에는 앞면이 있고 다른쪽에는 뒷면이 있는 편향되지 않은 일반 동전이 있다고 가정합니다. 이제 나는 동전을 던진다. 결과가 있습니다. 그러나 관중으로서 당신은 동전이 헤즈업인지 테일업인지 모릅니다.
그래서 저는 여러분이 " 내가 던진 동전이 앞면이 나올 확률은 얼마입니까?"라고 대답하기를 바랍니다.
확률에 대한 두 가지 다른 정의에 따라 두 가지 다른 종류의 답변이 있습니다 .
베이지안
베이지안은 동전이 헤즈업될 확률이 50%라고 대답할 것입니다. 베이지안인 당신은 나에게 이렇게 말할 것 입니다. 하지만 예, 당신은 던지기의 결과를 알고 있습니다. 따라서 동전이 앞면이거나 뒷면일 확률은 100%입니다. 하지만 알다시피, 나는 상관하지 않습니다. 나에게 사용 가능한 리소스에 따라 대답은 50%이기 때문입니다. "
빈도주의자
빈도주의자들은 “ 코인이 헤즈업일 확률은 100%이거나 0%입니다. 코인이 상륙했기 때문에 이 고정되고 일정한 값에 확률을 부여하는 것은 아무 소용이 없습니다. 던지기의 결과는 최종적이며 변경 사항이 없습니다. 누구에게나 정답은 없을 것입니다.
읽기: 지도 학습의 유형
베이지안 대 빈도론자 - 사전 확률 사용의 관점에서
다른 예를 살펴보겠습니다.
우리는 위의 예를 한 단계 더 발전시킬 것입니다. 나는 동전을 여러 번 던질 것입니다. 14번이라고 가정해 봅시다. 지난 14번의 동전 던지기 결과를 기록했습니다. 이제 15회째, 나는 다시 동전을 던진다. 이제 " 이 던진 동전이 앞면이 나올 확률은 얼마입니까? "라는 질문을 받습니다 .

베이지안
베이지안인 경우 사용할 용어는 사전 으로 알려진 용어 입니다. 조건부 확률에 대한 Bayes의 공식을 살펴보겠습니다.
여기서 A와 B는 일부 이벤트이고 P(A | B)는 주어진 이벤트 B가 발생한 이벤트 A의 확률로 정의됩니다.
이제 P(A)라는 용어는 데이터가 고려되기 전에 이벤트 A가 참일 확률로 정의되는 사전 정의로 정의됩니다.
예를 들어 베이지안으로서 당신은 사전이라는 용어를 사용할 것입니다. 즉, 당신은 동전 던지기의 과거 결과를 기반으로 결정을 내릴 것입니다.
14번의 동전 던지기 중 9번이나 헤즈업을 했다고 가정해 봅시다. 당신은 "글쎄, 나는 머리를 잡을 가능성이 더 높다"고 말할 수 있습니다. 당신이 그렇게 말할 뿐만 아니라 당신의 계산도 당신의 주장을 뒷받침할 것입니다. 따라서 '이전' 결과로 인해 귀하의 결정이 변경되었습니다. 결정을 내릴 수 있는 능력은 선택된 전임자에 대한 믿음의 정도에 달려 있습니다. 사전 확률 할당은 베이지안 결과의 핵심 요소 중 하나였습니다.
반드시 읽어야 할 것: 기계 학습의 회귀 모델 유형
빈도주의자
당신이 빈도주의자라면 베이지안의 말에 완전히 동의하지 않을 것입니다. 사전은 종종 추측된 값이므로 사전에 관심이 없습니다. 오히려 귀하의 아이디어는 최대 가능성 추정치를 기반으로 합니다. 당신이 할 일은 모집단에서 표본 데이터를 수집하는 것입니다. 이제 데이터의 평균과 거의 동일한 평균값을 추정합니다. 이 값은 불확실한 매개변수의 최대 가능성 지점(추정)입니다.
이제 빈도주의자들은 표본 평균이 모집단 평균과 같을 것이라고 가정할 수 있습니다. 이는 대부분의 경우 틀릴 수 있고 실제로 틀릴 수 있습니다. 그래서 그들은 p-값 및 신뢰 구간과 같은 용어를 도입했습니다.
P-값은 귀무 가설이 참일 때 관찰된 결과나 극단적인 결과를 찾을 확률을 측정하는 간단한 방법입니다. p-값이 유의 수준 0.05 미만이면 귀무 가설을 기각합니다. 이제 p-값과 신뢰 구간은 이에 대한 별도의 기사를 할애할 만큼 충분히 중요합니다.
이제 첫 번째 단계로 모집단에서 표본을 수집합니다. 절차를 여러 번 반복합니다. 이제 실제 평균은 특정 확률이 있는 선택한 신뢰 구간 내에 있어야 합니다. 이것이 내 동전 던지기 질문에 대한 결과를 얻기 위해 해야 하는 일입니다.

당신은 프리퀀시리스트가 너무 복잡하다고 생각할 수 있습니다. 글쎄, 그들은 어떤 의미에서입니다. 다양한 조건에도 불구하고 누구라도 받아들일 수 있는 완벽한 보편적인 답을 찾는 경향이 있습니다. 그리고 그렇게 함으로써, 빈도주의자들은 초보자들이 이해할 수 없는 심각한 계산과 복잡성을 수반합니다.
결론
베이지안 vs. 빈도주의 - 어느 쪽인가?
베이지안 대 빈도주의 논쟁은 계속될 것입니다. 그러나 사용 가능한 리소스를 기반으로 접근 방식을 사용하는 것은 사용자에게 달려 있습니다. 두 접근 방식 모두 엄청난 수의 응용 프로그램이 있습니다. 위대한 수학자 라플라스는 베이지안 추론을 사용하여 토성의 질량을 계산했는데, 이는 빈도주의적 방법으로 훨씬 더 어려웠을 수 있습니다.
반면에 빈도주의적 사고방식은 최근 연구자들이 특히 베이지안 추론으로는 할 수 없었던 의학 분야의 문제를 효율적으로 해결하는 데 도움이 되었습니다.
기계 학습에 대해 자세히 알아보려면 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하세요. 이 PG 디플로마는 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT- B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.