Bayesianer vs. Frequentisten: Welchen sollten Sie für Ihr nächstes Problem wählen?
Veröffentlicht: 2020-12-23Wenn Sie sich schon einmal mit Statistik beschäftigt haben, haben Sie wahrscheinlich über die große Debatte gelesen – Bayesianisch vs. Frequentisten. Jedes davon ist lediglich ein Ansatz zur Lösung eines statistischen Problems im Zusammenhang mit Wahrscheinlichkeiten. Nun machen bayessche Statistiker Frequentisten für ihre Methoden verantwortlich und umgekehrt. Diese Debatte nimmt kein Ende. Beide haben ihre Vor- und Nachteile.
In diesem Artikel werden wir uns beide Ansätze ansehen und herausfinden, welcher der beiden für Ihr nächstes statistisches Problem gut für Sie ist.
Inhaltsverzeichnis
Bayesianer vs. Frequentisten – in Begriffen der Wahrscheinlichkeitsdefinition
Definition 1: Wahrscheinlichkeit als Grad des Glaubens von Frank Ramsey (Bayesscher Ansatz)
Die Wahrscheinlichkeit eines Ereignisses wird durch den subjektiven Grad der Überzeugung gemessen. Sie wird auch als „logische Wahrscheinlichkeit“ bezeichnet. Das bedeutet, dass Ihre Definition von Wahrscheinlichkeit von der jemand anderen abweichen kann, wenn er/sie mehr Beweise hat als Sie. Das ist völlig in Ordnung und der andere kann denken, was er will.
Definition 2: Wahrscheinlichkeit als Langzeithäufigkeit von Ronald Fisher (Frequentisten-Ansatz)
Die Wahrscheinlichkeit eines Ereignisses ist gleich der langfristigen Häufigkeit dieses Ereignisses, wenn es sich mehrmals wiederholt. Es gibt eine universelle Antwort und im Gegensatz zu Definition 1 können die Meinungen zur Wahrscheinlichkeit eines Ereignisses nicht von Person zu Person unterschiedlich sein, selbst wenn sie mehr/weniger Beweise haben.

Beispiel:
Angenommen, ich habe eine unvoreingenommene normale Münze mit Köpfen auf der einen und Schwänzen auf der anderen Seite. Jetzt werfe ich die Münze. Ich habe die Ergebnisse. Aber Sie als Zuschauer wissen nicht, ob die Münze Heads-up oder Tails-up ist.
Also möchte ich, dass Sie antworten: „ Wie groß ist die Wahrscheinlichkeit, dass die Münze, die ich geworfen habe, Heads-up ist ?“
Basierend auf den beiden unterschiedlichen Definitionen von Wahrscheinlichkeit wird es zwei verschiedene Arten von Antworten geben .
Bayesianer
Bayesianer werden antworten, dass es eine 50%ige Chance gibt, dass die Münze Heads-Up ist. Sie als Bayesianer werden mir sagen: „ Die Antwort ist für mich zu 50 % Heads-Up. Aber ja, Sie kennen das Ergebnis des Werfens. Sie haben also eine 100%ige Wahrscheinlichkeit, dass die Münze entweder Kopf oder Zahl ist. Aber wissen Sie was, es ist mir egal. Denn gemäß den mir zur Verfügung stehenden Ressourcen lautet die Antwort für mich 50 %. ”
Frequentisten
Frequentisten werden die Frage beantworten „ Es besteht entweder eine 100% Chance oder eine 0% Chance, dass die Münze Heads-Up ist. Da die Münze gelandet ist, macht es keinen Sinn, diesem festen und konstanten Wert eine Wahrscheinlichkeit zuzuordnen. Das Ergebnis des Werfens ist endgültig und es gibt keine Änderung daran. Es wird keine Variation der Antwort unter irgendjemandem geben.
Lesen Sie: Arten von überwachtem Lernen
Bayesianisch vs. Frequentisten – in Bezug auf die Verwendung früherer Wahrscheinlichkeiten
Schauen wir uns ein weiteres Beispiel an.
Wir werden das obige Beispiel noch einen Schritt weiterführen. Ich werde die Münze viele Male werfen, angenommen 14 Mal. Sie haben die Ergebnisse der letzten 14 Münzwürfe notiert. Jetzt zum 15. Mal werfe ich die Münze erneut. Nun werden Sie gefragt: „ Wie groß ist die Wahrscheinlichkeit, dass diese geworfene Münze Kopf ist? “.

Bayesianer
Wenn Sie Bayesianisch sind, werden Sie einen Begriff verwenden, der als prior bekannt ist . Schauen wir uns die Formel von Bayes für die bedingte Wahrscheinlichkeit an:
wobei A und B einige Ereignisse sind und P(A | B) als Wahrscheinlichkeit von Ereignis A definiert ist, wenn Ereignis B eingetreten ist.
Nun wird der Term P(A) als prior definiert, was als die Wahrscheinlichkeit definiert ist, dass Ereignis A wahr ist, bevor die Daten berücksichtigt werden.
Um auf das Beispiel zurückzukommen, werden Sie als Bayesianer den Begriff prior verwenden, dh Sie werden eine Entscheidung treffen, die auf den Ergebnissen früherer Münzwürfe basiert.
Angenommen, bei 14 Münzwürfen habe ich 9 Mal Heads-up. Sie könnten sagen: „Nun, ich habe höhere Chancen, einen Kopf zu bekommen“. Das sagen nicht nur Sie, auch Ihre Rechnung wird Ihre Argumentation stützen. Ihre Entscheidung wurde also aufgrund der „früheren“ Ergebnisse geändert. Die Fähigkeit, Entscheidungen zu treffen, hängt vom Grad des Glaubens an den gewählten Prior ab. Die Zuweisung früherer Wahrscheinlichkeiten war einer der Schlüsselfaktoren in den Ergebnissen von Bayesian.
Muss gelesen werden: Typen von Regressionsmodellen beim maschinellen Lernen
Frequentisten
Wenn Sie ein Frequentist sind, werden Sie mit allem, was die Bayesianer sagen, überhaupt nicht einverstanden sein. Sie haben kein Interesse am Prior, da der Prior oft ein geschätzter Wert ist. Vielmehr basiert Ihre Idee auf der Maximum-Likelihood-Schätzung. Was Sie tun werden, ist, Sie werden Beispieldaten von einer Population sammeln. Schätzen Sie nun den Mittelwert, der weitgehend einheitlich mit dem Mittelwert der Daten ist. Dieser Wert ist der Maximum-Likelihood-Punkt (Schätzung) des unsicheren Parameters.
Nun könnten Frequentisten annehmen, dass der Mittelwert der Stichprobe gleich dem Mittelwert der Grundgesamtheit wäre, was falsch sein könnte und tatsächlich meistens falsch ist. Daher haben sie Begriffe wie p-Werte und Konfidenzintervalle eingeführt.
Der p-Wert ist eine einfache Methode, um die Wahrscheinlichkeit zu messen, beobachtete oder extreme Ergebnisse zu finden, wenn die Nullhypothese wahr ist. Sie verwerfen die Nullhypothese, wenn der p-Wert unter dem Signifikanzniveau von 0,05 liegt. Nun sind p-Werte und Konfidenzintervalle wichtig genug, um ihnen einen eigenen Artikel zu widmen.
Also sammelst du jetzt in einem ersten Schritt die Stichprobe aus der Bevölkerung. Sie wiederholen den Vorgang viele Male. Nun sollte Ihr wahrer Mittelwert mit einer bestimmten Wahrscheinlichkeit innerhalb der von Ihnen gewählten Konfidenzintervalle liegen. Dies ist, was Sie tun müssen, um das Ergebnis für meine Münzwurffrage zu erhalten.

Sie denken vielleicht, dass Frequentisten viel zu komplex sind. Nun, sie sind es in gewissem Sinne. Sie neigen dazu, die perfekte universelle Antwort zu finden, die trotz verschiedener Bedingungen von allen akzeptiert werden kann. Und dabei beinhalten Frequentisten ernsthafte Berechnungen und Komplexität, die Anfänger möglicherweise nicht verstehen.
Fazit
Bayesianisch vs. Frequentist – was ist der Weg?
Die Debatte Bayesian vs. Frequentist wird weitergehen. Aber es liegt an Ihnen, basierend auf den verfügbaren Ressourcen, welchen Ansatz Sie verwenden. Beide Ansätze haben ihre zahlreichen Anwendungsmöglichkeiten. Der große Mathematiker Laplace berechnete die Masse des Saturn unter Verwendung der Bayes'schen Inferenz, die auf Frequentistische Weise sehr viel schwieriger hätte sein können.
Andererseits hat die Denkweise der Frequentisten neueren Forschern geholfen, Probleme effizient zu lösen, insbesondere auf dem Gebiet der medizinischen Wissenschaft, die mit der Bayes'schen Inferenz nicht hätten gelöst werden können.
Wenn Sie mehr über maschinelles Lernen erfahren möchten, sehen Sie sich das PG-Diplom in maschinellem Lernen und KI von IIIT-B & upGrad an, das für Berufstätige konzipiert ist und mehr als 450 Stunden strenge Schulungen, mehr als 30 Fallstudien und Aufgaben bietet, IIIT- B-Alumni-Status, mehr als 5 praktische, praktische Abschlussprojekte und Jobunterstützung bei Top-Unternehmen.