1. Definition der Binomialverteilung
Stellen wir uns vor, dass wir ein Zufallsexperiment haben. Wir werden dieses Zufallsexperiment n mal wiederholen. Wir hoffen nun, dass ein ganz bestimmtes Ereignis eintritt — und zwar nicht beliebig oft, sondern exakt x mal (natürlich sollte x kleiner als n sein, sonst wird das schwierig...). Wir wissen zudem, dass das Ereignis mit einer Wahrscheinlichkeit p eintreten wird und dass sich diese Wahrscheinlichkeit nicht ändern wird, egal wie oft wir das Experiment wiederholen (so wie beim Münzwurf jede Seite immer die gleiche Wahrscheinlichkeit hat, egal wie oft man wirft). Wie hoch ist nun die Wahrscheinlichkeit, dass wir das Ereignis exakt besagte x mal erhalten werden?
Zusammengefasst: Wir haben n Wiederholungen. Das Ereignis tritt mit der Wahrscheinlichkeit p ein (welche sich nicht verändert). Wir wollen wissen, mit welcher Wahrscheinlichkeit es x mal eintreten wird.
Dies ist eine Situation in der die sogenannte Binomialverteilung angewendet werden kann. Ihre Formel lautet:
In dieser Formel ist der sogenannte Binomialkoeffizient (nach dem die Binomialverteilung benannt wurde). Er wird im Artikel zur Kombination (Thema Kombinatorik) genauer beschrieben. Die meisten Taschenrechner bieten eine eigene Taste an, um den Wert des Binomialkoeffizienten zu errechnen. Dies ist häufig nCr. Die Eingabe würde dann lauten: n, nCr, x, = (wobei n und x logischerweise Zahlen sind).
2. Beispiel
Angenommen wir haben eine Katze, die bald Jungtiere austragen wird. Wir schätzen die Zahl der Jungtiere auf voraussichtlich 8. Wir wissen zudem, dass jedes Jungtier mit einer Wahrscheinlichkeit von exakt 50% weiblich ist (und entsprechend umgekehrt mit 50%iger Wahrscheinlichkeit männlich).
Uns interessiert nun: Wie hoch ist die Wahrscheinlichkeit, dass der Wurf exakt 4 weibliche Kätzchen enthalten wird?
Lösung: Die Werte sind n=8 (da voraussichtlich acht Jungtiere), x=4 (da wir auf 4 weibliche Katzen testen) und p=0,5 (da weibliche und männliche Katzen beide eine Wahrscheinlichkeit von 50%) haben. In die Formel eingesetzt lautet das:
Die Wahrscheinlichkeit, dass der Wurf exakt 4 weibliche und 4 männliche Katzen enthalten wird liegt also bei etwa 27,34%.
Berechnen wir zudem noch die Wahrscheinlichkeiten der anderen Verteilungen von männlichen und weiblichen Kätzchen:
Wir können also mit einer Wahrscheinlichkeit von 71,1% davon ausgehen, dass drei bis fünf weibliche Katzen im Wurf sein werden.
Histogramm zu den erhaltenen Wahrscheinlichkeiten
3. Erwartungswert
Der Erwartungswert der Binomialverteilung ist simpel zu berechnen, er lautet schlicht:
(Wenn man zu viel Zeit hat kann man den Erwartungswert natürlich auch über den normalen Weg berechnen und jeden Wert der Zufallsvariable mit der zugehörige Wahrscheinlichkeit multiplizieren.)
Für das vorherige Katzenbeispiel (n=8, p=0,5) ist der Erwartungswert demnach:
Der Erwartungswert liegt also genau in dem Bereich, den wir bereits als Hochpunkt der Verteilung ermittelt haben.
Bei der Gelegenheit können wir prüfen, wie sich der Erwartungswert bei anderen Werten für n und p verändert. Prüfen wir zunächst andere Werte für n (p=0,5):
- Bei n=1: E(X) = 1*0,5 = 0,5
- Bei n=2: E(X) = 2*0,5 = 1
- Bei n=4: E(X) = 4*0,5 = 2
- Bei n=8: E(X) = 8*0,5 = 4
- Bei n=16: E(X) = 16*0,5 = 8
Bei anderem p (n=8):
- Bei p=0,05: E(X) = 8*0,05 = 0,4
- Bei p=0,25: E(X) = 8*0,25 = 2,0
- Bei p=0,45: E(X) = 8*0,45 = 3,6
- Bei p=0,50: E(X) = 8*0,50 = 4,0
- Bei p=0,55: E(X) = 8*0,55 = 4,4
- Bei p=0,75: E(X) = 8*0,75 = 6,0
- Bei p=0,95: E(X) = 8*0,95 = 7,6
Eine Binomialverteilung mit n=8 und p=0,8 hätte z. B. das nachfolgende Aussehen:
Die Werte dieser Binomialverteilung lauten wie folgt:
x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
B(x|8; 0,80) | 0,00000256 | 0,00008192 | 0,00114688 | 0,00917504 | 0,04587520 | 0,14680064 | 0,29360128 | 0,33554432 | 0,16777216 |
4. Varianz und Standardabweichung
Auch die Varianz lässt sich bei der Binomialverteilung vergleichsweise leicht bestimmen. Die Formel lautet
Die Standardabweichung lässt sich entsprechend wieder über bestimmen.
Berechnet man die Varianz zum obigen Katzenbeispiel bei n=8, x=4 und p=0,5, dann ergibt sich folgender Wert:
Verwendet man hingegen eine Wahrscheinlichkeit von p=0,01 dann liegt die Varianz bei
Die Varianz verringert sich also deutlich, wenn p von 0,5 abweicht. Bezogen auf das Beispiel heißt das, dass bei niedrigem p auch nur noch sehr selten weibliche Katzen geboren werden. Entsprechend wird es immer wahrscheinlicher, dass ein Wert von 0 weiblichen Katzen erreicht wird , wodurch es zu immer weniger Schwankungen kommt (je niedriger p ist). Liegt p hingegen nahe 0,5, gibt es mehrere realistische Möglichkeiten neben 4 weiblichen Katzen (z. B. 3 weibliche Katzen oder 5 weibliche). Entsprechend ist die Varianz höher.
Kommentare (1)
Von neu nach altWir bitten um ihr Verständnis.