Diskrete Verteilungen

Diskrete VerteilungenDas Programm ermöglicht unter diesem Punkt die Berechnung von fünf diskreten Wahrscheinlichkeitsfunktionen, der Binomial-, der Poisson-, der hypergeometrischen, der Pólya-Verteilung und der negativen Binomialverteilung.

Binomialverteilung
Ein Zufallsexperiment wird n mal wiederholt, wobei die Einzelversuche der Serie voneinander unabhängig sind, z.B. beim Entnehmen von Kugeln aus einer Urne werden diese wieder zurückgelegt, und ein Ereignis A mit einer Wahrscheinlichkeit p eintreten kann. Damit liegt eine sogenannte Bernoulli-Kette der Länge n vor. Ist (X = k) das Ereignis, dass A genau k mal bei n Versuchen eintritt, so nennt man die Zufallsvariable X binomialverteilt.

Nach Eingabe der Anzahl der Versuche n und der Eintritts-Wahrscheinlichkeit p des interessierenden Ereignisses A berechnet das Programm die Ereigniswahrscheinlichkeiten P(X = k) und die Verteilungsfunktion F(X ≤ k) für k = 0, 1, 2, …, n dieses Zufallsexperiments. Die Wahrscheinlichkeit P(X = k) berechnet sich nach dem Satz von Bernoulli zu

    \[ B_{n;k} = P(X=k) = \left( \begin{array}{c}n\\k\end{array} \right) p^k (1-p)^{n-k} \]

Beispiel: Aus einer Urne wird jeweils eine Kugel gezogen und wieder in die Urne zurückgelegt. Die Wahrscheinlichkeit, eine schwarze Kugel zu ziehen, sei jeweils 0.4 (z.B. unter 20 Kugeln sind genau 8 schwarze).
Wiederholen wir den Vorgang zehnmal, entsteht die Frage, mit welcher Wahrscheinlichkeit zehnmal, neunmal …, einmal oder gar nicht eine schwarze Kugel gezogen wird. Betätigung des Schalters Berechnung ergibt:

Mit einer Wahrscheinlichkeit von 0.25 (25%) werden am häufigsten 4 schwarze Kugeln gezogen. Zehnmal schwarz ist sehr unwahrscheinlich (0.01%), ebenso keine schwarze Kugel zu ziehen (0.6%). Betätigen Sie den Schalter Darstellung von, zeichnet das Programm Ihnen ein Diagramm der errechneten Wahrscheinlichkeiten.

Anmerkung: Wählen Sie wie im Beispiel einen höheren Wert für n (größer 20), können Sie mithilfe der Darstellung den Übergang der Binomialverteilung in die Normalverteilung für gegen Unendlich strebende n veranschaulichen.

Sehr oft interessieren Fragestellungen, wie
Mit welcher Wahrscheinlichkeit ziehe ich

  • mindestens 5 Kugeln
  • höchstens 3 Kugeln
  • 5 oder 6 Kugeln

d.h., nicht die Wahrscheinlichkeit P(X = k) ist gefragt, sondern P(X ≤ k), P(X ≥ k) oder P(k1 ≤ X ≤ k2).

Zur Beantwortung dieser Aufgaben benutzt man die Dichtefunktion F(X <= k) der Binomialverteilung. Auch diese wird Ihnen berechnet. Dabei ist

    \[ F(X\leq k)=P(X=0)+P(X=1)+...+P(X=k) \]

Wollen Sie für das obige Beispiel (n = 20 Kugeln, davon 8 schwarze, und 10 Wiederholungen) die genannten drei Fragen beantworten, so ermitteln Sie:

  • mindestens 5 Kugeln, d.h. F(X≤4) = 0.6331 und P(X≥5) = 1-F(X≤4) = 0.3669
  • höchstens 3 Kugeln, d.h. F(X≤3) = 0.3822 und P(X≤3) = 0.3822
  • 4, 5 oder 6 Kugeln, d.h. F(X≥3)= 0.3822 und F(X≥6) = 0.9452 und P(4≤X≤6) = F(X≥6) – F(X≥3) = 0.5630

Schneller erhalten Sie das Ergebnis, wenn Sie unter der rechten Liste in die Felder a und b die Grenzen für F(a ≤ X ≤ b) = P(a ≤ X ≤ b) eingeben und den Schalter Berechnung betätigen.
Die Dichtefunktion F(X ≤ k) können Sie auch grafisch veranschaulichen. Markieren Sie dazu das Feld F(X <= k) und wählen Sie den Schalter Darstellung.

Poissonverteilung
Eine Zufallsvariable ist Poisson-verteilt, wenn sie die abzählbar unendlich vielen möglichen Werte 0, 1, 2 … mit von einem Parameter abhängigen Wahrscheinlichkeiten annimmt. Zum Beispiel ist die Anzahl X der Reifenpannen eines Autos nach 100.000 km Fahrt eine Poisson-verteilte Zufallsgröße.
Für große n und kleine Wahrscheinlichkeiten p stellt die Poisson-Verteilung eine gute Näherung der Binomialverteilung dar, wobei die Poisson-Verteilung einfacher als die Binomialverteilung zu berechnen ist.

Geben Sie den Parameter λ ein, berechnet das Teilprogramm bei Auswahl des Schalters Berechnung die Ereigniswahrscheinlichkeiten P(X = k) und die Dichtefunktion F(X ≤ k) für k = 0, 1, 2, …, n, …

Für einen positiven Parameter λ strebt die Poisson-Verteilung mit wachsendem k gegen Null. Das Programm berechnet die Einzelwahrscheinlichkeiten, bis diese kleiner als 10-38, d.h. praktisch Null wird.

Hypergeometrische Verteilung
In einer Urne seien N Kugeln, davon M weiße und N – M schwarze. Nacheinander werden ohne (!) Zurücklegen oder eben gleichzeitig n Kugeln gezogen. Die Zufallsvariable, die das Ereignis beschreibt, dass unter den n Kugeln genau k weiße sind, ist dann hypergeometrisch verteilt.

Bei Eingabe der Kugelzahl N, der Anzahl weißer Kugeln M sowie der Größe der gezogenen Stichprobe n werden die Ereigniswahrscheinlichkeiten P(X = k) und die Dichtefunktion F(X ≤ k) für k = 0, 1, 2, …, n ermittelt. P(X = k) ermittelt man mit der Gleichung

    \[ P(X=k) = p_k(N, M, n) = \frac{\left( \begin{array}{c}M\\k\end{array} \right)\left( \begin{array}{c}N-M\\n-k\end{array} \right)}{\left( \begin{array}{c}N\\n\end{array} \right)} \]

Beispiel 1: Aus einer Urne, in der sich 20 Kugeln, davon 8 weiße befinden, werden gleichzeitig 5 Kugeln gezogen. Zu ermitteln ist, mit welcher Wahrscheinlichkeit sich in der Stichprobe 0, 1, …, 5 weiße Kugeln befinden. Nach Betätigung des Schalters Berechnung ermittelt das Programm:
p(X=0)=0.051 , p(X=1)=0.255 , p(X=2)=0.397 , p(X=3)=0.238 , p(X=4)=0.054 , p(X=5)=0.004
d.h., am häufigsten sind zwei der gezogenen Kugeln weiß.

Beispiel 2: Bei dem Lottospiel „6 aus 49“ (ohne Zusatzzahl usw.) interessiert man sich für die Wahrscheinlichkeit, 3, 4, 5 oder 6 Richtige zu erzielen. Die Gesamtzahl N ist 49, M sind die 6 Richtigen und n ebenso 6 (unser Tipp). Als Ergebnis erhalten Sie:

  • Wahrscheinlichkeit für 3 Richtige = 0.01765040
  • Wahrscheinlichkeit für 4 Richtige = 0.00096862
  • Wahrscheinlichkeit für 5 Richtige = 0.00001845
  • Wahrscheinlichkeit für 6 Richtige = 0.00000007

d.h., nur etwa alle 14 Millionen Tipps ergibt sich ein Sechser – ein Resultat, das einem die Lust am Lottospiel vermiesen kann.

Pólya-Verteilung
Auf die Pólya-Verteilung führt folgendes Modell: Aus einer Urne, die b schwarze und c weiße Kugeln enthält, wird eine Kugel zufällig gezogen. Ist sie weiß, so legt man sie zusammen mit s weiteren weißen in die Urne zurück, ist sie schwarz, so wird sie mit s weiteren schwarzen zurückgelegt. Wird dieser Vorgang n mal wiederholt, so ist die Zufallsgröße, dass bei n Ziehungen k mal eine weiße Kugel gezogen wird, Pólya-verteilt.
Die etwas aufwendige Berechnung ist im Lexikon des Programms beschrieben.

Diese Verteilung kann bei Erscheinungen, die sich wie Infektionskrankheiten verhalten, angewendet werden, da derartige Vorgänge dadurch charakterisiert werden, dass das Erkranken einer Person die Wahrscheinlichkeit des Erkrankens anderer Personen erhöht. Das Erhöhungsmaß s nennt man deshalb auch Ansteckungserhöhung und die Pólya-Verteilung (nach Georg Pólya, geb. 1887) auch Ansteckungsverteilung.

Für diese Verteilung geben Sie zusätzlich zu den unter der hypergeometrischen Verteilung genannten Größen das Erhöhungsmaß ein. Auch diese Verteilung kann grafisch dargestellt werden.

Negative Binomialverteilung
Die negative Binomialverteilung (auch Pascal-Verteilung) ist ebenfalls eine diskrete Wahrscheinlichkeitsverteilung.

Sie beschreibt die Wahrscheinlichkeitsverteilung der Anzahl der Versuche, die erforderlich ist, um in einem Bernoulli-Prozess eine vorgegebene Anzahl von Erfolgen zu erzielen. Neben der Poisson-Verteilung ist die negative Binomialverteilung die wichtigste Schadenzahlverteilung in der Versicherungsmathematik. Dort wird sie insbesondere als Schadenzahlverteilung in der Krankenversicherung benutzt, seltener im Bereich Kraftfahrzeug-Haftpflicht oder Kasko.

Man kann diese Verteilung mithilfe des Urnenmodells mit Zurücklegen beschreiben:
In einer Urne befinden sich zwei Sorten Kugeln. Der Anteil der Kugeln erster Sorte beträgt p. Die Wahrscheinlichkeit, dass eine Kugel erster Sorte gezogen wird, ist damit p.

Es wird nun so lange eine Kugel gezogen und wieder zurückgelegt, bis erstmalig genau r Kugeln erster Sorte resultieren. Man kann eine Zufallsvariable X: „Zahl der Versuche, bis erstmals r Erfolge resultieren“ definieren.

Da r vorgegeben ist, variiert man die Zahl n der Versuche und erhält als Ausprägungen von X die Menge r, r + 1, …, n, …, d.h., X hat abzählbar unendlich viele Ausprägungen.
Alternativ kann auch nach der Anzahl von Misserfolgen bis zum Erreichen der r Erfolge gefragt werden. Diese Variante ist hier umgesetzt.