Institut für Informatik und Biomathematik
Gott würfelt nicht. Und ich sah, wie sie den Würfel warfen. (A. Einstein)
Operier'n wir mit dem stumpfen oder scharfen? (R. Mey)

4. Wahrscheinlichkeitsrechnung


Grundlage der modernen Wahrscheinlichkeitsrechnung sind die Axiome von Kolmogoroff. Kolmogoroff geht von einem Versuch aus, der im Prinzip unter gleichen Bedingungen beliebig oft wiederholt werden kann, wie z. B. Münzwurf, Würfeln, Lotto.

Unter welchen Voraussetzungen kann ein klinischer Versuch als im Prinzip unter gleichen Bedingungen beliebig oft wiederholbar angesehen werden?

Trotz der gleichen Bedingungen ist das Ergebnis des Versuchs von Wiederholung zu Wiederholung nicht vorhersehbar. Es gibt vielmehr eine ganze Menge möglicher Ergebnisse, die hier im folgenden mit S bezeichnet wird. Die einzelnen Ergebnisse werden mit


                e  ,   e 
                 1      2
bezeichnet, d.h.

            S = ( e ,  e  ... )
                   1     2


4.1. Ergebnis und Ereignis

Geben Sie die Menge der möglichen Ergebnisse an:

Wie könnte man die Menge der möglichen Ergebnisse für den klinischen Versuch aus Aufgabe 1.1 charakterisieren, wenn man nur daran interessiert ist, den Therapieerfolg (CR) in Abhängigkeit von der eingesetzten Therapie (T/T oder T/H) zu untersuchen?

           S =

Teilmengen von S bezeichnet man als Ereignisse. Welche Teilmenge von S entspricht

Vor diesem Hintergrund führte Kolmogoroff den Begriff der Wahrscheinlichkeit eines Ereignisses ein und formulierte die folgenden drei Axiome, die die Grundlage für das Rechnen mit Wahrscheinlichkeiten bilden:

Axiome von Kolmogoroff

Sei

S            =  Menge der möglichen Ergebnisse eines Versuchs,

A, B         =  Ereignisse, d. h. Teilmengen von S,

P ( A ) = Wahrscheinlichkeit von A.

Unter diesen Voraussetzungen gelten die Axiome:
  1. P (A) > 0

  2. P (S) = 1

  3. P (A B) = P (A) + P (B), falls A B = 0
(a) Für welche statistischen Maßzahlen gelten die gleichen Rechenregeln wie für die Wahrscheinlichkeiten?

(b) Erläutern Sie den Unterschied zwischen relativen Häufigkeiten und Wahrscheinlichkeiten.


4.2. Wahrscheinlichkeiten

Das Rechnen mit Wahrscheinlichkeiten läßt sich gut anhand von sogenannten Venn-Diagrammen veranschaulichen. Abbildung 4.1 zeigt das Venn-Diagramm einer Menge S, die aus 10 gleichwahrscheinlichen Elementen besteht, sowie zwei Ereignisse A und B.

Abb. 4.1: Venn-Diagramm

Berechnen Sie unter dieser Voraussetzung:

P (A) =

P (B) =

P (A B) =

P (A B) =

P (A B) =

(a) Sind A und B unabhängig? Ergänzen Sie gegebenenfalls die Zeichnung so, daß A und B unabhängig werden.

4.3. Unabhängigkeit von Ereignissen

Der Begriff der Unabhängigkeit von Ereignissen spielt in den Anwendungen eine wichtige Rolle.

Welche der folgenden Ereignisse halten Sie für unabhängig? Begründen Sie Ihre Meinung!

1. Geschlecht von Kind 1 und Geschlecht von Kind 2 bei zwei Kindern des gleichen Elternpaares.

2. Dauer der Geburt, Art der Narkose.

3. Dauer der Geburt, Alter der Mutter.

4. Dauer der Geburt, Parität der Mutter.

5. Dauer der Geburt, Alter des Vaters.

6. Augenfarbe und Haarfarbe einer Person.

7. Diabetes und Geschlecht.

8. Lebenserwartung und Geschlecht.

9. Studienfach und Geschlecht.

4.4. Bedingte Wahrscheinlichkeiten

Tabelle 4.1: Sensitivität und Spezifität beim klinischen Test


Testergebnis T   Wirklichkeit                               
                      W                                     

                infiziert      nicht                        
                               infiziert                    

positiv                    900          9 900        10 800 

negativ                    100         89 100        89 200 

                         1 000         99 000       100 000 



In einer fiktiven Grundgesamtheit von 100 000 Personen sind 1 000 Personen mit einem bestimmten Virus infiziert. Es gibt einen klinischen Test, mit dem man dies feststellen kann. Dieser Test ist allerdings nicht hundertprozentig sicher. Es werden nur 90 % der tatsächlich infizierten Personen im Test als positiv erkannt (Sensitivität), und genauso sind nur 90 % der nicht infizierten Personen im Test negativ (Spezifität).

Die Verhältnisse sind in Tabelle 4.1 tabellarisch dargestellt.

Sensitivität und Spezifität sind in der Sprache der Wahrscheinlichkeitsrechnung nichts anderes als bedingte Wahrscheinlichkeiten:

Sensitivität:

P ` ( ` T~=~+ ` LINE ~W~=~+ ` )~=~ {900 OVER 1000}~=~0.9

Spezifität:

P ` ( ` T~=~- ` LINE ` W~=~- ` )~=~{89100 OVER 99000}~=~0.9

In der Praxis möchte man umgekehrt auch wissen, wie groß bei gegebener Sensitivität und Spezifität die Wahrscheinlichkeit ist, daß ein im Test positiver Patient tatsächlich infiziert ist, bzw. ein im Test negativer Patient tatsächlich nicht infiziert ist. Diese bedingten Wahrscheinlichkeiten nennt man "positiven" bzw. "negativen" prädiktiven Wert.

Berechnen Sie für den klinischen Test aus Tabelle 4.1

a) den positiven prädiktiven Wert

P ` ( ` W~=~+ ` LINE ` T~=~+ ` )~=

b) den negativen prädiktiven Wert

P ` ( ` W~=~- ` LINE ` T~=~- ` )~=~

Verifizieren Sie das Ergebnis mit Hilfe der Bayesschen Formel!

Wovon hängen positiver und negativer prädiktiver Wert außer von Sensitivität und Spezifität noch ab?

In der Praxis sind die Verhältnisse in der Grundgesamtheit, die hier in Tabelle 4.1 angegeben sind, natürlich nicht bekannt. Man muß versuchen, die fehlenden Angaben aus vorliegenden Daten zu schätzen.

Sensitivität und Spezifität

Von 11 824 Untersuchungen auf HIVAntikörper des Städtischen Gesundheitsamts München waren 529 HIV positiv. Bei 359 wurde der Verdacht auf Infektion bestätigt.

Ergänzen Sie die nachfolgende Tabelle 4.2.

Tabelle 4.2:


Testergebnis   Wirklichkeit                            
T                    W                                 

               positiv       negativ      Gesamt       

positiv                                                

negativ                                                

Gesamt                                                 



Schätzen Sie den positiven prädiktiven Wert dieses HIVTests.

Der Hersteller gibt die Sensitivität des Tests mit 99.9 % an. Wie schätzen Sie hiernach die Spezifität des Tests?

4.5. Gesetz der großen Zahl

Unbekannte Wahrscheinlichkeiten schätzt man durch die relativen Häufigkeiten aus einer zufälligen Stichprobe. Theoretische Grundlage hierfür ist das Gesetz der großen Zahl.

A sei ein Ereignis mit der Wahrscheinlichkeit P(A).

n_A

sei die absolute Häufigkeit mit der A in n unabhängigen Versuchswiederholungen eintritt.

Das Gesetz der großen Zahl besagt:

{n_A OVER n}~ ~P ` ( ` A ` )~~~~~( ` n~ ~ INF ` )

d. h. , die relative Häufigkeit, mit der ein Ereignis A in n unabhängigen Versuchswiederholungen eintritt, strebt mit wachsendem n gegen die Wahrscheinlichkeit des Ereignisses A.

Beispiel: Die relative Häufigkeit, mit der man bei Neugeborenen ein Geburtsgewicht unter 3000 g beobachtet, strebt mit wachsender Anzahl n der ausgewerteten Geburten gegen die Wahrscheinlichkeit dieses Ereignisses.

Bei einem idealen Würfel wird jede der 6 möglichen Zahlen mit gleicher Wahrscheinlichkeit gewürfelt.

(a) Wie gehen Sie vor, wenn Sie überprüfen wollen, ob ein bestimmter gegebener Würfel ein idealer Würfel ist?

(b) Wie gehen Sie vor, wenn Sie wissen wollen, wie groß der Anteil der Bevölkerung mit Blutgruppe 0 ist?