Die bisherigen Auswertungen beschränkten sich auf die Betrachtung eines Merkmals. Will man die Abhängigkeiten zwischen Merkmalen untersuchen, braucht man Auswertungsmethoden, die mehr als ein Merkmal einbeziehen.
Die Kontingenztafel ist die geeignete tabellarische Darstellung für die Häufigkeitsverteilung zweier qualitativer oder quantitativer diskreter Merkmale. Stetige Merkmale müssen für diese Darstellung klassiert werden.
Tab. 3.1 enthält von 20 Patienten einer klinischen Studie die Daten zu den Merkmalen Therapie, Therapieergebnis, Geschlecht und Alter.
Tabelle 3.1: Therapie, Therapieergebnis, Geschlecht und Alter für 20 Patienten
ld. | Therapie | Therapieergebnis | Geschlecht | Alter |
---|---|---|---|---|
1 | TAD/TAD | PR | WEIBLICH | 19 |
2 | TAD/HAM | ED | MÄNNL. | 55 |
3 | TAD/TAD | NR | WEIBLICH | 48 |
4 | TAD/TAD | CR | WEIBLICH | 49 |
5 | TAD/HAM | PR | MÄNNL. | 32 |
6 | TAD/HAM | CR | WEIBLICH | 22 |
7 | TAD/TAD | CR | WEIBLICH | 43 |
8 | TAD/TAD | CR | MÄNNL. | 44 |
9 | TAD/HAM | CR | WEIBLICH | 24 |
10 | TAD/TAD | CR | WEIBLICH | 36 |
11 | TAD/HAM | ED | MÄNNL. | 38 |
12 | TAD/TAD | CR | MÄNNL. | 55 |
13 | TAD/TAD | CR | WEIBLICH | 28 |
14 | TAD/HAM | CR | MÄNNL. | 48 |
15 | TAD/HAM | NR | WEIBLICH | 35 |
16 | TAD/TAD | CR | WEIBLICH | 43 |
17 | TAD/HAM | CR | WEIBLICH | 37 |
18 | TAD/HAM | CR | WEIBLICH | 49 |
19 | TAD/TAD | CR | WEIBLICH | 36 |
20 | TAD/HAM | ED | WEIBLICH | 29 |
Stellen Sie in Tabelle 3.2 die Kontingenztafel für die beiden qualitativen Merkmale "Therapie" und "Therapieergebnis" auf.
Vergleichen Sie die Ergebnisse in den beiden Therapiearmen. Berechnen Sie hierzu die Zeilenprozente und tragen Sie sie in Tabelle 3.2 ein.
(a) Welche Häufigkeitsverteilung würde man erwarten, wenn beide Therapien gleich gut wären?
Tabelle 3.2: Therapie und Therapieerfolg
Therapie | Ergebnis | Zeilensumme | |||
---|---|---|---|---|---|
CR | PR | NR | ED | ||
TAD/TAD Zeilenprozent | . | . | . | . | . |
TAD/HAM Zeilenprozent | . | . | . | . | . |
Spaltensumme Zeilenprozent | . | . | . | . | . |
Tabelle 3.3 enthält die Daten für die Merkmale "Therapie" und "Therapieerfolg" von allen 140 Patienten.
(b) Wie beurteilen Sie danach die beiden Therapien?
Tabelle 3.3: Therapie und Therapieerfolg bei 140 Patienten einer klinischen Studie
Therapie | Therapieergebnis | Total | |||
---|---|---|---|---|---|
CR | PR | NR | ED | ||
TAD/TAD | 48 65.75 | 5 6.85 |
13 17.81 | 7 9.59 | 73 |
TAD/HAM | 47 70.15 | 3 4.48 |
12 17.91 | 5 7.46 | 67 |
Total | 95 | 8 | 25 | 12 | 120 |
Zeichnen Sie in Abbildung 3.1 die beiden Regressionsgeraden ein.
Die erforderlichen Hilfsrechnungen sind in Tabelle 3.5 bereits ausgeführt.
Interpretieren Sie die beiden empirischen Regressionskoeffizienten b1 und a1 (8) und den empirischen Korrelationskoeffizienten r (14).
Welcher Zusammenhang besteht zwischen a1, b1 und r?
Tabelle 3.4: Diastolischer und systolischer Blutdruck von 15 Patienten
Lfd. Nr. | RRdias | RRsys |
---|---|---|
1 | 80 | 120 |
2 | 70 | 115 |
3 | 80 | 125 |
4 | 70 | 110 |
5 | 70 | 115 |
6 | 80 | 130 |
7 | 85 | 140 |
8 | 75 | 120 |
9 | 75 | 125 |
10 | 90 | 150 |
11 | 80 | 140 |
12 | 70 | 135 |
13 | 95 | 140 |
14 | 75 | 130 |
15 | 90 | 145 |
Abb. 3.1: Punktwolke für die Merkmale "systolischer" und "diastolischer Blutdruck"
Tabelle 3.5: Regressions- und Korrelationsrechnung
RRdias RRsys (1) 1185 (1) 1940 SUM x SUB i SUM y SUB i (2) 79.00 (2) 129.33 OVERLINE x = SUM x OVERLINE y = SUM y SUB i ~/ n SUB i~/n (3) 94525 (3) 252950 SUM {x_i^2} SUM {y_i^2} (4) 93615 (4) 250907 LEFT(~ SUM x_i LEFT(~ SUM y_i ~RIGHT)^2~/n ~RIGHT)^2~/n (5) 910 (5) 2043 S_{xx} ~= ~(3)~ -~ S_{yy}~ = ~ (3)~ -~ (4) (4) (6) 65.00 (6) 145.93 {s_x^2}~=~S_{xx}~/~(n {s_y^2}~=~S_{yy}~/~(n~ ~-~1) -~1) (7) 8.0623 (7) 12.0811 s_x~=~SQRT{s_x^2} s_y~=~SQRT{s_y^2} (8) 1.1703 (8) 0.5212 b_1 ` = ` a_1 ` = ` S_{xy}~/S_{xx} ` = ` S_{xy}/S_{yy}~=~(13)/( (13)/(5) 5) (9) 36.8773 (9) 11.5905 b_0~=~ OVERLINE a_0~=~ OVERLINE y~-~b_1 CDOT x~-~a_1 CDOT OVERLINE OVERLINE x y (10) y=1.17x+36.88 (10) x=0.52y+11.59 y~=~b_0~+~b_1 CDOT x x~=~a_0~+~a_1 CDOT y (11) 154325 SUM x_i CDOT y_i (12) 153260 LEFT( ` SUM x_i ` RIGHT ) ~CDOT~ LEFT( ` SUM y_i RIGHT) ~/n (13) 1065 S_{xy}~=~(11)~-~(12) (14) 0.781 r~=~S_{xy}~/ SQRT{S_{xx} CDOT S_{yy}}
3.3. Schätzung der Überlebensraten nach KaplanMeier
Abb. 3.2: Kaplan-Meier-Schätzung der Überlebenszeiten
Tabelle 3.6 enthält aus einem Tierversuch 20 Überlebenszeiten in Tagen. Die Zeiten sind bereits aufsteigend sortiert. An den mit ( + ) gekennzeichneten Zeitpunkten endet die Beobachtungszeit, ohne daß das betrachtete Ereignis (hier Tod des Versuchstiers) eingetreten ist. Solche am Stichtag der Auswertung noch anhaltenden Überlebenszeiten nennt man zensiert.
Geben Sie weitere Beispiele für zensierte Überlebenzeiten an.
Berechnen Sie die Überlebensraten nach KaplanMeier, indem Sie Tabelle 3.6 ergänzen.
Zeichnen Sie die resultierende Schätzung als Treppenfunktion in Abbildung 3.2 ein. Markieren Sie die zensierten Überlebenszeiten im Diagramm durch kleine Ticks.
Geben Sie in der Abbildung auch den Stichprobenumfang und die Anzahl der zensierten Beobachtungen an.
Geben Sie den empirischen Median
x TILDE
der Überlebenszeiten an. Sie erhalten
x TILDE
aus dem Diagramm als x-Koordinate des Schnittpunkts der Treppenfunktion mit der 0.5Horizontalen.
Tabelle 3.6: Rechenschema zum Kaplan-Meier-Schätzer
i Tage im Ereignisse Anteil Überlebender kumulative Risiko Überlebensrate t SUB i n SUB i d SUB i (n SUB i~-~d SUB i) (n_1~-~d_1 ` )~/n_1 n SUB i CDOT DOTSLOW CDOT (n_i~-~d_i ` )~/n_i 0 0 20 0 20/20= 1 1 1 30 20 1 19/20= 0.9500 0.9500 2 40 19 1 18/19= 0.9474 0.9000 3 43 + 18 0 18/18= 1 0.9000 4 50 17 1 16/17= 0.9412 0.8471 5 65 + 16 0 16/16= 1 0.8471 6 70 7 70 15 2 13/15= 0.8667 0.7341 8 85 13 1 12/13= 0.9231 0.6776 9 90 10 120 11 125 + 12 135 + 13 140 + 14 150 15 160 16 175 + 17 220 + 18 225 + 19 235 + 20 250 +
Empirischer Median:
x TILDE
= Tage