Institut für Informatik und Biomathematik
Statistik ist das richtige Addieren falscher Zahlen

2. Deskriptive Statistik I


Aufgabe der deskriptiven Statistik ist es, die in den Daten der Stichprobe enthaltene Information übersichtlich und unverfälscht in Tabellen, Grafiken und statistischen Maßzahlen zusammenzufassen. Wie das zu geschehen hat, hängt entscheidend vom Typ des betrachteten Merkmals ab.

2.1. Qualitative Merkmale

Bei einer Stichprobe von Patienten, die unter Krampfadern im Unterschenkelbereich litten, wurde eine Salbe zur Linderung der Beschwerden angewandt. Eine halbe Stunde nach Auftragen der Salbe wurden die Patienten befragt, ob eine Besserung eingetreten sei. Es ergab sich folgende Urliste:

Tabelle 2.1: Besserung nach Salbenbehandlung

PatientBesserungPatientBesserung PatientBesserung
1gering9keine Angabe17 gering
2deutlich10gering18 deutlich
3gering11keine19 deutlich
4deutlich12keine Angabe20 gering
5gering13gering21 keine Angabe
6keine14gering22 gering
7deutlich15keine23 gering
8deutlich16keine Angabe 24deutlich

Erstellen Sie eine Tabelle der absoluten und der relativen Häufigkeiten! Wie behandeln Sie die Ausprägung "keine Angabe"?

Tabelle 2.2:

Besserungabsolute Häufigkeitrelative Häufigkeitadjustierte relative Häufigkeit
Gesamt

Formulieren Sie eine Tabellenüberschrift!

Erstellen Sie ein Blockdiagramm der absoluten Häufigkeiten! (Abb. 2.1)

Abb. 2.1:
.


2.2. Quantitativ diskretes Merkmal

Bei den Patienten vom Zelltyp FAB-M3 (Aufgabe 1.1) ergaben sich für das Merkmal "Anzahl der Geschwister" die Häufigkeiten in Tabelle 2.3.

Berechnen Sie die absoluten und die relativen Summenhäufigkeiten!

Bestimmen Sie den empirischen Median

ñ

des Merkmals "Anzahl der Geschwister"

~
X
=

Tabelle 2.3: Häufigkeitsverteilung des Merkmals "Anzahl der Geschwister"

Anzahl der Geschwisterabsolute Häufigkeit relative Häufigkeit
(%)
absolute Summenhäufigkeit relative Summenhäufigkeit
0728.0
1728.0
2728.0
328.0
518.0
914.0
Summe25100.0


2.3. Quantitativ stetiges Merkmal

In Tabelle 2.4 finden Sie für 16 weibliche Patienten einer Klinischen Studie die Angaben zur Körpergröße in cm. Die Daten liegen in Form einer Rangliste vor, d. h. sie sind bereits aufsteigend sortiert.

Tabelle 2.4: Körpergröße von 16 Patientinnen
Lfd. Nr.Größe xx - x( x - x ) emp. Verteilungsfunktion
p16 ( x )
115510.1875103.785 1/16 = 0.0625
21587.187551.660 .
31587.187551.660 3/16 = 0.1875
4159-6.187538.285 4/16 = 0.2500
51623.187510.160 5/16 = 0.3125
6165-0.18750.035 .
7165-0.18750.035 .
8165-0.18750.035 .
9165-0.1875.9/16 = 0.5625
101660.8125. .
111660.8125. 11/16 = 0.6875
121671.8125..
131704.8125..
141704.8125..
1517610.8125..
1617610.8125..
Summe26430.0000540.437 .

Ergänzen Sie Tabelle 2.4 und berechnen Sie die folgenden Maßzahlen

Lagemaße

emp. Minimum x_{min}~=

emp. 0.25-Quantil x_{0.25}~=
(1. Quartil)

emp. Median* x TILDE ~ =
(2. Quartil)

emp. 0.75-Quantil x_{0.75} ~ =
(3. Quartil)

emp. Maximum

x_{max}~ =

Mittelwert

OVERLINE x ~ =

Streuungsmaße

emp. Spannweite (Range)

R~=~x_{max}~-~x_{min}~=

emp. Interquartilabstand

q~=~x_{0.75}~-~x_{0.25}~=

emp. Varianz

s^2~=~{1 OVER {n~-~1}} ` SUM FROM { ` i ` = ` 1} TO n ~ ( ` x_i~-~ OVERLINE x ` )^2~=

emp. Standardabweichung

s~=~ SQRT{s^2} ~ =

*Für den empirischen Median wird alternativ auch die Formel

x Tilde ~ = ~ LEFT \{~MATRIX {x_{LEFT ({n + 1} OVER 2 RIGHT)} & ~~~n~ ungerade # {1 OVER 2} ~ CDOT ~ LEFT(x_{LEFT(n OVER 2 +1 RIGHT)}~ + ~x_{LEFT( {n OVER 2} RIGHT)} RIGHT) & n ~gerade } RIGHT .

verwandt. Berechnen Sie den empirischen Median auch nach dieser Formel.

2.4. Boxplot

Tabelle 2.5 enthält die Statistiken für alle 140 Patienten (59 männliche, 81 weibliche).

Tabelle 2.5: Basisstatistik: Körpergröße


Größe                     Geschlecht                             

                           Männlich              Weiblich        

N                                    57.00                 76.00 

fehlend                               2.00                  5.00 

160.00                148.00 
x_ min                                                           

171.00                160.00 
x_{0.25}                                                         

176.00                165.00 
x Tilde                                                          

180.00                170.00 
x_{0.75}                                                         

190.00                180.00 
x_max                                                            

176.12                164.87 
OVERLINE x                                                       

Spannweite R                         30.00                 32.00 

Interquartilabstand                   9.00                 10.00 
q                                                                

Varianz s2                           49.72                 44.76 

Standardabw. S                        7.05                  6.69 



Erstellen Sie aus den Angaben in Tabelle 2.5 in Abb. 2.2 einen nach Geschlecht getrennten Boxplot für die Körpergröße. Abb. 2.2:

2.5. Quantile

Die Quantile werden in der Medizin häufig angewandt. Abb. 2.3 zeigt ein Diagramm, in das bei den Säuglingsvorsorgeuntersuchungen die Körpergröße in Abhängigkeit vom Alter eingetragen wird.

(a) Interpretieren Sie dieses Diagramm. Welche Quantile werden dargestellt?


Abb. 2.3: Somatogramm