Table Of ContentMarkus Oestreich | Oliver Romberg
Keine Panik vor Statistik!
Markus Oestreich | Oliver Romberg
Keine Panik
vor Statistik!
Erfolg und Spaß im Horrorfach
nichttechnischer Studiengänge
STUDIUM
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der
Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über
<http://dnb.d-nb.de> abrufbar.
Dr. Markus Oestreich
Geboren 1967 in Herzberg am Harz. 1987 bis 1992 Studium der Technomathematik an der TU Clausthal
mit Abschluss zum Dipl.-Math. 1992 bis 1998 wissenschaftlicher Mitarbeiter am Institut für
Mechanik der Universität Hannover und 1998* Promotion zum Dr.-Ing. Seit 1998 in der Automobil-
industrie tätig, davon ab 2001 in den USA.
*am Freitag, dem 13.
Dr. Oliver Romberg
Geboren 1965 in Bremen (bei Hannover). 1987 bis 1993 Studium des Maschinenbaus mit dem
Schwerpunkt Mechanik an der Universität Hannover. 1993 bis 1998 wissenschaftlicher Mitarbeiter
am Institut für Mechanik der Universität Hannover und 1998 Promotion zum Dr.-Ing. Seit 1998 in
Bremen (bei Hannover) in der Raumfahrt tätig
www.dont-panic-with-mechanics.com
1. Auflage 2009
Alle Rechte vorbehalten
© Vieweg+Teubner|GWV Fachverlage GmbH, Wiesbaden 2009
Lektorat: Ulrich Sandten | Kerstin Hoffmann
Vieweg+Teubner ist Teil der Fachverlagsgruppe Springer Science+Business Media.
www.viewegteubner.de
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede
Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne
Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für
Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung
und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk
berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im
Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher
von jedermann benutzt werden dürften.
Umschlaggestaltung:KünkelLopka Medienentwicklung, Heidelberg
© Cartoons: Oliver Romberg, Bremen
Druck und buchbinderische Verarbeitung: STRAUSS GMBH, Mörlenbach
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier.
Printed in Germany
ISBN 978-3-8348-0282-8
Vorwort (wird sowieso nur von 11.7% der Leser beachtet)
... noch ein Buch mit Grundlagen der Statistik? Warum? Auch wenn es
doch wirklich schon eine Menge Bu¨cher zu diesem Thema gibt, haben wir
uns davon nicht abschrecken lassen! Rein statistisch gesehen hat n¨amlich
auf diesem Planeten nur jeder 1242742ste ein Statistik-Buch ganz und ger-
ne gelesen und weniger als jeder 6-einhalb Milliardste hat ein solches Buch
wirklich verstanden. Und im Versuch, diese Erdstatistik1 zu verbessern, ist
es genau das, was dieses Buch so anders“ als die Anderen“ macht.
” ”
Die Statistik ist als Teilgebiet der beru¨chtigten Mathematik in vielen Stu-
dieng¨angen von A wie Abenteuerp¨adagogik2 bis hin zu Z wie Zytologie
schwer gefu¨rchtet! Gerade in vielen nichttechnischen F¨achern, wie Sozial-
wissenschaften, Politologie oder Psychologie stellt die Statistik als wichtiges
Werkzeug eine unangenehme Hu¨rde fu¨r anderweitig interessierte Studen-
tinnen und Studenten dar. Viele beklagen sich: Wenn ich mich fu¨r solche
”
Sachen interessieren wu¨rde, h¨atte ich doch Mathe (igitt!) studiert“. Aber
der Statistik-Schein muss sein, sonst gibt es keine Magister-Urkunde und
stattdessen winkt der Taxi-Schein (schon fru¨her als sonst). Auch in vielen
technischen und naturwissenschaftlichen Bereichen3, wo die manchmal selt-
sam anmutenden mathematischen Methoden (g¨ahn!) der Statistik Anwen-
dung finden, mu¨ssen sich Studierende mit diesem Thema auseinandersetzen.
Dabei gilt auch fu¨r die Statistik: Man kann diese theoretische und abstrakte
mathematischeDisziplinoftsehrvielanschaulicheralsinvielenLehrbu¨chern
darstellen und das Ganze noch mit Humor und Cartoons wu¨rzen. Stati-
stik kann auch witzig sein! Mit einer bereits nicht nur statistisch bew¨ahrten
unkonventionellen Darstellungsweise analog zu den Bu¨chern Keine Panik
”
vor Mechanik!“ und Keine Panik vor Thermodynamik!“ l¨asst sich fu¨r viele
”
ein einfacher Zugang zur Statistik finden und eine Bru¨cke zu den ernsteren
und theoretischen Lehrbu¨chern fu¨r Experten schlagen. Der Wert anderer
Lehrbu¨cher soll dadurch aber nicht gemindert werden! Ganz im Gegenteil,
denn auch hier gilt: Die Lektu¨re weiterfu¨hrender, wissenschaftlicher Bu¨cher
ist zwingend erforderlich und jedem zu empfehlen, der sich von den soliden
1 Herr Dr. Oestreich weist darauf hin, dass diese Statistik auf dem Planeten Vulcan we-
sentlich positiver ausf¨allt.
2 ja, diesen Studiengang gibt es wirklich!
3 deren Vertreter laut statistischen Umfragen im Taxi meist hinten Platz nehmen
VI
Fundamenten der Statistik und der liebevollen Ausgestaltung der Details
u¨berzeugen m¨ochte. Auch in diesem Panik-Buch haben wir keine Zusam-
menh¨ange selbst entwickelt und das Rad der Statistik nicht neu erfunden.
Wir haben so gesehen den Inhalt des Buches (was die Statistik betrifft)
einfach abgekupfert. Als Vorlage diente dabei eine Kombination der in der
Literaturliste angegebenen Quellen. Neu ist hingegen die Art und Weise der
Darstellung und wir hoffen, sie macht neben einem großen Lerneffekt viel
Spaß!
Und abschließend noch ein Hinweis: Wenn ihr beim Lesen der nachfolgenden
Seiten das ein oder andere Mal den Eindruck habt, dass wir, die beiden Au-
toren, uns bei jeder Gelegenheit gegenseitig einen reinwu¨rgen, dann t¨auscht
das nicht! Es ist aber mit wenigen Ausnahmen meistens nicht so gemeint!4
Clausthal-Zellerfeld, im August 2008 Dr. Markus Oestreich
Bremen, im August 2008 Dr. Oliver Romberg
4 wenngleichHerrDr.Rombergimmernochnichtverstehenkann,wasjemandenzueinem
Studium in der abgelegenen Bergregion von Clausthal-Zellerfeld bewegen kann.
Inhaltsverzeichnis
1 Erstmal locker bleiben: Es f¨angt ganz einfach an! 1
1.1 Subjektive Wahrscheinlichkeit - oder warum ...? . . . . . 4
1.2 Was Ethik mit Statistik zu tun hat - Pinocchio weiß es . 6
1.3 Was im Weiteren noch so kommt . . . . . . . . . . . . . . 7
2 Keine Taten ohne Daten! 10
2.1 Ein bisschen Fachsimpelei zum Einstieg . . . . . . . . . . 11
2.1.1 Grundgesamtheit . . . . . . . . . . . . . . . . . . . . . 11
2.1.2 Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.3 Teil- und Vollerhebung . . . . . . . . . . . . . . . . . . 12
2.1.4 Verzerrung, Bias . . . . . . . . . . . . . . . . . . . . . 13
2.1.5 Einzelobjekte und Merkmale . . . . . . . . . . . . . . 14
2.1.6 Prim¨ar- und Sekund¨arstatistik . . . . . . . . . . . . . 16
2.1.7 Erhebungsarten . . . . . . . . . . . . . . . . . . . . . . 17
2.1.7.1 Beobachtung . . . . . . . . . . . . . . . . . . 18
2.1.7.2 Experiment . . . . . . . . . . . . . . . . . . . 18
2.1.7.3 Befragung . . . . . . . . . . . . . . . . . . . 18
2.2 Ohne Daten geht es nicht . . . . . . . . . . . . . . . . . . 19
2.2.1 J¨ager und Sammler - statistische Datenerhebung . . . 19
2.2.2 Charakterisierung von Datentypen und Merkmalen . . 22
2.2.2.1 Qualitative- und quantitative Merkmale . . . 23
2.2.2.2 Skalenniveau . . . . . . . . . . . . . . . . . . 23
2.2.2.3 Diskrete und stetige Merkmale . . . . . . . . 26
3 Kombiniere, Dr. Watson - Kombinatorik 29
3.1 Das 1x1 der Kombinierer . . . . . . . . . . . . . . . . . . 30
3.2 Ne’ Kiste Bier als Urnenmodell . . . . . . . . . . . . . . . 31
3.3 Monstren, Mumien, Permutationen . . . . . . . . . . . . . 34
3.4 Var, Var, Variationen - immer sch¨on der Reihe nach . . . 36
3.4.1 Variationen ohne Wiederholung . . . . . . . . . . . . . 37
3.4.2 Variationen mit Wiederholung . . . . . . . . . . . . . 37
VIII Inhaltsverzeichnis
3.5 Kombinationen - Was drin ist z¨ahlt, nicht wie! . . . . . . 39
3.5.1 Kombinationen ohne Wiederholung . . . . . . . . . . . 39
3.5.2 Kombinationen mit Wiederholung . . . . . . . . . . . 40
3.6 Auf den Punkt gebracht - Zusammenfassung . . . . . . . 42
I BESCHREIBENDE STATISTIK 43
4 Es war einmal ein Merkmal 45
4.1 Von Stichproben (Aua!) zum Dosenstechen . . . . . . . . 46
4.1.1 Stengel-Blatt-Diagramm . . . . . . . . . . . . . . . . . 48
4.2 H¨aufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . . 49
4.2.1 Klasse, hier gehts um Bildung - Klassenbildung . . . . 52
4.2.2 Vom Histogramm und der empirischen Dichte . . . . . 56
4.3 Summenh¨aufigkeiten . . . . . . . . . . . . . . . . . . . . . 59
4.4 Mann, sieht die gut aus - Grafische Darstellung . . . . . . 63
4.4.1 Bis sich die Balken biegen - Balkendiagramm . . . . . 64
4.4.2 Punkt, Punkt, Komma, Strich - Liniendiagramm . . . 65
4.4.3 Und zum Kaffee: Kreis- oder Tortendiagramm . . . . 66
5 Lage und Streuung 69
5.1 Wie ist die Lage? . . . . . . . . . . . . . . . . . . . . . . . 71
5.1.1 Erst mal den Modus festlegen . . . . . . . . . . . . . . 71
5.1.2 Median und Bl¨odian . . . . . . . . . . . . . . . . . . . 72
5.1.3 Latein fu¨r Anf¨anger: Quantile, Quartile, Dezile, ... . . 75
5.1.3.1 Quantile - Mit der Formel zum Erfolg . . . . 77
5.1.3.2 Quantile - Mit der Grafik zum Erfolg . . . . 78
5.1.4 Minimus Maximus . . . . . . . . . . . . . . . . . . . . 80
5.1.5 Ab durch die Mitte, Mittelwert . . . . . . . . . . . . . 81
5.1.5.1 Arithmetischer Mittelwert . . . . . . . . . . 81
5.1.5.2 Gewichteter Mittelwert . . . . . . . . . . . . 83
5.1.5.3 Geometrischer Mittelwert . . . . . . . . . . . 85
5.1.5.4 Harmonischer Mittelwert . . . . . . . . . . . 87
5.1.6 Na, wo liegen sie denn? Vergleich zur Lage . . . . . . 88
5.1.6.1 Grafisch zusammengefasst: Box-Whisker-Plot 90
5.2 Nun noch eine Prise Streuungen . . . . . . . . . . . . . . 92
5.2.1 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . 94
IX
5.2.2 Quartilsabstand . . . . . . . . . . . . . . . . . . . . . 94
5.2.3 Mittlere Abweichung vom Median . . . . . . . . . . . 95
5.2.4 Varianz und Arroganz . . . . . . . . . . . . . . . . . . 96
5.2.5 Standardabweichung . . . . . . . . . . . . . . . . . . . 97
5.2.6 Variationskoeffizient . . . . . . . . . . . . . . . . . . . 100
5.2.7 Na, wie streuen sie denn? Vergleich zur Streuung . . . 101
6 Es war zweimal ein Merkmal 103
6.1 Von Kontinenztabellen und anderen Problemen . . . . . . 104
6.2 Korrelu, Korreli, Korrelation . . . . . . . . . . . . . . . . 109
6.2.1 Der Korrelationskoeffizient von Bravais-Pearson . . . . 112
6.2.2 Der Rangkorrelationskoeffizient von Spearman . . . . 120
6.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . 124
II DIE SACHE MIT DER
WAHRSCHEINLICHKEIT 128
7 Vom Rechnen mit dem Zufall 130
7.1 Was ist Zufall? . . . . . . . . . . . . . . . . . . . . . . . . 130
7.1.1 Von Laplace und anderen Zockern . . . . . . . . . . . 133
7.1.2 Empirische Wahrscheinlichkeit . . . . . . . . . . . . . 136
7.1.3 Intuition, Erfahrung, subjektive Wahrscheinlichkeit . . 139
7.2 Das BGB der Wahrscheinlichkeit . . . . . . . . . . . . . . 140
7.2.1 Wir machen Komplemente . . . . . . . . . . . . . . . 141
7.2.2 Mengen aller L¨ander vereinigt Euch! . . . . . . . . . . 142
7.2.3 Nicht mehr als Durchschnitt. . . . . . . . . . . . . . . 143
7.2.4 Disjunkt . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.2.5 Differenzmengen . . . . . . . . . . . . . . . . . . . . . 144
7.3 Mit Wahrscheinlichkeit richtig rechnen . . . . . . . . . . . 144
7.3.1 Additionssatz fu¨r beliebige Ereignisse . . . . . . . . . 144
7.3.2 Wahrhaft wahrscheinlich: Bedingte Wahrscheinlichkeit 147
7.3.3 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . 149
7.3.4 Stochastische Unabh¨angigkeit . . . . . . . . . . . . . . 150
7.3.5 Fu¨r Heißdu¨sen: Das Bayes-Theorem . . . . . . . . . . 152
7.4 Rechnen mit Dosen und Tequila . . . . . . . . . . . . . . 153
X Inhaltsverzeichnis
8 Das A und O der Wahrscheinlichkeitsverteilungen 158
8.1 Von Zufallsvariablen und Ihrer Funktion . . . . . . . . . . 158
8.2 Die Wahrheit, aber bitte diskret! . . . . . . . . . . . . . . 162
8.2.1 Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen 162
8.2.2 Der Weg zur diskreten Verteilungsfunktion . . . . . . 165
8.2.3 Erwartungswert und Varianz bei diskreten Daten . . . 166
8.3 Langsam, aber stetig zur Wahrheit . . . . . . . . . . . . . 170
8.3.1 Wenn die Wahrscheinlichkeitsfunktiondichte stetig ist 171
8.3.2 Stetige Verteilungsfunktion . . . . . . . . . . . . . . . 177
8.3.3 Mittelwert und Varianz bei stetigen Daten . . . . . . . 182
8.4 Wie war das noch mit Erwartungswert und Varianz? . . . 184
9 Im Angebot: Spezielle Verteilungen 185
9.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . 186
9.1.1 Es f¨angt mit Bernoulli an . . . . . . . . . . . . . . . . 186
9.1.2 Ein Bernoulli, zwei Bernoulli, drei ... Binomialverteilung187
9.1.3 Hyper, Hyper, Hypergeometrische Verteilung . . . . . 197
9.1.4 Poisson sans boisson est poison - Poisson Verteilung . 200
9.2 Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . 205
9.2.1 Alles gleich, Gleichverteilung . . . . . . . . . . . . . . 205
9.2.2 Normalverteilung: Die Mutter aller Verteilungen . . . 206
9.2.3 Kennt man eine, kennt man alle: Standardnormalver-
teilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
9.2.4 Das Wichtigste auf einer Seite . . . . . . . . . . . . . 218
III BEURTEILENDE STATISTIK 221
10 Parametersch¨atzung, Mr. Spock l¨asst gru¨ßen 223
10.1 Punkt, Punkt, Komma, Intervall . . . . . . . . . . . . . . 223
10.2 Vertrauen ist gut, Konfidenz ist besser . . . . . . . . . . . 228
10.3 Vom Lotto, Sch¨atzen und dem zentralen Grenzwertsatz . 230
10.4 Auf direktem Weg zum Konfidenzintervall . . . . . . . . . 234
10.4.1 Konfidenzintervalle fu¨r Erwartungswerte . . . . . . . . 237
10.4.1.1 Normalverteilte Grundgesamtheit, bekannte
Varianz . . . . . . . . . . . . . . . . . . . . . 237
XI
10.4.1.2 NormalverteilteGrundgesamtheit,unbekann-
te Varianz . . . . . . . . . . . . . . . . . . . 238
10.4.1.3 Keine Ahnung und große Stichproben . . . . 242
10.4.2 Konfidenzintervall fu¨r die Wahrscheinlichkeit . . . . . 243
10.4.3 Konfidenzintervall fu¨r die Varianz . . . . . . . . . . . 244
10.5 Wie breit h¨atten Sie’s denn gern? . . . . . . . . . . . . . 247
10.6 Und gelernt haben wir ... . . . . . . . . . . . . . . . . . . 249
11 Zum Nachtisch: Hypothesentests 250
11.1 Grundlagen fu¨r Einsteiger . . . . . . . . . . . . . . . . . . 250
11.1.1 Oktoberfest in Mu¨nchen: Ooozopft is’“ . . . . . . . . 252
”
11.1.2 Und die Hypothese ist, ... . . . . . . . . . . . . . . . . 254
11.1.3 Dann Testen wir doch mal . . . . . . . . . . . . . . . . 259
11.1.4 Wie im wirklichen Leben: Entscheidung und
m¨ogliche Fehlentscheidung . . . . . . . . . . . . . . . . 263
11.2 Olli’s Kochstudio: Rezepte zum Testen . . . . . . . . . . . 268
11.2.1 Testen von Mittelwerten . . . . . . . . . . . . . . . . . 269
11.2.2 Normalverteilte Grundgesamtheit, bekannte Varianz . 269
11.2.3 Normalverteilte Grundgesamtheit, unbekannte Varianz 271
11.2.4 Irgendwieverteilte Grundgesamtheit, große Stichprobe 272
11.2.5 Testen von Wahrscheinlichkeiten . . . . . . . . . . . . 274
11.2.6 Testen der Varianz . . . . . . . . . . . . . . . . . . . . 275
11.2.7 Jetzt hat’s sich ausgetestet! . . . . . . . . . . . . . . . 276
12 Ende gut, Alles gut! 277
13 Aufgaben mit L¨osungsweg 278
A Tabellen ohne Ende 314
Literaturverzeichnis 322
Stichwortverzeichnis 324