Table Of ContentKeine Panik vor Statistik!
Markus Oestreich • Oliver Romberg
Keine Panik vor Statistik!
Erfolg und Spaß im Horrorfach
nichttechnischer Studiengänge
5., aktualisierte Aufl age
Dr. Markus Oestreich Dr. Oliver Romberg
DeWitt, MI, USA Bremen, Deutschland
ISBN 978-3-658-04604-0 ISBN 978-3-658-04605-7 (eBook)
DOI 10.1007/978-3-658-04605-7
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografi e;
detaillierte bibliografi sche Daten sind im Internet über http://dnb.d-nb.de abrufb ar.
Springer Spektrum
© Springer Fachmedien Wiesbaden 2008, 2009, 2010, 2012, 2014
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht aus-
drücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das
gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfi lmungen und die Ein-
speicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be-
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürft en.
© Cartoons: Oliver Romberg, Bremen
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier
Springer Spektrum ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer
Science+Business Media.
www.springer-spektrum.de
V
Vorwort (wird sowieso nur von 11.7% der Leser beachtet)
... noch ein Buch mit Grundlagen der Statistik? Warum? Auch wenn es
doch wirklich schon eine Menge Bu¨cher zu diesem Thema gibt, haben wir
uns davon nicht abschrecken lassen! Rein statistisch gesehen hat n¨amlich
auf diesem Planeten nur jeder 1242742ste ein Statistik-Buch ganz und ger-
ne gelesen und weniger als jeder 6-einhalb Milliardste hat ein solches Buch
wirklich verstanden. Und im Versuch, diese Erdstatistik1 zu verbessern, ist
es genau das, was dieses Buch so anders“ als die Anderen“ macht.
” ”
Die Statistik ist als Teilgebiet der beru¨chtigten Mathematik in vielen Stu-
dieng¨angen von A wie Abenteuerp¨adagogik2 bis hin zu Z wie Zytologie
schwer gefu¨rchtet! Gerade in vielen nichttechnischen F¨achern wie Sozial-
wissenschaften, Politologie oder Psychologie stellt die Statistik als wichtiges
Werkzeug eine unangenehme Hu¨rde fu¨r anderweitig interessierte Studen-
tinnen und Studenten dar. Viele beklagen sich: Wenn ich mich fu¨r solche
”
Sachen interessieren wu¨rde, h¨atte ich doch Mathe (igitt!) studiert.“ Aber
der Statistik-Schein muss sein, sonst gibt es keine Magister-Urkunde und
stattdessen winkt der Taxi-Schein (schon fru¨her als sonst). Auch in vielen
technischen und naturwissenschaftlichen Bereichen3, wo die manchmal selt-
sam anmutenden mathematischen Methoden (g¨ahn!) der Statistik Anwen-
dung finden, mu¨ssen sich Studierende mit diesem Thema auseinandersetzen.
Dabei gilt auch fu¨r die Statistik: Man kann diese theoretische und abstrakte
mathematischeDisziplinoftsehrvielanschaulicheralsinvielenLehrbu¨chern
darstellen und das Ganze noch mit Humor und Cartoons wu¨rzen. Statis-
tik kann auch witzig sein! Mit einer bereits nicht nur statistisch bew¨ahrten
unkonventionellen Darstellungsweise analog zu den Bu¨chern Keine Panik
”
vor Mechanik!“ und Keine Panik vor Thermodynamik!“ l¨asst sich fu¨r viele
”
ein einfacher Zugang zur Statistik finden und eine Bru¨cke zu den ernsteren
und theoretischen Lehrbu¨chern fu¨r Experten schlagen. Der Wert anderer
Lehrbu¨cher soll dadurch aber nicht gemindert werden! Ganz im Gegenteil,
denn auch hier gilt: Die Lektu¨re weiterfu¨hrender, wissenschaftlicher Bu¨cher
ist zwingend erforderlich und jedem zu empfehlen, der sich von den soliden
1 Herr Dr. Oestreich weist darauf hin, dass diese Statistik auf dem Planeten Vulcan we-
sentlich positiver ausf¨allt.
2 ja, diesen Studiengang gibt es wirklich!
3 deren Vertreter laut statistischen Umfragen im Taxi meist hinten Platz nehmen.
VI Vorwort
Fundamenten der Statistik und der liebevollen Ausgestaltung der Details
u¨berzeugen m¨ochte. Auch in diesem Panik-Buch haben wir keine Zusam-
menh¨ange selbst entwickelt und das Rad der Statistik nicht neu erfunden.
Wir haben so gesehen den Inhalt des Buches (was die Statistik betrifft)
einfach abgekupfert. Als Vorlage diente dabei eine Kombination der in der
Literaturliste angegebenen Quellen. Neu ist hingegen die Art und Weise der
Darstellung und wir hoffen, sie macht neben einem großen Lerneffekt viel
Spaß!
Wenn Ihr u¨brigens beim Lesen der nachfolgenden Seiten das ein oder andere
MaldenEindruckhabt,dasswir,diebeidenAutoren,unsbeijederGelegen-
heit gegenseitig einen reinwu¨rgen, dann t¨auscht das nicht! Es ist aber mit
wenigen Ausnahmen meistens nicht so gemeint!4
Und abschließend noch etwas, u¨ber das wir uns ganz besonders freuen: Ihr
haltet hier nun bereits schon die fu¨nfte Auflage in den H¨anden, in der er-
neut einige der - natu¨rlich aus rein p¨adagogischen Gru¨nden urspru¨nglich ab-
sichtlich hineinpraktizierten - Fehler korrigiert wurden. Danke, Danke, und
nochmals Danke an alle K¨aufer5 dieses Buches, fu¨r das große Interesse und
das zahlreiche positive und nu¨tzliche Feedback!
Clausthal-Zellerfeld, im Januar 2014 Dr. Markus Oestreich
Bremen, im Januar 2014 Dr. Oliver Romberg
www.keine-panik-vor-statistik.de
www.dont-panic-with-mechanics.com
4 wenngleichHerrDr.Rombergimmernochnichtverstehenkann,wasjemandenzueinem
Studium in der abgelegenen Bergregion von Clausthal-Zellerfeld bewegen kann.
5 EsseiandieserStelleausdru¨cklichbetont,dassesdidaktischu¨-ber-hauptnichtsnu¨tzt,
sich das Buch nur auszuleihen! Dies haben Studien in den USA(!) eindeutig bewiesen.
Inhaltsverzeichnis
Inhaltsverzeichnis VII
1 Erst mal locker bleiben: Es f¨angt ganz einfach an! 1
1.1 Subjektive Wahrscheinlichkeit - oder warum ...? . . . . . 4
1.2 Was Ethik mit Statistik zu tun hat - Pinocchio weiß es . 6
1.3 Was im Weiteren noch so kommt . . . . . . . . . . . . . . 7
2 Keine Taten ohne Daten! 10
2.1 Ein bisschen Fachsimpelei zum Einstieg . . . . . . . . . . 11
2.1.1 Grundgesamtheit . . . . . . . . . . . . . . . . . . . . . 11
2.1.2 Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.3 Teil- und Vollerhebung . . . . . . . . . . . . . . . . . . 12
2.1.4 Verzerrung, Bias . . . . . . . . . . . . . . . . . . . . . 13
2.1.5 Einzelobjekte und Merkmale . . . . . . . . . . . . . . 14
2.1.6 Prim¨ar- und Sekund¨arstatistik . . . . . . . . . . . . . 16
2.1.7 Erhebungsarten . . . . . . . . . . . . . . . . . . . . . . 17
2.1.7.1 Beobachtung . . . . . . . . . . . . . . . . . . 18
2.1.7.2 Experiment . . . . . . . . . . . . . . . . . . . 18
2.1.7.3 Befragung . . . . . . . . . . . . . . . . . . . 18
2.2 Ohne Daten geht es nicht . . . . . . . . . . . . . . . . . . 19
2.2.1 J¨ager und Sammler - Statistische Datenerhebung . . . 19
2.2.2 Charakterisierung von Datentypen und Merkmalen . . 22
2.2.2.1 Qualitative- und quantitative Merkmale . . . 23
2.2.2.2 Skalenniveau . . . . . . . . . . . . . . . . . . 23
2.2.2.3 Diskrete und stetige Merkmale . . . . . . . . 26
3 Kombiniere, Dr. Watson - Kombinatorik 29
3.1 Das 1x1 der Kombinierer . . . . . . . . . . . . . . . . . . 30
3.2 Ne’ Kiste Bier als Urnenmodell . . . . . . . . . . . . . . . 31
3.3 Monstren, Mumien, Permutationen . . . . . . . . . . . . . 34
3.4 Var, Var, Variationen - immer sch¨on der Reihe nach . . . 36
3.4.1 Variationen ohne Wiederholung . . . . . . . . . . . . . 37
VIII Inhaltsverzeichnis
3.4.2 Variationen mit Wiederholung . . . . . . . . . . . . . 37
3.5 Kombinationen - Was drin ist z¨ahlt, nicht wie! . . . . . . 39
3.5.1 Kombinationen ohne Wiederholung . . . . . . . . . . . 39
3.5.2 Kombinationen mit Wiederholung . . . . . . . . . . . 40
3.6 Auf den Punkt gebracht - Zusammenfassung . . . . . . . 42
I BESCHREIBENDE STATISTIK 43
4 Es war einmal ein Merkmal 45
4.1 Von Stichproben (Aua!) zum Dosenstechen . . . . . . . . 46
4.1.1 Stengel-Blatt-Diagramm . . . . . . . . . . . . . . . . . 48
4.2 H¨aufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . . 49
4.2.1 Klasse, hier gehts um Bildung - Klassenbildung . . . . 52
4.2.2 Vom Histogramm und der empirischen Dichte . . . . . 56
4.3 Summenh¨aufigkeiten . . . . . . . . . . . . . . . . . . . . . 59
4.4 Mann, sieht die gut aus - Graphische Darstellung . . . . . 63
4.4.1 Bis sich die Balken biegen - Balkendiagramm . . . . . 64
4.4.2 Punkt, Punkt, Komma, Strich - Liniendiagramm . . . 65
4.4.3 Und zum Kaffee: Kreis- oder Tortendiagramm . . . . 66
5 Lage und Streuung 69
5.1 Wie ist die Lage? . . . . . . . . . . . . . . . . . . . . . . . 71
5.1.1 Erst mal den Modus festlegen . . . . . . . . . . . . . . 71
5.1.2 Median und Bl¨odian . . . . . . . . . . . . . . . . . . . 72
5.1.3 Latein fu¨r Anf¨anger: Quantile, Quartile, Dezile, ... . . 75
5.1.3.1 Quantile - Mit der Formel zum Erfolg . . . . 77
5.1.3.2 Quantile - Mit der Graphik zum Erfolg . . . 78
5.1.4 Minimus Maximus . . . . . . . . . . . . . . . . . . . . 80
5.1.5 Ab durch die Mitte, Mittelwert . . . . . . . . . . . . . 81
5.1.5.1 Arithmetischer Mittelwert . . . . . . . . . . 81
5.1.5.2 Gewichteter Mittelwert . . . . . . . . . . . . 83
5.1.5.3 Geometrischer Mittelwert . . . . . . . . . . . 85
5.1.5.4 Harmonischer Mittelwert . . . . . . . . . . . 87
5.1.6 Na, wo liegen sie denn? Vergleich zur Lage . . . . . . 88
5.1.6.1 Graphischzusammengefasst:Box-Whisker-Plot 90
5.2 Nun noch eine Prise Streuungen . . . . . . . . . . . . . . 92
Inhaltsverzeichnis IX
5.2.1 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . 94
5.2.2 Quartilsabstand . . . . . . . . . . . . . . . . . . . . . 94
5.2.3 Mittlere Abweichung vom Median . . . . . . . . . . . 95
5.2.4 Varianz und Arroganz . . . . . . . . . . . . . . . . . . 96
5.2.5 Standardabweichung . . . . . . . . . . . . . . . . . . . 97
5.2.6 Variationskoeffizient . . . . . . . . . . . . . . . . . . . 100
5.2.7 Na, wie streuen sie denn? Vergleich zur Streuung . . . 101
6 Es war zweimal ein Merkmal 103
6.1 Von Kontinenztabellen und anderen Problemen . . . . . . 104
6.2 Korrelu, Korreli, Korrelation . . . . . . . . . . . . . . . . 109
6.2.1 Der Korrelationskoeffizient von Bravais-Pearson . . . . 112
6.2.2 Der Rangkorrelationskoeffizient von Spearman . . . . 120
6.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . 124
II DIE SACHE MIT DER
WAHRSCHEINLICHKEIT 128
7 Vom Rechnen mit dem Zufall 130
7.1 Was ist Zufall? . . . . . . . . . . . . . . . . . . . . . . . . 130
7.1.1 Von Laplace und anderen Zockern . . . . . . . . . . . 133
7.1.2 Empirische Wahrscheinlichkeit . . . . . . . . . . . . . 136
7.1.3 Intuition, Erfahrung, subjektive Wahrscheinlichkeit . . 139
7.2 Das BGB der Wahrscheinlichkeit . . . . . . . . . . . . . . 140
7.2.1 Wir machen Komplemente . . . . . . . . . . . . . . . 141
7.2.2 Mengen aller L¨ander vereinigt Euch! . . . . . . . . . . 142
7.2.3 Nicht mehr als Durchschnitt . . . . . . . . . . . . . . . 143
7.2.4 Disjunkt . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.2.5 Differenzmengen . . . . . . . . . . . . . . . . . . . . . 144
7.3 Mit Wahrscheinlichkeit richtig rechnen . . . . . . . . . . . 144
7.3.1 Additionssatz fu¨r beliebige Ereignisse . . . . . . . . . 144
7.3.2 Wahrhaft wahrscheinlich: Bedingte Wahrscheinlichkeit 147
7.3.3 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . 149
7.3.4 Stochastische Unabh¨angigkeit . . . . . . . . . . . . . . 150
7.3.5 Fu¨r Heißdu¨sen: Das Bayes-Theorem . . . . . . . . . . 152
7.4 Rechnen mit Dosen und Tequila . . . . . . . . . . . . . . 153
X Inhaltsverzeichnis
8 Das A und O der Wahrscheinlichkeitsverteilungen 158
8.1 Von Zufallsvariablen und ihrer Funktion . . . . . . . . . . 158
8.2 Die Wahrheit, aber bitte diskret! . . . . . . . . . . . . . . 162
8.2.1 Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen 162
8.2.2 Der Weg zur diskreten Verteilungsfunktion . . . . . . 165
8.2.3 Erwartungswert und Varianz bei diskreten Daten . . . 166
8.3 Langsam, aber stetig zur Wahrheit . . . . . . . . . . . . . 170
8.3.1 Wenn die Wahrscheinlichkeitsfunktiondichte stetig ist 171
8.3.2 Stetige Verteilungsfunktion . . . . . . . . . . . . . . . 177
8.3.3 Mittelwert und Varianz bei stetigen Daten . . . . . . . 182
8.4 Wie war das noch mit Erwartungswert und Varianz? . . . 184
9 Im Angebot: Spezielle Verteilungen 185
9.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . 186
9.1.1 Es f¨angt mit Bernoulli an . . . . . . . . . . . . . . . . 186
9.1.2 Ein Bernoulli, zwei Bernoulli, drei ... Binomialverteilung187
9.1.3 Hyper, Hyper, Hypergeometrische Verteilung . . . . . 197
9.1.4 Poisson sans boisson est poison - Poisson Verteilung . 200
9.2 Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . 205
9.2.1 Alles gleich, Gleichverteilung . . . . . . . . . . . . . . 205
9.2.2 Normalverteilung: Die Mutter aller Verteilungen . . . 206
9.2.3 Kennt man eine, kennt man alle: Standardnormalver-
teilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
9.3 Das Wichtigste auf einer Seite . . . . . . . . . . . . . . . 218
III BEURTEILENDE STATISTIK 221
10 Parametersch¨atzung, Mr. Spock l¨asst gru¨ßen 223
10.1 Punkt, Punkt, Komma, Intervall . . . . . . . . . . . . . . 223
10.2 Vertrauen ist gut, Konfidenz ist besser . . . . . . . . . . . 228
10.3 Vom Lotto, Sch¨atzen und dem zentralen Grenzwertsatz . 230
10.4 Auf direktem Weg zum Konfidenzintervall . . . . . . . . . 234
10.4.1 Konfidenzintervalle fu¨r Erwartungswerte . . . . . . . . 237
10.4.1.1 Normalverteilte Grundgesamtheit, bekannte
Varianz . . . . . . . . . . . . . . . . . . . . . 237