Table Of ContentStatistik ohne Angst vor Formeln
Andreas Quatember
Statistik ohne Angst
vor Formeln
Das Studienbuch für Wirtschafts- und
Sozialwissenschaftler
2., aktualisierte Auflage
ein Imprint von Pearson Education
München (cid:127) Boston (cid:127) San Francisco (cid:127) Harlow, England
Don Mills, Ontario (cid:127) Sydney (cid:127) Mexico City
Madrid (cid:127) Amsterdam
Bibliografische Information Der Deutschen Bibliothek
Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;
detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar.
Die Informationen in diesem Buch werden ohne Rücksicht auf einen
eventuellen Patentschutz veröffentlicht.
Warennamen werden ohne Gewährleistung der freien Verwendbarkeit benutzt.
Bei der Zusammenstellung von Texten und Abbildungen wurde mit größter
Sorgfalt vorgegangen. Trotzdem können Fehler nicht ausgeschlossen werden.
Verlag, Herausgeber und Autoren können für fehlerhafte Angaben
und deren Folgen weder eine juristische Verantwortung noch irgendeine Haftung übernehmen.
Für Verbesserungsvorschläge und Hinweise auf Fehler sind Verlag und Autor dankbar.
Alle Rechte vorbehalten, auch die der fotomechanischen Wiedergabe und der
Speicherung in elektronischen Medien.
Die gewerbliche Nutzung der in diesem Produkt gezeigten Modelle und Arbeiten
ist nicht zulässig.
Fast alle Produktbezeichnungen und weitere Stichworte und sonstige Angaben,
die in diesem Buch verwendet werden, sind als eingetragene Marken geschützt.
Da es nicht möglich ist, in allen Fällen zeitnah zu ermitteln, ob ein Markenschutz besteht,
wird das ® Symbol in diesem Buch nicht verwendet.
Umwelthinweis:
Dieses Produkt wurde auf chlorfrei gebleichtem Papier gedruckt.
Die Einschrumpffolie – zum Schutz vor Verschmutzung – ist aus
umweltverträglichem und recyclingfähigem PE-Material.
10 9 8 7 6 5 4 3 2 1
10 09 08
ISBN 987-3-8273-7306-9
© 2008 Pearson Studium
ein Imprint der Pearson Education Deutschland GmbH,
Martin-Kollar-Straße 10-12, D-81829 München/Germany
Alle Rechte vorbehalten
www.pearson-studium.de
Lektorat: Mailin Bremer, [email protected]
Korrektorat: mediaService, Siegen (www.media-service.tv)
Einbandgestaltung: Thomas Arlt, [email protected]
Herstellung: Elisabeth Prümm, [email protected]
Satz: mediaService, Siegen (www.media-service.tv)
Druck und Verarbeitung: Kösel, Krugzell (www.KoeselBuch.de)
Printed in Germany
Inhaltsverzeichnis
Vorwort 7
Kapitel 1 Beschreibende Statistik 11
1.1 Grundbegriffe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Tabellarische und grafische Darstellung von Häufigkeitsverteilungen. . . . 17
1.2.1 Häufigkeitsverteilungen einzelner Merkmale. . . . . . . . . . . . . . . . . 17
1.2.2 Gemeinsame Häufigkeitsverteilungen zweier Merkmale . . . . . . . . 32
1.3 Kennzahlen statistischer Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.3.1 Kennzahlen der Lage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.3.2 Kennzahlen der Streuung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.3.3 Eine Kennzahl der Konzentration . . . . . . . . . . . . . . . . . . . . . . . . . . 56
1.3.4 Kennzahlen des statistischen Zusammenhanges . . . . . . . . . . . . . . 61
Kapitel 2 Wahrscheinlichkeitsrechnung 81
2.1 Grundbegriffe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
2.2 Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
2.2.1 Die hypergeometrische Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . 92
2.2.2 Die Normalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Kapitel 3 Schließende Statistik 117
3.1 Grundbegriffe und Handlungslogik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.2 Schätzen und Testen einer relativen Häufigkeit. . . . . . . . . . . . . . . . . . . . . . 124
3.2.1 Schätzen einer relativen Häufigkeit. . . . . . . . . . . . . . . . . . . . . . . . . 124
3.2.2 Testen von Hypothesen über eine relative Häufigkeit . . . . . . . . . . 134
3.3 Schätzen und Testen eines Mittelwertes. . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
3.3.1 Schätzen eines Mittelwertes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
3.3.2 Testen von Hypothesen über einen Mittelwert. . . . . . . . . . . . . . . . 146
3.4 Testen von Hypothesen über zwei relative Häufigkeiten. . . . . . . . . . . . . . . 149
3.5 Testen von Hypothesen über zwei Mittelwerte . . . . . . . . . . . . . . . . . . . . . . 154
3.6 Testen einer Hypothese über einen statistischen Zusammenhang
zweier nominaler Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
3.7 Testen von Hypothesen über eine Verteilungsform . . . . . . . . . . . . . . . . . . . 162
3.8 Testen von Hypothesen über einen statistischen Zusammenhang
zweier metrischer Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
3.9 Testen von Hypothesen über Regressionskoeffizienten
(Einfache Regressionsanalyse). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
INHALTSVERZEICHNIS
3.10 Testen von Hypothesen über mehr als zwei Mittelwerte
(Einfache Varianzanalyse) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
3.11 Probleme in der Anwendung statistischer Tests. . . . . . . . . . . . . . . . . . . . . . 185
Anhang 189
Tabelle A (Standardnormalverteilung) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
Tabelle B (Chiquadratverteilung) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Literaturverzeichnis 193
Register 195
6
Vorwort
Wenn Sie heute Abend eine beliebige Nachrichtensendung im Fernsehen verfolgen,
dann bekommen Sie einen ungefähren Eindruck davon, welch bedeutende Rolle der
Statistik bei der Informationsvermittlung in unserer Wissensgesellschaft zukommt. Im
politischen Teil werden die neuesten Ergebnisse von Umfragen zur Parteienpräferenz
der Bevölkerung berichtet, die Budgetdefizite der EU-Staaten miteinander verglichen
und die Zuwachsraten der amerikanischen Rüstungsausgaben kommentiert. Im Wirt-
schaftsblock werden die prozentuellen Veränderungen der wichtigsten internationa-
len Aktienindizes präsentiert und das prognostizierte Wirtschaftswachstum des lau-
fenden Jahres korrigiert. Schließlich finden sich im Sportteil der Berichterstattung je
nach Jahreszeit die Ergebnisse der letzten Runde der Fußball-Champions-League oder
die aktuellen Resultate von Skiweltcuprennen und die Zwischenstände im Gesamt-
weltcup in Tabellenform. Ähnliches erleben Sie, wenn Sie irgendeine Tageszeitung
oder ein (fast) beliebiges Magazin durchblättern. Welchem Medium Sie Ihren Blick
auch zuwenden – Statistiken und nochmals Statistiken!
In völligem Kontrast zu dieser offenkundigen Bedeutung der Statistik bei der Informa-
tionsvermittlung ist das Image des Faches denkbar schlecht. Man hört: „Mit Statistik
kann man alles beweisen!“, spöttelt: „Statistik ist die höchste Steigerungsform der
Lüge!“ und zitiert: „Ich misstraue jeder Statistik, die ich nicht selbst gefälscht habe!“.
Dieses schlechte Image beruht meines Erachtens zu einem Großteil auf dem funda-
mentalen Irrtum, die Qualität der Anwendungen der statistischen Methoden mit der
Qualität der Methoden selbst zu verwechseln. Man verfährt dabei so, wie wenn
Augenzeugen eines Verkehrsunfalls, den ein Autofahrer verursacht hat, der keinen
Führerschein besitzt und bei Rot in eine geregelte Kreuzung eingefahren ist, der
Ampelregelung die Schuld an dem Unfall zuweisen würden.
Die leichte Verfügbarkeit der statistischen Methoden in den Statistikfunktionen des
Tabellenkalkulationsprogramms Excel oder in eigenen statistischen Programmpaketen
wie SAS, SPSS, der Freeware R und anderen erweitert gerade den Kreis derer, die sich
„führerscheinlos“ auf den „Statistikhighway“ begeben. Das heißt: Immer häufiger werden
Statistiken von „Mehr-oder-Weniger-Laien“ fabriziert, die falsche Methoden verwenden,
die Voraussetzungen für ihre Anwendbarkeit nicht überprüfen und/oder die Ergebnisse
falsch interpretieren. Dieser Umstand darf wohl nur schwerlich den statistischen Metho-
den angelastet werden. Die Korrektheit der Methoden ist im besten naturwissenschaft-
lichen Sinne beweisbar, die der Anwendung jedoch anzuzweifeln.
Eines von unzähligen Beispielen ist eine Studie der „berühmten“ Mayo-Klinik in den
Vereinigten Staaten von Amerika, von der die österreichische „Kronen-Zeitung“ am
28.März 2004 berichtete:
VORWORT
Das wäre natürlich erfreulich, wenn es kein Unsinn wäre. (Eine Erklärung für diesen
Irrtum finden Sie am Ende der Ausführungen über Mittelwerte im Abschnitt 1.3.1 die-
ses Buches; weiteren gesammelten Unsinn gibt es in der Rubrik "Unsinn in den
Medien" auf www.ifas.jku.at).
Deshalb fordere ich Sie auf: Misstrauen Sie nicht den statistischen Methoden, miss-
trauen Sie vielmehr den Anwendern dieser Methoden!
Aus dieser erleichterten Durchführbarkeit und aus der erhöhten Nachfrage nach statis-
tisch belegten Fakten ergibt sich die dringende Notwendigkeit, den Anwendern zumin-
dest ein grundlegendes Verständnis der statistischen Methoden zu vermitteln, damit sie
diese kennen und benutzen lernen. Deswegen ist zum Beispiel im Studienplan sehr vieler
Studienrichtungen zumindest eine Grundausbildung in Statistik vorgesehen. Meine
Erfahrung aus langjähriger Praxis in der Lehre ist, dass sich dieses Verständnis durch ein-
fache Beispiele zur Veranschaulichung der Ideen wesentlich besser fördern lässt als durch
eine Aneinanderreihung von Formeln. Dies folgt unter anderem auch aus der Tatsache,
dass die mathematischen Grundlagen für ein Verständnis eines in Formeln beschriebenen
Vorganges bei vielen der angesprochenen Anwender in Studium oder Berufsleben fehlen.
Die verallgemeinernde und vereinfachende Darstellungsweise von Formeln kann dann
von diesen nicht effizient genutzt werden.
Um hier gleich einem möglichen Missverständnis vorzubeugen, möchte ich betonen,
dass ich eine gewisse Kenntnis der mathematischen Formelsprache auch heute noch für
einen wesentlichen Bestandteil der modernen Allgemeinbildung halte. Diese eigene
Sprache (und Schrift) ist unumgänglich bei der Darstellung mathematischer Ideen. Die
Frage ist jedoch, wie viel davon der Anwender statistischer Methoden benötigt. In mei-
nem Verständnis ist das Ziel der Wissensvermittlung in diesem Bereich nicht, dass der
Anwender seine Daten in Formeln einsetzen kann, weil er das ja auch normalerweise
nicht tut, wenn dies am PC per Knopfdruck oder Mausklick für ihn erledigt wird. Umso
wichtiger aber ist es, dass die Benutzer die für die jeweiligen Fragestellungen geeigneten
Methoden auswählen und die Ergebnisse der vom PC übernommenen Rechenarbeit
richtig interpretieren können.
Das ist das Ziel der statistischen Grundausbildung für alle Anwender und der Aus-
gangspunkt für dieses Buch: Es soll das Verständnis fördern, gerade weil die erklärende
Beschreibung vor die formale Darstellung gesetzt wird. Dadurch lässt sich auch eine
anschließende Lektüre „anspruchsvollerer“, weil formelbasierter Literatur erleichtern.
8
Vorwort
Wenn dieses Buch nicht auf Formeln verzichten kann und will, dann gerade deshalb,
um aus dem Verständnis der Methode heraus zu zeigen, dass die Formeln nur zur Ver-
allgemeinerung von Überlegungen dienen, die jeder Mensch nachvollziehen kann. Auf
diese Weise entsteht ein statistisches Grundverständnis ohne Angst vor Formeln.
Das Buch ist in drei Kapitel unterteilt. Kapitel 1 beschäftigt sich mit den grundlegen-
den Methoden der beschreibenden, Kapitel 3 mit der Handlungslogik und den wich-
tigsten Methoden der schließenden Statistik. Das zweite Kapitel „Wahrscheinlichkeits-
rechnung“ versteht sich hier ausschließlich als Überleitung von der beschreibenden
zur schließenden Statistik.
Als „Statistik-Programmpaket“ begleitet dieses Buch das Statistik-Modul im Tabellen-
kalkulationsprogramm Excel. Der Grund dafür ist einfach, dass es auf so gut wie jedem
PC oder Laptop verfügbar ist. Hinweise darauf sind im Text bewusst sparsam gesetzt
und beschränken sich auf die Angabe der für die verschiedenen Methoden benötigten
Funktionsnamen. An jeden Abschnitt sind jedoch Übungsaufgaben zum selbstständigen
Lösen angehängt. Ein Teil dieser Übungsaufgaben ist – zur weiteren Förderung des Ver-
ständnisses der Ideen – mit Hilfe eines Taschenrechners zu lösen. Für Übungsaufgaben,
die durch das CWS-Logo gekennzeichnet sind, stehen Excel-Lerndateien zur Verfügung.
In diesen Dateien wird dem Anwender das Lösen der betreffenden Übungsaufgaben mit
Excel Schritt für Schritt erklärt. Die Lehrenden werden dadurch von der Aufgabe ent-
bunden, in ihren Kursen die Verwendung von Excel für statistische Auswertungen
erklären zu müssen. Diese Lerndateien finden sich genauso wie Beschreibungen des
Rechengangs der grundlegenden Übungsbeispiele und die Lösungen der anderen auf der
Companion-Website des Pearson Verlages (Internetadresse: www.pearson-studium.de).
Anlässlich der nun vorliegenden 2. Auflage des Buches möchte ich mich bei allen Kol-
leginnen und Kollegen bedanken, die Rückmeldungen zum Buch verfasst haben. Ihre
Anregungen wurden dann in dem Text verarbeitet, wenn sie die „Seele des Buches“
nicht veränderten. Besonders bedanken möchte ich mich für die so positiven Reaktio-
nen von Seiten der Anwenderinnen und Anwender statistischer Methoden und der Stu-
dierenden. Ihre Rückmeldungen sind mir die wichtigsten, denn für sie habe ich das
Buch verfasst.
Schließlich darf ich mich auch wieder beim gesamten Team des Pearson-Verlags herz-
lich für den Einsatz für dieses Buchprojekt bedanken. Vor allem aber bedanke ich mich
bei allen Menschen, die in meinem privaten und beruflichen Umfeld dafür sorgen, dass
meine Begeisterung für das Leben erhalten bleibt.
Viel Freude beim Lesen dieser erweiterten 2. Auflage des Buches wünscht Ihnen
Andreas Quatember
Internet: www.ifas.jku.at
E-Mail: [email protected]
9