Table Of ContentDIALEKT-Projekt
Statistik interaktiv!
Springer-Verlag Berlin Heidelberg GmbH
D IALEKT -Proj ekt
Statistik interaktiv!
Deskriptive Statistik
2. Auflage
, Springer
DIALEKT-Projekt
Freie Universität BerIin
Ihnestraße 24
14195 Berlin, Deutschland
http://dialekt.cedis.fu-berJin.de
Die Deutsche Bibliothek· CIP·Einheitsaufnahme
Statistik interaktiv! : deskriptive Statistik; DIALEKT·Projekt. . 2. Aufl.-Berlin; Heidelberg; New York;
Barcelona; Hongkong; London; Mailand; Paris; Thkio: Springer. 2002
ISBN 978-3-540-43062-9 ISBN 978-3-642-55998-3 (eBook)
DOI 10.1007/978-3-642-55998-3
Mathematics Subject Classification (2000): 62-01
Additional material to this book can be downloaded from http://extras.springer.com
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte. insbesondere die der
Übersetzung. des Nachdrucks. des Vortrags. der Entnahme von Abbildungen und Tabellen. der Funk
sendung. der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in
Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Ver
vielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der
gesetzlichen Bestimmungen des Urheberrechts gesetzes der Bundesrepublik Deutschland vom 9. Sep
tember 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwi
derhandlungen unterliegenden Strafbestimmungendes Urheberrechtsgesetzes.
Der Springer-Verlag ist nicht Urheber der Daten und Programme. Weder der Springer-Verlag noch die
Autoren übernehmen Haftung für die CD-ROM und das Buch. einschließlich ihrer Qualität.Handels
oder Anwendungseignung. In keinem Fall übernehmen der Springer-Verlag oder die Autoren Haftung
für direkte. indirekte. zufällige oder Folgeschäden. die sich aus der Nutzung der CD-ROM oder des
Buches ergeben.
http://www.springer.de
e Springer-Verlag Berlin Heidelberg 2000.2002
Die Wiedergabe von Gebrauchsnamen. Handelsnamen. Warenbezeichnungen usw. in diesem Werk be
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme. daß solche Namen im Sinne der
Warenzeichen-und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jeder
mann benutzt werden dürften.
Einbandgestaltung: design & production GmbH. Heidelberg
Satz: Reproduktionsfertige Vorlage der Autoren
Gedruckt auf säurefreiem Papier SPIN 10860541 40/3142ck-5 4 32 1 0
Statistik interaktiv! ist ein Forschungsergebnis aus dern DIALEKT-Projekt.
DIALEKT: Digitale Interaktive Lektionen
DIALEKT ist ein Forschungsvorhaben am Center fur Digitale Systerne
(CeDiS) der Freien Universitat Berlin und beschafiigt sich schwerpunktrnaBig mit
der Entwicklung von netzbasierten rnultirnedialen Lehr- und Lerneinheiten fur den
Hochschulbereich.
DIALEKT wird gefOrdert vorn Verein zur Forderung eines Deutschen
Forschungsnetzes e.V. (DFN-Verein) aus Mitteln des Bundesrninisteriurns fur
Bildung und Forschung (brnb+t).
Konzeption, Design und Entwicklung:
Dr. Nicolas Apostolopoulos
Dipl.-Inf. JOrg Caurnanns
Dipl.-Kfr. Cornelia Fungk
Dipl.-Kfrn. Albert Geukes
Autoren und Wissenschaftliche Begleitung:
Univ.-Prof. Dr. Herbert Biining, Freie Universitat Berlin
Univ.-Prof. Dr. Peter Naeve, Universitat Bielefeld
Dipl.-Stat. Stephanie Roll
Univ.-Prof. Dr. Rainer Schlittgen, Universitat Hamburg
Univ.-Prof. Dr. Peter-Theodor Wilrich, Freie Universitat Berlin
Programmierung und Medienproduktion:
Christian Bizer
Todor Daskalov
Raul Gonzalez
Julia Hartwich
Sebastian Milller
Bettina Sankowski
Andreas Vornehrn
Philipp Weiland
und viele andere ...
Vorwort
Urn auf empirischer Grundlage neue Einsichten und Erkenntnisse zu gewinnen
oder Entscheidungen vorzubereiten, sammeln wir Daten, bereiten sie auf und
analysieren sie - und setzen dabei statistische Methoden ein. In den Wirtschafts
und Sozialwissenschaften geh6rt das Fach Statistik daher zur Grundausbildung.
Studierende, die mit der statistischen Grundausbildung beginnen, werden zu
nachst nur eine vage Vorstellung von den Problemen, Theorien und Methoden der
Statistik haben. Als ,,Nichtstatistiker" haben sie vermutlich nur in zweifacher
Hinsicht mit der Statistik Kontakt. Zum einen durch Statistiken, mit denen wir in
fast allen Bereichen laufend konfrontiert werden: In Tabellen und Graphiken wer
den die Arbeitslosenzahlen der letzten Jahre miteinander verglichen, die Anzahl
der Intemet-Anschliisse, die Bev61kerungsentwicklung, die Klimaveranderung
und vieles andere mehr wird statistisch erfaBt. Die erstellten Statistiken dienen
hier als Informationsmittel.
Andererseits kommen die Studierenden mit der Statistik in Beriihrung, wenn
sie, wie z. B. bei der Immatrikulation an einer Universitat, einen Fragebogen aus
fullen miissen oder bei einer Meinungsumfrage von einem Interviewer befragt
werden. Hier sind sie Informationstrager, die Informationen fur eine Statistik
liefem sollen.
Das Fach Statistik ist fur viele Studierende eine nahezu uniiberwindliche Hiir
de. Mit der Lemsoftware ,,statistik interaktiv!" (Teil I: Deskriptive Statistik) ha
ben wir einen Weg eingeschlagen, der das Erlemen statistischer Methoden ange
nehmer und effektiver macht. Statistik interaktiv! will den Studierenden motivie
ren, indem eine Briicke geschlagen wird von unseren Erfahrungen als Informati
onskonsumenten und Informationstrager zum Arbeitsfeld des Informationsbe
schaffers, der statistische Methoden anwendet. Dazu dient eine Videogeschichte
iiber ein Alltagsproblem (LlirmbeIastigung), die den Lehrstoff einrahmt und stati
stisch aufarbeitet. Der Stoff der deskriptiven Statistik wird mit Hilfe von Anima
tionen veranschaulicht, so daB der Zugang zu den abstrakten Inhalten vereinfacht
wird.
Inhaltlich geht es nach der Klarung einiger Grundbegriffe urn die Beschreibung
und urn MaBzahlen univariater und multivariater Datensatze. Der Lemstoff wird
durch graphische Darstellungen und Simulation en verstandlich gemacht und ist
zum Selbststudium geeignet, kann aber auch sehr gut als Erganzung einer traditio
nellen Lehrveranstaltung genutzt werden.
Mit dem Statistiklabor stellt Statistik interaktiv! eine Umgebung zur Verfu
gung, in der Aufgaben ge16st werden k6nnen. Daten und Aufgaben k6nnen frei
eingegeben oder aus anderen Datenquellen (z. B. aus dem Internet) iibemommen
VIII Vorwort
werden. 1m Statistiklabor konnen Aufgabenlosungen mit den erforderlichen stati
stischen Auswertungen sowie Graphiken erstellt, mit Muster16sungen verglichen
und per Internet (zur Korrektur) versandt werden.
Das Statistiklabor prasentiert sich mit einer einfach zu erlernenden grafischen
Benutzeroberflache und unterstlitzt die Anwender bei der Zerlegung einer statisti
schen Aufgabe in Teilkomponenten, die einzeln ge16st werden konnen und - mit
einander verbunden - die Gesamtlosung des Problems liefem. So lemt der Studie
rende, die Methoden der Statistik konstruktiv auf ein Problem anzuwenden und
wird von der Iastigen ,,Rechnerei" befreit (diese Aufgabe libemimmt der Compu
ter). Ein digitaler Assistent und viele Musterlosungen helfen dabei. Flir die Neu
gierigen und die Fortgeschrittenen ermoglicht das Statistiklabor die Programmie
rung von eigenen statistischen Auswertungen unter Verwendung der S-PLUS
Syntax. Zahlreiche statistische Funktionen (in der Syntax von S-PLUS) sind im
Statistiklabor bereits enthalten.
Mit diesem neuen Lemwerkzeug versucht das DIALEKT-Projekt neue Wege in
der Vermittlung von wissenschaftlichen Lehrinhalten zu beschreiten, indem neben
dem Buch, der Vorlesung und der Obung auch Computeranimation und -
simulation sowie das aktive Arbeiten mit dem multimedialen Werkzeug "Compu
ter" als gleichberechtigte Komponenten in den Lemprozess eingebunden werden.
Aber auch dem selbstandigen, zeit- und ortsunabhangigen Lemen, das im Zeitalter
der elektronischen Medien immer mehr an Bedeutung gewinnt, wurde durch die
Lemsoftware und die Einbindung des Internet Rechnung getragen.
Wir m6chten uns insbesondere beim Verein zur Forderung eines Deutschen
Forschungsnetzes e.V. (DFN-Verein) flir die finanzielle Unterstlitzung bedanken.
Dem Arbeitskreis "Verteiltes Lehren & Lemen" im DFN-Verein verdanken wir
viele konstruktiven Anregungen.
Wir hoffen, daB das Arbeiten in dieser multimedialen Umgebung spaS macht
und auf diese Weise den Lemerfolg erhoht. Flir jeden Hinweis, mit den wir Stati
stik interaktiv! verbessem konnen, sind wir dankbar. Statistik interaktiv! Deskrip
tive Statistik ist der Beginn einer Serie multimedialer Lemeinheiten zur Grundaus
bildung Statistik. Weitere sollen in Kiirze folgen.
Berlin, im Mlirz 2000
Das DIALEKT-Projekt Team
Inhaltsverzeichnis
Teill Oeskriptive Statistik ........................................................ 1
1 Grundbegriffe ............................................................................................ 3
1.1 Merkmale ............................................................................................ 3
1.2 Skalenniveaus ...................................................................................... 4
1.3 Skalentransformation ........................................................................... 5
1.4 Totalerhebung versus Stichprobe .......................................................... 5
1.5 Urliste und Datenmatrix ....................................................................... 6
Exkurs: Indexschreibweise ........................................................................... 7
2 Beschreibung univariater Datensatze ....................................................... 9
2.1 Hliufigkeitstabelle ................................................................................ 9
2.1.1 Notation ................................................................................... ll
2.1.2 Stabdiagramm .......................................................................... 11
2.1.3 Kreisdiagramm ......................................................................... 12
2.2 Verteilungsfunktion ........................................................................... 13
2.2.1 Eigenschaften der Verteilungsfunktion ..................................... 15
2.3 Quantile ............................................................................................. 16
2.3.1 Spezielle Quantile .................................................................... 17
2.3.2 Boxplot .................................................................................... 18
2.4 Klassierung ........................................................................................ 19
2.4.1 Histogramm ............................................................................. 20
2.4.2 Berechnung der Quantile aus klassierten Daten ......................... 22
2.5 Zusammenfassung Diagramme ........................................................... 24
Exkurs: Manipulation mit Diagrammen ..................................................... 25
2.6 Empirische und Theoretische MaBzahlen ............................................ 25
3 Ma8zahlen univariater Datensatze ......................................................... 27
3.1 LagemaBe .......................................................................................... 27
3.1.1 Median ..................................................................................... 28
3.1.2 Arithmetisches Mittel ............................................................... 29
3.1.2.1 Schwerpunkteigenschaft des arithmetischen Mittels ................ 30
3.1.2.2 Weitere Eigenschaften des arithmetischen Mittels ................... 30
3.1.2.3 Berechnung des arithmetischen Mittels ................................... 32
3.1.3 Median versus arithmetisches Mittel ......................................... 33
3.1.3.1 Relative Lage (Schiefe) .......................................................... 34
Exkurs: Weitere LagemaBe ................................................................ 35
X Inhaltsverzeichnis
3.2 StreuungsmaBe .................................................................................. 35
3.2.1 Spannweite und Quartilsabstand ............................................... 36
3.2.2 Mittlere quadratische Abweichung ........................................... 37
3.2.3 Varianz .................................................................................... 38
3.2.3.1 Eigenschaften der Varianz ...................................................... 39
3.2.3.2 Berechnung der Varianz ........................................................ .40
3.2.3.3 Standardabweichung .............................................................. 41
Exkurs: Tschebychev-Ungleichung .................................................... 41
Exkurs: Weitere StreuungsmaBe ......................................................... 42
3.3 MaBzahlen und Skalenniveaus .......................................................... .43
3.4 MaBzahlen und extreme Werte .......................................................... .43
Exkurs: Standardisierung ........................................................................... 45
4 Multivariate Datensatze .......................................................................... 47
4.1 Streudiagramm .................................................................................. 47
4.1.1 4-Quadranten-Schema .............................................................. 49
4.2 Kontingenztabelle .............................................................................. 50
4.2.1 Randsummen ........................................................................... 51
4.2.2 Bedingte Haufigkeiten .............................................................. 52
4.2.3 Kontingenztabelle und Klassierung ........................................... 54
4.3 Bivariate MaBzahlen .......................................................................... 55
4.3.1 Kovarianz ................................................................................ 55
4.3.1.1 Interpretation ......................................................................... 56
4.3.2 Korrelationskoeffizient .............................. , .............................. 57
4.3.2.1 Interpretation ......................................................................... 57
4.3.3 Phi-Koeffizient ........................................................................ 59
Exkurs: Rangkorrelationskoeffizient. .................................................. 60
4.3.4 Korrelation: Zusammenfassung ................................................ 61
4.4 Lineare Regression ............................................................................ 62
4.4.1 Berechnung der Regressionsgeraden ......................................... 63
4.4.2 BestimmtheitsmaB .................................................................... 64
4.5 Scheinkorrelation ............................................................................... 66
Teilll Benutzerhandbuch ..................................................... 67
5 Die Anwendung Statistik interaktiv! ....................................................... 69
5.1 Die Navigation in Statistik interaktiv! ................................................ 72
5.1.1 Die N avigationsleiste ............................................................... 72
5.1.2 Die History .............................................................................. 73
5.1.3 Die Mediensteuerung ............................................................... 74
5.2 Der Editor in Statistik interaktiv! ........................................................ 75
5.3 Das Glossar in Statistik interaktiv! ..................................................... 78
5.4 Die Lemkontrolle in Statistik interaktiv! ............................................ 78
5.4.1 Kontrollfragen ......................................................................... 78
5.4.2 Ubungsaufgaben ...................................................................... 79