Table Of ContentHeinz Linhart
Walter Zucchini
Statistik Eins
4. Auflage
Springer Basel AG
Prof. Dr.Heinz Linhart, Studium der Mathematik und Physik, 1958 Promo
tion zum Dr. stat. mathem. (Geneve). Von 1954 bis 1964 Research Officer
(zuletzt Chief Res. Off.) in Instituten des South African Council for Scien
tific and Industrial Research. Von 1964 bis 1975 Professor of Statistics
und Head of the Department of Math. Statistics in der University of Natal,
Durban. Seit 1975 Professor rur Statistik und Ökonometrie an der Univer
sität Göttingen.
Prof. Dr. Walter Zucchini, Studium der Mathematik und Mathematischen
Statistik (B. Sc. 1969, M.Sc. 1974, Ph.D. 1978), University of Natal, Dur
ban. Von 1971-1976 Lecturer, Dept. of Math. Statistics, University of
Natal, Durban. Von 1976-1980 Wissenschaftlicher Assistent (Statistik und
Ökonometrie) an der Universität Göttingen. 1980 Senior Lecturer, Nat.
Univ. of Lesotho. Von 1980-1984 Senior Research Officer, University of
Stellenbosch. Seit 1984 Professor of Statistics, University of Cape Town.
CIP-Titelaufnahme der Deutschen Bibliothek
Linhart, Heinz:
Statistik eins / Heinz Linhart ; Walter Zucchini. - 4. Auf!.
ISBN 978-3-7643-2586-2 ISBN 978-3-0348-5101-5 (eBook)
DOI 10.1007/978-3-0348-5101-5
NE: Zucchini, Walter:
Das Werk ist urheberrechtlieh geschützt. Die dadurch begründeten Rechte,
insbesondere der Übersetzung, des Nachdruckes, der Entnahme von Abbildun
gen, der Funksendung, der Wiedergabe auf photomechanischem oder
ähnlichem Wege und der Speicherung in Datenverarbeitungsanlagen bleiben,
auch bei nur auszugs weiser Verwertung, vorbehalten. Die Vergütungs
ansprüche gemäß § 54, Abs. 2 UrhG werden durch die >>verwertungsgesell
schaft Wort«, München, wahrgenommen.
© 1991 Springer Basel AG
Ursprünglich erschienen bei Birkhäuser Verlag Basel 1991
ISBN 978-3-7643-2586-2
Vorwort
Es wird hier versucht, die grundlegenden statistischen Ideen
darzustellen. Dabei werden stochastische Modelle und Probleme
ihrer Anpassung besonders eingehend behandelt. Es werden Ge
danken erläutert, die zu einer grundsätzlichen Einstellung fUhren,
mit der man statistische Analysen angehen sollte.
In die elementare Wahrscheinlichkeitstheorie wird nur eine
heuristische Einführung gegeben und nur so weit, wie das für die
besprochenen Anwendungen notwendig ist. Die Empirie und die
Theorie werden dabei in den ersten Abschnitten sorgfältig ausein
andergehalten, später aber nicht mehr.
Es wird kein Unterschied zwischen ZufaUsvariablen und
ihren Werten gemacht, die beide mit kleinen Buchstaben bezeich
net werden. Weil als Ergebnisraum nur Mengen reeller Zahlen ver
wendet werden, ist es sowieso nicht nötig, Zufallsvariablen als
Funktionen anzusehen.
Es wurde darauf verzichtet, präzisierende Bemerkungen zu
machen, die letztlich nur für die Abwehr von Kritik durch Kolle
gen gedacht sind und mathematisch weniger gut bewanderte Leser
nur verwirren.
Die Schrägschrift wurde im Text zur Kennzeichnung der
Betonung verwendet. Wir hoffen, damit das Lesen zu erleichtern.
Wir danken allen Kollegen, die das Manuskript gelesen ha
ben, für die vielen Bemerkungen, die zu Verbesserungen geführt
haben, und besonders Herrn Prof. Dr. A. Linder für seine Ermuti
gung. Aktiv geholfen haben unsere Mitarbeiter Dr. F. Böker, J.
Hattenbach, E. Rosenplänter und Dr. M. L. Thompson. Es wurde
der Rechner der Gesellschaft für wissenschaftliche Datenverarbei
tung mbH, Göttingen, verwendet.
Göttingen, September 1979 und Februar 1980
H. Linhart W. Zucchini
5
Inhaltsverzeichnis
1. Stochastische Modelle 9
2. Population und Stichproben 15
3. Das Histogramm 17
4. Anteile und Wahrscheinlichkeiten 21
5. Zufallsvariablen . . . . . . . 25
6. Wichtige Verteilungen 32
7. Wahrscheinlichkeiten von Ereignissen 38
8. Mittelwert, Varianz und andere Kennzahlen 43
9. Erwartungen ............. 47
10. Das Aufstellen stochastischer Modelle durch
theoretische Überlegungen ...... 51
11. Das Anpassen von Modellen an Daten 56
12. Stochastische Modelle als Approximation 63
13. Das Schätzen von Parametern 71
14. Konfidenzintervalle ......... 79
15. Das Überprüfen von Modellen . . . . . 82
16. Aussagen über Hypothesen und Irrtumswahrschein-
1ichkeiten ......... 91
17. Der klassische Signifikanztest 96
18. Paare diskreter Zufallsvariablen 102
19. Paare stetiger Zufallsvariablen 110
20. Voraussagen bei Abhängigkeit 114
21. Unabhängigkeit 117
Weiterführende Literatur 120
Übungen ...... 121
Tabellen . . . . . . . 142
Literatur zu den Beispielen 146
7
1. Stochastische Modelle
Viele quantitativerfaßbare Phänomene kann man nicht
deterministisch beschreiben. Wahrscheinl!r:hkeiten spielen eine
wesentliche Rolle. Stochastische Modelle (Wahrscheinlichkeits
modelle ) werden gebraucht.
Beispiel 1.1. Bagasse ist ein Abfallprodukt bei der Herstel
lung von Zucker aus Zuckerrohr, sie kann als Heizmaterial ver
wendet werden. Der WassergehaIt von Bagasse variiert, und mit
ihm variiert der Kalorienwert, also ihr Wert als Heizmaterial.
C. E. Don (1975) bestimmte den Wassergehalt w [in Prozen
ten] und den dazugehörenden Kalorienwert k [in kJ/g] von 34
Bagasse Proben. Seine Resultate sind hier numerisch und gra
phisch gegeben.
Wj kj Wj kj
1 6,3 18,2 18 29,9 12,9
2 6,3 18,0 19 30,4 13,4
3 7,3 18,2 20 32,3 14,1
4 11,3 17,4 21 32,3 12,7
5 12,2 16,9 22 35,0 12,4
6 12,2 16,9 23 35,6 12,3
7 13,7 16,6 24 41,0 11,7
8 15,5 16,4 25 41,7 11,5
9 15,5 16,2 26 42,3 11,4
10 15,5 15,5 27 55,0 8,6
11 15,8 16,7 28 57,2 8,5
12 16,5 16,2 29 57,6 8,5
13 19,0 15,7 30 57,8 8,5
14 20,3 15,7 31 58,7 8,0
15 23,2 15,0 32 60,3 7,8
16 23,7 15,5 33 61,0 7,5
17 27,0 14,2 34 61,7 7,4
Es ist klar, daß der Zusammenhang von kund w nicht deter
ministisch ist. Zum Beispiel sind hier 3 Proben mit Wassergehalt
15,5, die sich in ihren Kalorienwerten unterscheiden. Es ist also
nicht so, daß der Wassergehalt den Kalorienwert genau bestimmt.
9
Zu einem festen Wert von w gehört nicht ein einziger Wert von k,
eine zufällige Variation tritt auf. Der Kalorienwert hängt, abgese
hen vom Wassergehalt, noch von vielen anderen Faktoren ab,
etwa den Einzelheiten der chemischen Struktur des verwendeten
Zuckerrohrs. Einige dieser Faktoren könnte man zur Not messen
und mit in Betracht ziehen, andere entziehen sich jeder quantita
tiven Erfassung. Darüber hinaus gibt es auch noch Meßfehler. In
der Regel versucht man nicht, das alles auseinanderzuklauben,
und spricht von zufälliger Variation.
k
20 Kalorienwert [kJ/g)
19
++
18 +
17 •
• •+
••
16 '.
15
11
13 ..
12 •. .
11
10
.
..
•
•'.
w
7+o -----1,0 -----20- r----~-----10, -----50 -~---6-0 ~----7~0
Wassergehalt [%)
Wassergehalt und Kalorienwert von Bagasse.
•
Beispiel 1.2: Will man Brücken oder Staudämme bauen, so
muß man etwas über das Auftreten extremer Belastungen, das
heißt abnormal hoher Wasserstände, wissen. Man baut ja so, daß
Belastungen bis zu einer bestimmten Grenze ausgehalten werden
10
können. Es ist unmittelbar einleuchtend, daß hohe Belastungen,
also hohe Wasserstände, zufällig auftreten.
Um zu untersuchen, wie häufig extreme Belastungen zu er
warten sind, wurden Aufzeichnungen über die Durchflußrate des
Vaal bei Standerton, Transvaal, während der letzten 50 Jahre
durchgesehen (Hiemstra, Zucchini und Pegram 1976). Ein typi
sches Durchflußdiagramm ist hier abgebildet. Die Durchflußrate
ist in Kubikfuß je Sekunde [cf/sec] angegeben.
Durchflußrate [cf/sec]
Größen
Typisches Durchflußdiagramm des Vaal bei Standerton.
Ein Durchfluß mit Rate über 10000 [cf/sec] wurde als Flut
angesehen. Ihre Größe wurde durch die Gipfelhöhe gemessen. Im
Lauf des untersuchten Zeitabschnitts traten 90 Fluten auf. Die
zugehörigen Größen (maximale Durchflußrate minus 10 000) sind
hier zusammengefaßt.
Flutgröße [cf/sec] Häufigkeit
0- 700 6
701- 1950 14
1951- 3200 8
3201- 5700 13
5701- 8200 9
8201-10700 7
10701-13 200 5
13 201-15 700 4
15701-18200 3
18 201-20700 3
20 701-23 200 3
23201-46500 12
46501-82300 3
Summe 90
11
Man kann diese Beobachtungen graphisch darstellen, indem
man über jedes betrachtete Intervall ein Rechteck zeichnet, des
sen Fläche proportional zur zugehörigen Häufigkeit ist.
I,'.
100 (Häufigkeit/I ntervallängel
1.00
~8.
..
~
0 .... 0
~··ty~+.-~b~kh!;1;;:;.;~~~~:::;::::;::~:l;;;;;;;=;;=;;=
o 20 '10 &Q Ba 100 120 ''10 160 I so 200 220 2'10 2'0 280 JOD 320 3'10 360 lao 'IOD 'tao .... 0 "la "IBO 500 520
Flutgröße!100
Die Größen von 90 beobachteten Fluten des Vaal bei Standerton.
Die glatte eingezeichnete Kurve repräsentiert das stochasti
sche Modell, das hier verwendet wurde. Man kann damit die
Wahrscheinlichkeit berechnen, daß eine Flut eine gewisse Größe
überschreitet.
Wichtig ist natürlich auch, wie oft solche Fluten im Durch
schnitt auftreten. Hier waren es 90/50, also 1,8 Fluten im Jahr.
Aus der Tabelle kann man ablesen, daß 3 von 90 Flutgrö
ßen den Wert 46500 [cf/sec 1ü berschritten haben. Man wird also
erwarten, daß ungefahr I von 30 Fluten diese Größe übertrifft.
Da durchschnittlich 1,8 Fluten im Jahr beobachtet wurden, wird
es durchschnittlich 30 : 1,8, also ungefahr 17 Jahre dauern, bevor
eine solche Flut auftritt. Man nennt diese Größe die Rückkehr
zeit.
Beim Interpretieren einer solchen Aussage muß man vor
sichtig sein: Sie bedeutet nicht, daß eine derartige Flut regelmäßig
alle 17 Jahre auftritt. Die Aussage ist stochastisch. Man kann
nicht sagen, wie oft gewisse Ereignisse eintreten werden. Man
kann nur die Wahrscheinlichkeiten angeben, mit denen sie auftre
ten.
12