Table Of ContentW olfgang Stegmiiller
Probleme und Resultate der Wissenschaftstheorie
und Analytischen Philosophie, Band IV
Personelle und Statistische Wahrscheinlichkeit
Studienausgabe, T eil D
,]enseits von Popper und Carnap'
Stiitzungslogik, Likelihood, Bayesianismus
Statistische Daten
Zufall und Stichprobenauswahl
Testtheorie
Schatzungstheorie
Subjektivismus kontra Objektivismus
F iduzial-Wahrscheinlichkeit
Springer-Verlag Berlin· Heidelberg . New York 1973
Professor Dr. WOLFGANG STEGMULLER
Philosophisches Seminar Il
der Universitat Miinchen
Dieser Band enthalt die Einleitung und Teil III der unter dem Titel "Probleme
und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band IV,
PersonelIe und Statistische Wahrscheinlichkeit, Zweiter Halbband: Statistisches
Schlie.Ben - Statistische Begriindung - Statistische Analyse" erschienenen
gebundenen Gesamtausgabe
ISBN 978-3-540-06041-3 ISBN 978-3-642-52178-2 (eBook)
DOI 10.1007/978-3-642-52178-2
Das Werk ist urheberrechtlich geschtitzt. Die dadurch begrtindeten Rechte, insbesondere die der
Obersetzung, des Nachdruckes, der Entnahme von Abbildungen, der Funksendung, der Wiedergabe
auf photomechanischem oder iihnlichem Wege und def Speicherung in Datenverarbeitungsanlagen
bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Bei Vervielfaltigungen fUr gewerbliche
Zwecke ist gemal3 § 54 UrhG eine Vergtitung an den Verlag zu zahlen, deren Rohe mit dem Verlag
zu vereinbaren ist. © by Springer-Verlag Berlin Reidelberg 1973. Library of Congress Catalog Card
Number 73-77476. Rerstellung: Brtihlsche Universitiitsdruckerei Giel3en
Inhaltsverzeichnis
Einleitung: Dberbliek iiber den Inhalt des zweiten Halbbandes . 1
Teil Ill. Die logischen Grundlagen des statistisehen SchlieBens
1. ,Jenseits von POPPER und CARNAP'. . . . . . . . . . . . . . . . . 15
1.a Programm und Abgrenzung vom Projekt einer induktiven Logik. 15
1.b Die relative Hiiufigkeit auf lange Sicht und die Hiiufigkeits
definition der statistisehen Wahrseheinliehkeit . . . . . . . . . 27
Le Der Vorsehlag von BRAITHWAITE, die statistisehe Wahrseheinlieh-
keit als theoretisehen Begriff einzufiihren . . . . . . . . . . . 41
1.d Vorbereitende Betraehtungen zur Testproblematik statistiseher
Hypothesen. . . . . . . . . 48
Le Zusammenfassung und Ausbliek . 57
2. Priiludium: Der intuitive Hintergrund . 60
3. Die Grundaxiome. Statistisehe Unabhiingigkeit 69
3.a Die Kolmogoroff-Axiome. . . . . 69
3.b Unabhiingigkeit im statistisehen Sinn 70
3.e Hypothesen und Oberhypothesen. 74
4. Die komparative Stiitzungslogik . . . 76
4.a Vorbetraehtungen . . . . . . . 76
4.b Einige zusatzliche Zwischenbetrachtungen. 78
4.e Die Axiome der Stiitzungslogik 82
5. Die Likelihood-Regel. . . . . . . 84
5.a Kombinierte statistisehe Aussagen 84
5.b Likelihood und Likelihood-Regel 87
6. Die Leistungsfiihigkeit der Likelihood-Regel 94
6.a Die Einzelfall-Regel und ihre Begriindung. 94
6.b Der statistisehe StiltzungssehluB im diskreten Fall und seine
Reehtfertigung. . . . . . . . . . . . . . . . . . 105
6.e Dbergang zum stetigen Fall. . . . . . . . . . . . 109
6.d Wahrseheinliehkeitsverteilung und Likelihoodfunktion (,Plausibili-
tiitsverteilung') . . . . . . . . . . . . . 113
6.e Denken in Likelihoods und Bayesianismus. . . . . . . . . . . 117
7. Vorliiufiges Postludium: Ergiinzende Betraehtungen zu den statistisehen
Grundbegriffen. . . . . . . . . . . . 128
7.a Der Begriff des statistisehen Datums . . . . . . . . . . . . . 128
IV Inhaltsverzeichnis
7.b Chance und Haufigkeit auf lange Sicht 131
7.c Versuchstypen. . . . . . . . . . . 132
8. Zufall, Grundgesamtheit und Stichprobenauswahl. 133
9. Die Problematik der statistischen Testtheorie, erlautert am Beispiel
zweier konkurrierender Testtheorien. . . . . . . . . . 142
9.a Vorbetrachtungen. Ein warnendes historisches Beispiel ..... 142
9.b Macht und Umfang eines Tests. Die Testtheorie von NEYMAN-
PEARSON . . . . . . . . . . . . . . . . . . . . . . . .. 152
9.c Die Mehrdeutigkeit der Begriffe "Annahme" und "Verwerfung" . 159
9.d Einige kritische Bemerkungen zu den Begriffen Umfang und Macht 160
9.e Die Likelihood-Testtheorie 167
10. Probleme der Schatzungstheorie 176
10.a Vorbemerkungen .... 176
10.b Was ist Schiitzung? Klassifikation von Schatzungen. 177
10.c Einige spezielle Begriffe der statistischen Schiitzungstheorie 178
10.d Die Doppeldeutigkeit von "Schiitzung" und die Mehrdeutigkeit von
"Giite einer Schatzung". . . . . . . . . . . . 191
10.e Theoretische Schiitzungen und Schatzhandlungen. . . . . 194
10J Das Skalendilemma. Zwecke von Schiitzungen. . . . . . 201
10.g Schatzungen im engeren und Schiitzungen im weiteren Sinn 203
10.h Kritisches zu den Optimalitatsmerkmalen auf lange Sicht, zur
Minimax-Theorie und zur Intervallschiitzung . . 205
10.i Ein Prazisierungsversuch des Begriffes der besser gestiitzten
Schatzung. . . . . . . . . . . . . . . . . . . . . . . . . 209
10.j 1st die Schatzungstheorie von SAVAGE das Analogon zur Test-
theorie von NEYMAN-PEARSON? . . . . . . . . . . . . .. 212
11. Kritische Betrachtungen zur Likelihood-Stiitzungs-und -Testtheorie 215
l1.a 1st der Likelihood-Test schlechter als nutzlos? 215
l1.b Das Karten-Paradoxon von KERRIDGE . . 217
l1.c Die logische Struktur des Stiitzungsbegriffs 218
12. Subjektivismus oder Objektivismus? . . . . . 220
12.a Die subjektivistische (personalistische) Kritik: DE FINETTI und
SAVAGE kontra Objektivismus . . . . . . . . . . . . .. 220
12.b Die Propensity-Interpretation der statistischen Wahrscheinlichkeit:
POPPER, GIERE und SUPPES . . . . . . . . . . . . . . . . . 245
13. Versuch einer Skizze der logischen Struktur des Fiduzial-Argumentes
von R. A. FISHER. 258
Bibliographie . . . . 268
Von den gebundenen Ausgaben des Bandes "Probleme und Resultate der Wissen
schaftstheorie und Analytischen Philosophie, Band IV, Personelle und Statisti
sche Wahrscheinlichkeit" sind folgende weiteren Teilbande erschienen:
Studienausgabe Teil A: Aufgaben und Ziele der Wissenschaftstheorie. In
duktion. Das ABC der modernen Wahrscheinlichkeitstheorie und Statistik.
Studienausgabe Teil B: Entscheidungslogik (rationale Entscheidungstheorie).
Studienausgabe Teil C: Carnap 11: Normative Theorie des induktiven Raso
nierens.
Studienausgabe Teil E: Statistische Begrundung. Statistische Analyse. Das Re
prasentationstheorem von de Finetti. Metrisierung qualitativer Wahrscheinlich
keitsfelder.
Einleitung: 'tlberblick iiber den Inhalt
des zweiten Halbbandes
Wer sich heute als Philosoph und Wissenschaftstheoretiker der Proble
matik des sogenannten ,Statistischen SchlieBens' zuwendet, der sollte sich
zu Beginn riicksichtslos eine negative Tatsache einpragen: Es besteht bis
zum heutigen Tag eine ungeheure K/uft zwischen /ogischen und wissenschaftstheore
tischen Ana!Jsen von BegrifJen der Priifung, der Bestatigung und der Bewahrung von
Hypothesen auf der einen Seite, und von Fach/euten im Gebiet der mathematischen
Statistik angestellten Untersuchungen iiber diese Themenkreise arif der anderen Seite.
Den einzigen mir bekannten Versuch eines Bruckenschlages stellt das Buch
J.
von HACKING "The Logic of Statistical Inference" dar. In dem auf den
ersten Abschnitt von Teil III folgenden Text habe ich daher in vielen
Punkten auf HACKINGS Ideen zuriickgegriffen, allerdings meist in der Form
kritischer Diskussionen und Rekonstruktionen, die vermutlich hiiufig zu
Konsequenzen fiihren, die mit HAC KINGS Auffassungen nicht iibereinstim
men.
Die erwahnte Kluft wird von Philosophen nur allmahlich zu iiberbriik
ken sein, und auch das allein dann, soweit sie bereit und in der Lage sind,
sowohl den Willen zu auBerster Bescheidenheit als auch den zu groBtmog
licher V orurteilslosigkeit aufzubringen. Diese beiden Entschliisse miissen
sich in zwei verschiedenen Dimensionen bewegen.
Bescheidenheit ist nicht etwa gegeniiber der philosophisch-wissenschafts
theoretischen Literatur geboten, sondern hat sich auf die statistische
Fachliteratur zu richten. Was hier von Spezialisten geleistet worden ist
leider in einer ,dem gewohnlichen Sterblichen' kaum oder nur sehr schwer
verstandlichen mathematischen Sprache -, muB zunachst verstanden,
d. h. begrifflich durchdrungen und auf seine V oraussetzungen und Kon
sequenzen hin analysiert werden. "Besser verstehen!" und nicht "besser
machen!" muB die Devise beim Beginn der Arbeit lauten. (Mit der Nieder
schrift von Teil 0 im Ersten Halbband habe ich unter anderem auch
den Zweck verfolgt, Philosophen und Wissenschaftstheoretiker mit den
wichtigsten begrifflichen Apparaturen der Statistik vertraut zu machen,
ohne die ein weiteres Eindringen in die Materie nicht moglich ist.) Aller
clings wird man hier bald eine merkwiirdige Beobachtung machen, nam
lich daB sowohl beziiglich der Grundbegriffe als auch in sehr speziellen
Detailfragen uniiberwindliche Gegensatze zu bestehen scheinen. Der Gegen
satz zwischen ,Bayesianern' und ,Anti-Bayesianern' spiegelt z. B. einen
2 Einleitung
Unterschied in den Auffassungen iiber die Natur des Begriffs der Wahr
scheinlichkeit selbst wider. Wenn man dann noch solche Dinge zur Kennt
nis nehmen mui3, wie daB ein bedeutender Statistiker und Begriinder einer
Schule, R. A. FISHER, ausgekliigelte Testmethoden entwickelte, von denen
J.
der Begriinder einer anderen Schule, NEYMAN, beweisen zu konnen be
hauptete, daB die se Methoden in einem mathematisch prazisierbaren Sinn
,schlechter als nutzlos' seien, dann wird man gewahr, daB hier im Grund
satzlichen wie in Einzelheiten Gegensatze vorherrschen, wie sie in kaum
einer anderen Wissenschaft anzutreffen sind - den Streit zwischen philo
sophischen Schulen natiirlich ausgenommen. Gerade diese ,heimatlichen
Klange' aber konnten vielleicht dazu beitragen, philosophisches Interesse
zu erwecken. Tatsachlich kann ich mit introspektiver GewiBheit verifi
zieren, daB sie in mindestens einem Fall dazu beigetragen haben.
Die Aufforderung zum vorurteilslosen Rerantreten an die Probleme muB da
gegen die Bereitschaft einschlieBen, sich von herkommlichen Denkansatzen
zu befreien, und zwar nicht nur von solchen der traditionellen Philosophie,
sondern gerade auch von solchen, die in der neueren Wissenschaftstheorie
entwickelt worden sind. Wer sich heute als Philosoph mit Bestatigungs-und
Testproblemen beschaftigt, stoBt nicht nur mit Sicherheit auf zwei groBe
Namen. Er wird sich fast unvermeidlich, bewuBt oder instinktiv, mehr der
einen oder der anderen Denkweise anschlieBen. Und ebenso wird der Leser,
der mit den einschlagigen Diskussionen auch nur einigermaBen vertraut ist,
zunachst herauszubekommen versuchen, ob sich der Betreffende mehr als
,Carnapianer' oder als ,Popperianer' den Problemen zuwendet. Der Titel
des ersten Abschnittes wurde nicht nur gewahlt, um von vornherein keine
falschen Erwartungen aufkommen zu lassen; er ist gleichermaBen als Appell
zu verstehen, sich in der Tugend der Befreiung von wissenschaftstheoreti
schen Voreingenommenheiten zu iiben. Dagegen war damit keinerlei pole
mische Absicht verbunden. Die Abgrenzung gegeniiber dem, was CARNAP
induktive Logik nannte, ist zwar eine unmittelbare Konsequenz meiner
entscheidungstheoretischen Uminterpretation des Carnapschen Projektes.
Denn im gegenwartigen Kontext haben wir es, wenigstens in der Haupt
sache, mit theoretischen Nachfolgerproblemen zum Induktionsproblem zu
tun. Doch wiirde der Unterschied auch dann bestehen bleiben, wenn man
CARNAPS urspriinglichem Selbstverstandnis folgte. Schlagwortartig seien
die wesentlichen Unterschiede hervorgehoben: (1) In CARNAPS System
konnen isolierte Hypothesen aufgrund von Erfahrungsdaten beurteilt wer
den. In dem hier versuchsweise eingefiihrten Analogon zum Bestatigungs
begriff wird hingegen ausdriicklich auf miteinander rivalisierende Alternativ
kypothesen Bezug genommen. (2) Der Begriff des statistischen Datums schlieBt
nicht nur sog. ,Beobachtungsdaten' ein, sondern stets auch ein background
knowledge in Gestalt akzeptierter statistischer Oberf?ypothesen. Die Notwendig
keit einer solchen Einbeziehung ergibt sich daraus, daB man keine statisti-
Einleitung 3
schen Hypothesen iiberpriifen kann, ohne andere statistische Hypothesen
als giiltig vorauszusetzen. Dieser scheinbar paradoxe Sachverhalt wird ver
standlicher, wenn man zu der von R. N. GIERE beniitzten Analogie greift,
bei der es sich ebenfalls um eine theoretische GroBe handelt: Es diirfte in
der Physik nicht moglich sein, den Wert einer bestimmten Kraft zu be
stimmen, ohne irgendwelche Annahmen iiber andere Kriifte zu machen. (3)
Der Bestatigungsbegriff ist nicht probabilistisch, also in einem bestimmten
technischen Sinn nicht induktivistisch (dies gilt allerdings nur mit Ausnahme
von Abschnitt 13).
Die eben gemachten Andeutungen legen die Vermutung nahe, daB
die hier vorgetragenen Dberlegungen eine mehr oder weniger groBe A.hn
lichkeit mit der Denkweise POPPERS haben werden. lch bin gern bereit, dies
zuzugeben. Dennoch scheint es mir, daB die Poppersche Theorie von vorn
herein auf deterministische Hypothesen zugeschnitten ist. lnsbesondere gilt
die von POPPER mit solcher Emphase betonte Asymmetrie zwischen Veri
fizierbarkeit und Falsifizierbarkeit im statistischen Fall nicht. Dies hat
mehrere wichtige Konsequenzen: Erstens darf man bei der Beurteilung
statistischer Hypothesen nicht nur an die Gefahr denken, daB man Falsches
irrtiimlich fur richtig halt; die dazu duale GeJahr der irrtiimlichen Verwerfung
von richtigen llypothesen ist genauso ernst zu nehmen. Zweitens ist jede Ver
werfung statistischer Hypothesen etwas prinzipiell Provisorisches. Wahrend im
deterministischen Fall die empirische Widerlegung von Theorien nur da
durch ruckgangig gemacht werden kann, daB man die empirischen Daten
in Frage stellt, kann dieZuriicknahme der Verwerfungeiner statistischen Hypo
these durch blofe Vergrojerung der Erfahrungsdaten, ohne Revision der bei der
Verwerfung verfiigbaren Daten, erzwungen werden. Dies allein zeigt, daB
jeder Begriff der ,verniinftigen Verwerfung' von statistischen Hypothesen,
wie immer er genauer zu explizieren ist, etwas vollig anderes darstellt als der
Begriff der Falsifikation, jedenfalls keine ,natiirliche Verallgemeinerung'
dieses letzteren Begriffs. SchlieBlich kann man bei deterministischen Hypo
thesen stets feststellen, ob Beobachtungsdaten mit ihr in Einklang stehen
oder ob sie dies nicht tun. Bei statistischen Hypothesen kann es sich ereig
nen, daB sich keines von beiden sagen laBt: Urteilsenthaltung ist dann die
adaquateste Reaktion. Dies ist ein dritter Unterschied. Weiter oben wurde
gesagt, daB der spater beniitzte Bestatigungsbegriff nicht ,induktivistisch'
ist. Erganzend fiige ich jetzt hinzu: er ist auch nicht ,deduktivistisch'.
Von einem streng systematischen Gesichtspunkt aus gesehen ware es
wiinschenswert, die Beschiiftigung mit der statistischen Wahrscheinlichkeit
in zwei Teile zu zerlegen. lm ersten Teil ware zu schildern, wie dies er Begriff
als ein ,wohldefinierter Begriff' einzufiihren ist. Erst im zweiten Teil hatte
man sich dann der Bestatigungs- und Testproblematik zuzuwenden. Wir
werden dagegen ,das Pferd beim Schwanz aufzaumen' und mit dem letzteren
beginnen: Der Grund dafiir ist den Ausfiihrungen in 1. b und 1. c zu ent-
4 Einleitung
nehmen. Die v. Mises-Reichenbachsche Theorie, welche die statistischen
Wahrscheinlichkeiten als Grenzwerte von Folgen relativer Haufigkeiten
definiert (und daher von mir als Limestheorie der statistischen Wahrschein
lichkeit bezeichnet wird), ist zu starken Einwendungen ausgesetzt, als daB
sie eine brauchbare begriffliche Basis abgeben konnte. Der V orschlag von
BRAITHWAITE wiederum, die statistische Wahrscheinlichkeit als eine theo
retische GrOJfe einzufiihren, die durch eine Testregel zu charakterisieren ist,
macht den Wahrscheinlichkeitsbegriff unendlich vieldeutig. Immerhin
bildet der Braithwaitesche V orschlag einen interessanten V orlaufer der
Propensity-Interpretation von POPPER, die an spaterer StelIe (in 12. b) aus
fiihrlich diskutiert wird. Bis einschlieBlich Abschnitt 11 stehen die Ober
legungen somit unter einer Als-Ob-Konstruktion: Es wird stets so getan,
a/s ob es so etwas wie eine theoretische GroBe, genannt Statistische Wahr
scheinlichkeit oder Chance, gabe. Und alle Ausfiihrungen von Abschnitt
2-10 gelten nur unter dies er wissenschaftstheoretischen Oberhypothese.
Zur Rechtfertigung mag ein Analogiebild dienen: Wenn es stimmt, daB der
Begriff der Kraft eine theoretische GroBe ist, dann ist es - statt endlosen
Nachgriibelns dariiber, was die Kriifte ,eigentlich sind' und ob sie nicht
vielIeicht doch ,durch Definition auf Beobachtbares zuriickgefiihrt' werden
konnen - zweckmaBiger, zuniichst pragmatisch vorzugehen und nachzu
sehen, ,wie die Physiker mit diesem Begriff umgehen'. Ebenso finde ich es
ratsamer, die nun schon endlosen Streitigkeiten dariiber, ob und wie Wahr
scheinlichkeiten definierbar sind, zunachst zuriickzustelIen und zuzusehen, wie
man in der Statistik, insbesondere in der Test- und Schatzungstheorie, diese
Begriffe handhabt. AlIerdings kann es sich auch nur urn eine ZuriickstelIung
handeln, zumal ja die erwahnte Oberhypothese bei alIen Oberlegungen be
stimmend bleibt. Die Kontroverse Sul:jektivismus gegen Ol:jektivismus wird in
Abschnitt 12 geschildert. Ich bin sehr froh dariiber, daB ich in 12. b die
Arbeiten von GIERE und SUPPES auswerten konnte, die bei Drucklegung
dieses Buches noch nicht veroffentlicht waren. Beide Autoren haben die
Fruchtbarkeit des Popperschen Ansatzes durch Fortfiihrung und Priizi
sierung seiner Ideen unter Beweis gestelIt. Vor allem die beiden Arbeiten
von SUPPES haben mich davon iiberzeugt, daB auch die Auffassung von
HACKING nicht zum Erfolg fiihren kann, den Begriff der statistischen Wahr
scheinlichkeit mittels einer Theorie der Stiitzung (support) adaquat zu
charakterisieren. In den Gedanken von SUPPES erblicke ich den wichtigsten
Beitrag unter alIen bisherigen Versuchen, den Begriff der statistischen
Wahrscheinlichkeit als eine theoretische GroBe einzufiihren. SUPPES war
friiher selbst iiberzeugter Bayesianer, der sich, wie er berichtet, nur iiber
standig nagende Z weifel vom betOrenden Sirenengesang der groBen
personalistischen Wahrscheinlichkeitstheoretiker 10szulOsen vermochte.
Eine kritische Diskussion der subjektivistischen ,Gegentheorie' wird
in 12. a gegeben. Leider war es unmoglich, auf engem Raum eine wirklich