Table Of ContentFORSCH U NGSBE RICHTE
DES WIRTSCHAFTS- UND VERKEHRSMINISTERIUMS
NORD RH EIN-WESTFALEN
Herausgegeben von Staatssekretär Prof. Leo Brandt
Nr. 344
Prof. Dr.-Ing. Wilhelm Fucks
Zur Deutung einfachster mathematischer Sprachcharakteristiken
Als Manuskript gedruckt
Springer Fachmedien Wiesbaden GmbH
ISBN 978-3-663-06619-4 ISBN 978-3-663-07532-5 (eBook)
DOI 10.1007/978-3-663-07532-5
Forschungsberichte des Wirtschafts- undVerkehrsministeriums Nordrhein-Westfalen
G I i e der u n g
. . . . . . . . . . . . .
1. Ziel der Untersuchung ••• s. 5
2. Mittlere Silbenzahl je Wort und mittlere Wortzahl je Satz als
. . . . . . . . . . . . . . .
Stilcharakteristiken S. 5
. . . . .
3. Bildliche Darstellung der Ergebnisse aus Abschnitt. 2 S. 7
. . . .
4. Verteilung der Bildpunkte unterschiedslos aller Texte • S. 9
5. Die Gebirgszüge der Schriftsteller und der schreibenden Nicht-
. . . . . . . . . . . . . . . . . . . . . .
schriftsteller S. 10
6. Teilsummenfolgen der Silbenmittelwerte je Wort und der Wort
mittelwerte je Satz und die Objektivität unserer Ergebnisse.. S. 12
. . . . . . . . . . . . . . .
7. Deutung der Ergebnisse s. 16
. . . . .
8. Mathematische Stilcharakteristiken und Stilbewertung s. 19
. . . . . . . . . . . . . . . . . . . . .
9. Literaturverzeichnis S. 21
Sei te 3
Forschungsberichte des Wirtschafts- und Verkehrsministeriums Nordrhein-Westfalen
1. Ziel der Untersuchung
Diese Untersuchung gibt eine Anwendung von zwei der allereinfachsten ma
thematischen Stilcharakteristiken, die man bilden kann, nämlich dem Mit
telwert der Zahl der Silben je Wort und dem Mittelwert der Zahl der Wör
ter je Satz. Die Aufgabe soll dabei darin bestehen, diese beiden Stil
charakteristiken mit dem Ziel der anschaulichen Deutung ihres Gehaltes
an wohlbekanntes Schrifttum anzuschließen.
Bei diesem außerordentlich einfachen Verfahren wird sich ein Resultat er
geben, das nicht so ohne weiteres vorherzusehen war. Es zeigt sich näm
lich, daß wir zwei Kategorien von Texten sehr deutlich unterscheiden kön
nen: Texte von Schriftstellern und Texte von schreibenden Nichtschriftstel
lern. In unseren Diagrammen bildet sich ganz von selbst eine Insel der
Schriftsteller und eine Insel der schreibenden Nichtschriftsteller heraus,
oder, wenn wir uns des Darstellungsmittels von Höhenlinien bedienen, ein
Gebirgszug der Schriftsteller und ein Gebirgszug ~er Nichtschriftsteller,
die durch ein tiefes Tal voneinander getrennt sind.
Es ist, um die Aufgabe zu präzisieren, die Betrachtung durchweg auf Texte
gegründet worden, die im Druck veröffentlich sind, und die Untersuchung
beschränkt sich in dieser Arbeit auf Texte in deutscher Sprache.
2. Mittlere Silbelizahl je Wort und mittlere Wortzahl je
Satz als Stilcharakteristiken
t
Analog zum Silbenmittelwert i = i p., über dessen Verwendung als Sprach-
l [1J,
charakteristik an anderen Stelle~ ausführlich berichtet ist betrachten
[2J.
wir für die Aufgabe dieses Kapitels auch die Sätze als unsere Elemente
Auch diese Elemente können wir uns durch ein bestimmtes Merkmal gekenn
zeichnet denken, beispielsweise durch die Zahl der Wörter in jedem Satz.
... ,
Wir numerieren die Sätze durch: 1, 2, 3, r, ••• , R und die Zahl der
Wörter je Satz bezeichnen wir mit j. Jeder Satz hat wenigstens ein Wort.
Die größte vorkommende Wortzahl je Satz bezeichnen wir mit J. j läuft also
von 1 bis J.
Die Verteilung der Wörter auf die Sätze, Satz für Satz gerechnet, ist für
GOETHEs Dichtung und Wahrheit dargestellt in Abbildung 1 (ausgezogene Kur
ve).
5
Seite
Forschungsberichte des Wirtschafts- und Verkehrsministeriums Nordrhein-Westfalen
I
0,04 ~----~----~----~----~----~----~----~----~----,
P.
J 0,03 ~----~~~~;r--+-----+-----+-----+-----~----~--~
0,02
0,01
0,0
° 12 24 36 48 60 72 84 96 108
j ..
A b b i 1 dun g 1
Relative Häufigkeiten p. der Sätze deren Wortzahlen
J
a) einzeln b) in Vierergruppen --_
c) in Achtergruppen --------- gewertet werden
Ähnlich wie bei den Wörtern bezeichnen wir die relative Häufigkeitsver
teilung der Wörter auf die Sätze durch die Zahlen Pj.
Für manche Zwecke empfiehlt es sich, die Merkmale zu Gruppen ~usammenzu
fassen. Wir bestimmen dann den Bruchteil aller Sätze, deren Wörterzahl
etwa von 1 bio 4 reicht, dann den Bruchteil der Sätze, deren Wörterzahl
von 5 bis 8 reicht usw •• Diese Gruppenbildung führt zu etwas glatteren
Kurven. Auch solche Kurven (mit Vierergruppen gestrichelt und mit Achter
gruppen punktiert) sind in Abbildung 1 mit eingetragen worden.
Wir bilden auch, hier wieder die mittlere Zahl der Wörter je Satz. Wir nen
nen sie j. Sie rechnet sich nach Gleichung (1):
J
j = L j p.
1 J
Nach den abgeleiteten Regeln sind für rund 50 Texte die Häufigkeitsver
teilungen ermittelt und die Mittelwerte i für die Silbenzahlen je Wort
und Mittelwerte j für die Wörterzahlen je Satz ausgerechnet worden. Die
Sei te 6
Forschungsberichte des Wirtschafts- und Verkehrsministeriums Nordrhein-Westfalen
Resultate sind in den Abbildungen 2 und 3 zusammengefaßt.
Autor Werk i j
1 Adler Menschenkenntnis 1,866 23,276
2 Bismarck Reden aus "Gesammelte Werke" 2,281 33,86}
3 Einstein Evolution der Physik 1,929 21,097
Autor Werk T j 4 Freud Frage der Laienanalyse 1,891 19,144
1 Bergengrün Der letzte Rittmeister 1,8495 15,263 5 Gerlach Experimente zur Kernphysik 2,008 21.142
2 CaroBsa Geheimnisse des reifen Lebens 1,7440 16,570 6 Guardini Tod des Sokrates 1,832 21,444
3 Chamisso Peter Schlemihl 1,6117 19,754 7 Hegel Aus "Sämtliche Werke" 1,835 31,381
4 Eichendorff Aus dem Leben eines Taug~nichts 1,5560 24,900 8 Heidegger Was ist Metaphysik? 1,818 16,802
5 Eyth Hinter Pflug und Schraubstock 1,7150 15,035 9 Heisenberg Physik der Atomkerne 1,909 20,530
6 Fallada Kleiner Mann was nun? 1,5303 10,676 10 Heuß Randbemerkungen 1,980 20,500
7 Fontane Effi Briest 1,7243 14,440 11 v.Humbold Neuspanien 2,0)4 31,719
8 Goethe lo1i ttelwert aus vier Werken 1,6939 25,439 12 ';008 Theoretische Physik 2,046 22,642
81 Farbenlehre 1,8002 27,109 13 Kord t Die Wilhelmstraße 2,110 26,000
14 Narx Das Kapital 2,021 32,668
82 Italienische Reise 1,7152 22,724
83 Hermann und Dorothea 1,5747 22,825 15 Ostwald Farbkunde 1,969 20,452
84 Dichtung und Wahrheit 1,6856 29,100 16 Pestalozzi Körpererziehung 1,764 26,683
9 Hauff Phantasien im Bremer Ratskeller 1,6448 2C,700 17 Planck Vorträge 2,019 23,531
1CJ Hesse Steppenwolf 1,7160 20,011 18 Du 30is ·Lber eine Akademie der deut- 1,939 11,181
11 Hoffmann Rat Krespel 1,7210 24,868 Reymond schen Sprache
12 Jünger Auf den Marmorklippen 1,6560 24,090 19 Rucker Vor träg: Die Aufgabe des pla- 2,191 27,642
13 Kästner Die verschwundene Miniatur 1,7316 8,432 nenden Ingenieurs
14 Lamprecht Alexanderlied 1,5620 14,540 20 Sauer Über elektronische Rechenauto- 2,270 22,600
15 Mann Die Buddenbrooks 1,8040 18,850 maten
16 May Winnetou I 1,6125 14,100 21 v.Schlieffen Cannae 1,894 20,531
17 Möricke Mozart auf der Reise nach Prag 1,7096 19,814 22 Schliemann Trojanische Altertümer 1,892 42,134
16 Raabe Die Chronik der Sperrlingsgasse 1,9028 18,955 23 Schütz Ansprache: Studententum und 2,090 35,600
Zeitgeschehen
19 Rilke Cornet 1,4510 8,747
20 Schiller Der Geisterseher 1,7130 15,624 24 Sombart Die drei Nationalökonomien 2,009 22.655
21 Stifter Hochwald 1,7354 27,790 25 Sommerfeld Atombau und Spektrallinien 2,100 21,597
22 Storm Der Schimmelreiter 1,6313 18,825 26 Weber Wirtschaftsgeschichte 1,874 22,287
23 Wassermann Der Fall l1aurizius 1,7690 21,416 27 Weizsäcker Weltbild der Physik 1,970 19,300
Schwerpunkt Sämtliche Texte 1,6819 18,211 Schwerpunkt Sämtliche Werke 1,984 24,385
A b b i 1 dun g 2 A b b i 1 dun g 3
Unter den Nichtschriftstellern sind zu finden Wissenschaftler verschie
dener Fachrichtungen, Politiker, Journalisten, usf •• Die Auswahl der Texte
war von manchen Zufälligkeiten abhängig. Dies ist für unseren Zweck kein
Nachteil, weil angestrebt wird, eine möglichst weitstreuende Auswahl be
züglich der im deutschen Schrifttum anzutreffenden Formalstrukturen der
Betrachtung zugrunde zu legen.
3. Bildliehe Darstellung der Ergebnisse aus Abschnitt 2
Um zunächst einmal eine Übersicht ganz den großen Zügen nach zu erhalten,
sind in Abbildung 4 die Ergebnisse der vorigen Abschnitte anschaulich zu
sammengefaßt. Die Silbenmittelwerte i der Wörter sind nach oben, die
Wörtermittelwerte j der Sätze nach rechts aufgetragen. Die Bildpunkte von
7
Seite
Forsohungsberiohte des Wirtsohafts- und Verkehrsministeriums Nordrhein-Westfalen
2,4
1
i
2,2
@]
~
14
2,0
~
m
1 ,8
@)
1 ,6
1,4L---~L---~----~----~----~----~-----L----~----~--~
6 10 14 18 22 26 30 34 38 42 46
A b b i 1 dun g 4
Mittelwerte i der Silbenzahlen je Wort aufgetragen über den
Mittelwerten j der Wörterzahlen je Satz. S = Schwerpunkt
o Nichtschriftsteller 0 Schriftsteller
Schriftstellern sind mit kreisförmiger Markierung, die von Nichtschrift
stellern mit quadratischer Markierung gekennzeichnet.
Bei der Betrachtung von Abbildung 4 fällt deutlich ins Auge, daß sich
diese beiden Gruppen in der Hauptsache auf zwei verschiedene Bereiche
unserer i- und j-Ebene verteilen.
Zur weiteren Orientierung ist der Bereich herausgezeichnet, der von den
Werken berandet wird, welche aus dem Schrifttum GOETHEs ausgewählt worden
sind (GOETHE-Feld). In dem Bereich, in dem wir im wesentlichen die Werke
von Nichtschriftstellern finden, ist anhand der Bildpunkte von Schriften
einiger Physiker ein Stück der Ebene durch Schraffierung gekennzeichnet
(Physiker- Feld).
Sei te 8
Forschungsberichte des Wirtschafts- und Verkehrsministeriums Nordrhein-Westfalen
4. Verteilung der Bildpunkte unterschiedslos aller Texte
Wenn die von uns ins Auge gefaßte Unterscheidung zwischen Schriftstellern
und schreibenden Nichtschriftstellern objektiv und grundsätzlich durch
unsere sehr einfachen stilanalytischen Mittel erfaßbar ist, so muß sich
dieses Ergebnis stets herausstellen, ganz gleich mit welchen mathemati
schen Darstellungsmitteln wir unser Problem behandeln.
Es ist nun die Absicht, in Abbildung 5, wie es in der Geographie üblich
ist, Höhenlinien einzutragen und zwar nach folgendem Verfahren:
1,4~----~----~----~----~--'-~---'~----~----~----~--~
6 10 14 18 22 26 30 34 38 42 46
j ~
A b b i 1 dun g 5
Wir denken uns einen beliebigen Anfangspunkt in unserem Diagramm heraus
gegriffen, der mit dem Bildpunkt für einen Text zusammenfallen kann aber
nicht zusammenfallen muß. Um diesen Punkt herum denken wir uns eine Linie
gezogen, die drei Bildpunkte von Texten einschließen soll. Dann wird eine
zweite Linie um den gleichen Anfangspunkt gezogen, welche die Bildpunkte
von sechs Texten umschließt. Wir fügen eine dritte Linie hinzu, welche
die Bildpunkte von neun Werken einschließt und so fort. Auf diese Weise
Sei te 9
Forsohungsberiohte des Wirtsohafts- und Verkehrsministeriums Nordrhein-Westfalen
erhalten wir ein System von Höhenlinien, das in unserem Fall schließlich
aus 18 Linien bestehen wird, entsprechend der Zahl von 54 Bildpunkten von
Schriftwerken.
Wenn die Unterscheidung von Schriftstellern und schreibenden Nichtschrift
stellern objektiv ist, muß sie sich in diesem Gebirge immer in der einen
oder anderen Form ausdrücken, gleichviel von welchem Anfangspunkt wir
ausgegangen sind, ja auch, wenn wir von mehr als einem Anfangspunkt aus
gehen, wenn nur die Zahl der Anfangspunkte klein ist im Vergleich zur
Zahl der Bildpunkte.
Als Anfangspunkt wählen wir zunächst denjenigen Punkt, der sozusagen den
Unterschied zwischen Schriftstellern und schreibenden Nichtschriftstellern
am meisten verwischt, nämlich den gemeinsamen Schwerpunkt aller Texte
beider Klassen. Dieser Schwerpunkt ist in Abbildung 5 durch zweifache Um
randung gekennzeichnet. Er fällt nicht mit dem Bildpunkt von irgendeinem
Text zusammen.
Es sind nun in Abbildung 5 um diesen gemeinsamen Schwerpunkt herum wie
oben beschrieben Höhenlinien gezeichnet worden. Die Abbildung zeigt deut
lich, daß die Dichte der Werke gleichviel ob von Schriftstellern oder von
schreibenden Nichtschriftstellern in der Umgebung des Gesamtschwerpunktes
sehr gering ist. Der Abfall unseres Gebirges ist dort offensichtlich
sehr klein, es handelt sich um einen flachen Bereich. In den Bereichen
dagegen, die dem Schwerpunkt der Schriftsteller allein und dem Schwer
punkt der schreibenden Nichtschriftsteller allein entsprechen, stürzt das
Gebirge steil nach unten ab, wie aus der dichteren Folge der Höhenlinien
an diesen Stellen zu sehen ist. Hier liegen also die Bildpunkte dicht.
Obgleich wir auf den Unterschied, auf den es uns hier ankommt, in dieser
Darstellung keine Rücksicht genommen haben, ja eher eine Darstellung ge
wählt haben, die am meisten von allen möglichen Darstellungen auf eine
Verwischung dieses Unterschiedes hin angelegt ist, tritt der Unterschied
doch bereits deutlich in Erscheinung.
5. Die Gebirgszüge der Schriftsteller und der schreibenden
Nichtschriftsteller
Die Bedeutung der Steilhänge von Abbildung 5 kann nun besonders klar ans
Licht gebracht werden, wenn wir die Schwerpunkte der Werke von Schrift-
Seite 10
Forschungsberichte des Wirtschafts- und Verkehrsministeriums Nordrhein-Westfa1en
stellern und Nichtschriftstellern getrennt in unser i-j-Diagramm einzeich
nen und die Höhenlinien um diese Schwerpunkte als Anfangspunkte zeichnen.
1,4
~--~~~~~--~--~~----~~~~----~----~----~--~
6 10 14 18 22 26 30 34 38 42 46
j ..
A b b i I dun g 6
Die Gebirgszüge der Schriftsteller und der schreibenden
Nichtschriftsteller
o Nichtschriftsteller 0 Schriftsteller
Es sind also in Abbildung 6 jetzt zunächst die Schwerpunkte für die
Schriftsteller und für die Nichtschriftsteller gesondert eingetragen. Sie
sind durch Fettdruck gekennzeichnet. Dann sind wieder Linien diesmal um
die beiden Schwerpunkte gesondert herumgezogen worden, derart, daß wie
der die innerste in sich geschlossene Linie drei Texte umfaßt, die näch
ste in sich geschlossene Linie sechs Texte, usf •• Wir haben insgesamt
zweimal neun Linien gezeichnet, von denen also die letzte je 27 Texte
umfaßt.
Es ergeben sich so in Abbildung 6 zwei sehr deutlich gesonderte Bergrük
ken, die durch ein tiefes Tal voneinander getrennt sind. Zur Charakteri-
Seite 11