Table Of ContentFZI -Berichte Informatik
Herausgegeben yom Forschungszentrum Informatik
an der Universitat Karlsruhe (FZI)
Herausgebergremium: R. Dillmann G. Goos P. C. Lockemann
U. Rembold W. Rosenstiel
K. Berns T. Kolb
N euronale N etze
fur technische
Anwendungen
Springer-Verlag
Berlin Heidelberg New York
London Paris Tokyo
Hong Kong Barcelona
Budapest
Herausgeber
Forschungszentrum Informatik an der Universitat Karlsruhe (FZI)
Haid-und-Neu-StraBe 10-14, D-76131 Karlsruhe
Autoren
Karsten Berns
Forschungszentrum Informatik an der Universitat Karlsruhe
Haid-und-Neu-StraBe 10-14, D-76131 Karlsruhe
Thorsten Kolb
Technische Hochschule Cottbus
Karl-Marx-StraBe 17, D-03046 Cottbus
ISBN-13: 978-3-540-58251-9 e-ISBN-13: 978-3-642-79148-2
DOl: 10.1007/978-3-642-79148-2
Dieses Werk ist urheberrechtlich geschiitzt. Die dadurch begriindeten Rechte, insbesondere die der Oberset
zung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der
Mikroverfilmung oder der VervieWiltigung auf anderen Wegen und der Speicherung in Datenverarbeitungs
anlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfiiltigung dieses Werkes
oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestirnrnungen des
Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden
Fassung zulassig. Sie ist grundsatzlich vergiitungspflichtig. Zuwiderhandlungen unterliegen den Strafbe
stirnrnungen des Urheberrechtsgesetzes.
© Springer-Verlag Berlin Heidelberg 1994
Satz: Reproduktionsfertige Vorlage vom Autor
SPIN: 10084242 45/3140-5432 I 0-Gedruckt aufsaurefreiem Papier
Vorwort
Ktinstliche Neuronale Netze oder Konnektionistische Systeme haben schon lange
Einzug in die Forschung der kiinstlichen Intelligenz, Robotik, Sprachverarbeitung
und Bildverarbeitung gehalten. Zusatzlich zu diesen klassischen Anwendungsfel
dem werden in letzter Zeit immer mehr neuronale Ansatze in Bereichen verfolgt,
die bisher mit analytischen Methoden oder mit regelbasierten Verfahren ge16st
wurden. Beispiele hierfiir sind Verfahren zur Untersttitzung von Aktienprognosen,
Wetter- und Smogvorhersagen sowie zahlreiche Diagnoseaufgaben aus der Che
mie, dem Maschinenbau und der Medizin. Diese haufig sehr unterschiedlichen
Aufgabenstellungen haben gemeinsarn, daB sie analytisch schwer beschreibbar
sind und aufgrund ihrer Komplexitat mit herkommlichen Verfahren nur unzurei
chend gelost werden k6nnen.
Zur Zeit besteht aber eine enorme Diskrepanz zwischen der weltweiten FIut
neuronaler L6sungsansatze und deren Einsatz in der industriellen bzw. kommerzi
ellen Praxis. Dies hat mehrere Grunde. Zum einen weicht die hier ben6tigte Pro
blem16sungsdenkweise v611ig von der traditionell praktizierten ab, zum anderen
gibt es gegentiber theoretischen Ansatzen keine geschlossene Theorie.
Diese zuruckhaltende Raltung ist auch darnit zu begrtinden, daB es sehr schwierig
ist, einen ausreichenden Uberblick tiber relevante Ver6ffentlichungen zu erhalten,
die L6sungsm6glichkeiten fiir ein bestimmtes Problem beschreiben. Andere Pro
bleme sind bei stark anwendungsorientierten Ver6ffentlichungen die meist unzu
reichenden Darstellungen der verwendeten Neuronalen Netze und deren
Lemverfahren sowie das Fehlen einer detaillierten Problembeschreibung.
Dieses Buch richtet sich daher in erster Linie an Informatiker und Ingenieure,
die fiir industrielle und kommerzielle Problemstellungen geeignete L6sungsver
fahren suchen und m6glichst schnell abschatzen wollen, inwieweit Neuronale
Netze zur L6sung geeignet erscheinen. Neben dem Anwender aus der Industrie
kann dieses Buch auch dem praxisorientierten Forscher empfohlen werden.
Um diese Zielsetzung zu erreichen und eine Ubersicht tiber aIle praxisrelevan
ten Anwendungen Neuronaler Netze geben zu k6nnen, wurde eine sehr kompakte,
sich auf die wesentIichen Dinge beschrankende Darstellung gewahlt. Dabei wur
de auf theoretische Betrachtungen weitestgehend verzichtet. Ftir einen tieferen
Einstieg in speziellere Problemfelder wird an den entsprechenden Stellen auf ge-
VI Vorwort
eignete Literatur verwiesen. Eine weitere Zielsetzung dieses Buches besteht dar
in, demjenigen, der Neuronale Netze fUr ein bestimmtes Problem einsetzen
mochte, eine sinn volle Vorgehensweise aufzuzeigen.
Das vorliegende Buch gliedert sich in acht Kapitel. Neben einem kritischen
Uberblick tiber die Neuro-Forschung und deren Ergebnisse von den Anfangen bis
heute werden in Kapitel 3 die verschiedenen Netztypen kurz vorgestellt. Bei die
ser Darstellung liegt das Hauptaugenmerk auf einer einheitlichen algorithmischen
Beschreibung und auf der Auflistung der Vor- und Nachteile der einzelnen Lern
verfahren. Dadurch wurde auch ein Vergleich zwischen den unterschiedlichen
Lernverfahren ermoglicht. Dieses Kapitel stellt allerdings nur eine Einfiihrung
dar und ist keineswegs als Alternative zu den zahlreichen ausfiihrlichen VerOf
fentlichungen iiber neuronale Lernverfahren und deren mathematischer Herlei
tung gedacht.
1m Kapitel 4 Experimentelle Anwendungen in Forschung und Entwicklung
werden, klassifiziert nach verschiedenen Anwendungsfeldern, die verwendeten
Netze, die Anforderungen von Seiten der Aufgabenstellung und die erzielten Er
gebnisse anhand von Beispielen beschrieben. Erganzt wird diese Aufzahlung
durch Tabellen, in denen weitere interessante Anwendungen aufgefiihrt sind. Nur
wenige der besprochenen Beispiele wurden bis jetzt als kommerzielle Produkte
eingesetzt. 1m nachsten Kapitel werden in ahnlicher Weise neuronale Losungsal
gorithmen in kommerziellen Produkten beschrieben. Die Darstellung ist relativ
kurz gehalten, da es in den meisten Fallen unmoglich war, von den jeweiligen Fir
men exakte Beschreibungen ihrer Produkte zu erhalten.
In Kapitel 6 werden Werkzeuge fiir die Simulation bzw. Realisierung Neuro
naler Netze aufgefiihrt und die dazugehorenden Entwicklungsumgebungen be
schrieben. AnschlieBend sind einige niitzliche Informationen iiber einfiihrende
Literatur, Zeitschriften, Konferenzen, Organisationen, Forschungszentren, Forde
rungsmoglichkeiten und Patente aus dem Bereich Neuronale Netze zusammenge
stellt. Dieses Buch endet mit einer Checkliste, die es dem Anwender ermoglichen
solI, leichter abzuschiitzen, ob Neuronale Netze bzw. bestimmte Netztypen fiir
seine Anwendung Vorteile gegeniiber herkommlichen Techniken bringen oder
nicht.
Die Autoren danken dem Forschungszentrum Informatik, insbesondere dem
Herausgeberrat und dessen Vorsitzenden Herrn Prof. Dr. W. Rosenstiel fiir ihre
wertvollen Anregungen und Verbesserungsvorschlage. Unser Dank gilt auch
Herrn Prof. Dr. R. Dillmann, der das Erstellen dieses Buches gefOrdert hat. Wei
terhin mochten wir uns bei Knut Moller, Wolfgang Eppler, Klaus-Robert Miiller,
Mathias Berning, Martin Riedmiller und Heinrich Braun bedanken, die eine Rei
he wertvoller Hinweise und Diskussionsbeitrage geliefert haben. Nicht zuletzt
gilt unser Dank auch S. Tolrnie, H. Tsrouya, F. Berns und M. Eberl, die bei der
Endfassung des Manuskripts behilflich waren.
Karlsruhe, April 1994 Karsten Berns, Thorsten Kolb
Inhaltsverzeichnis
Einleitung 1
1.1 Motivation 1
1.2 Biologische Grundlagen 3
1.3 Eigenschaften Konnektionistischer Systeme 5
2 Historischer Uberblick 9
3 Netztypen 15
3.1 Grundlagen konnektionistischer Modelle 15
3.2 Das Perzeptron 20
3.3 Backpropagation 23
3.4 Kohonennetze 28
3.5 Hopfieldnetze 31
3.6 Adaline und Madaline 34
3.7 Linearer Assoziierer 37
3.8 Brain-State-in-a-Box 38
3.9 Wettbewerbslemen (competitive learning) 39
3.10 Adaptive Resonance Theory 40
3.11 Weitere Modelle 43
4 Experimentelle Anwendungen in Forschung und Entwicklung 49
4.1 Visuelle Mustererkennung 50
4.2 Nichtvisuelle Mustererkennung 56
4.3 Analyse, Verrechnung verschiedenartiger Eingaben 62
4.4 Mustersynthese, Modellbildung, Vorhersage 69
4.5 Rekonstruktion, Konvertierung, Speicherung 78
4.6 Steuerung, Regelung 82
4.7 Planung, Optimierung 92
4.8 Vergleichende Arbeiten 102
5 Kommerzieller Einsatz 107
5.1 Industrielle Planung und Steuerung 108
5.2 Industrielle Fertigungsiiberwachung 109
5.3 Finanzwesen 111
viii Inhaltsverzeichnis
5.4 Telekommunikation 112
5.5 Medizin 113
5.6 Marketing 114
5.7 Offentlicher Dienst, Dienstleistungen 114
5.8 Verkehr 115
5.9 Produktkomponenten, Handel 116
5.10 Patente 117
6 Werkzeuge und Entwicklun~sumgebungen filr Neuronale Netze 119
6.1 Hardware 119
6.2 Software 124
6.3 Software und Hardware Produkte 133
7 Kurzinformationen 141
7.1 Einfiihrende Literatur 141
7.2 Zeitschriften und elektronische Medien 143
7.3 Konferenzen 147
7.4 Organisationen im Bereich Neuronale Netze 150
7.5 Forschungszentren in Deutschland 151
7.6 Forderungsmoglichkeiten und geforderte Projekte 153
8 Von der Planung zum Produkt 157
8.1 Problemcharakterisierung 159
8.2 Problemstrukturierung 160
8.3 Informationen fUr den LemprozeB 161
8.4 Wahl des Netztyps und des Lemverfahrens 162
8.5 Parameterbelegung 163
8.6 Verifikation der Netze 164
8.7 Aufbau einer Entwicklungsumgebung 165
8.8 Vorgehen wahrend TrainingITest 166
8.9 Fehlerursachen 167
8.10 Praxistest im konkreten Einsatz 167
8.11 Entwicklung eines Produkts 168
Literatur 171
Zitierte Literatur 172
Stichwortverzeichnis 199
Namensverzeichnis 203
1 Einleitung
1.1 Motivation
Weltweit arbeitet eine groBe Zahl von Wissenschaftlem an der Fragestellung:
'Wie ist es m6glich, mit Hilfe der Computertechnik eine Art Kiinstliche Intelli
genz zu schaffenT Seit den friihen sechziger lahren wurde mit sehr viel Euphorie
ein Weg eingeschlagen, bei dem versucht wurde, ausgehend von einer diskreten,
symbolischen Reprasentation der Welt, der Beschreibung der Zusarnrnenhange
zwischen Einzelinforrnationen und der Entwicklung geeigneter inferentieller Me
chanismen, kognitive Prozesse zu modellieren. Mit dieser Philosophie wurden
groBe Erfolge erzielt, wenn es beispielsweise darum ging, komplexes Experten
wissen maschinell aufzubereiten, auf hohem Niveau Schach zu spie1en, einfache
mathematische Theoreme zu beweisen oder Intelligenztests zu bearbeiten. Kogni
tive und sensorische Fiihigkeiten, die wir eher als niedrige Intelligenzleistung be
werten wiirden, wie z.B. schnelle visuelle Analyse einer Szene, Verstehen
gesprochener Sprache oder reaktive Bewegungssteuerungen von Manipulatoren
konnten mit diesen Methoden aber meist nur unzureichend ge16st werden.
Urn die Leistungsfahigkeit unseres Gehirns aufzuzeigen, werden im folgen
den einige Eigenschaften niiher beleuchtet. Unser Gehim hat die fundarnentale Ei
genschaft, daB es sich geanderten Situationen anpassen und Unbekanntes erlemen
kann. Es ist beeindruckend, mit welcher Leichtigkeit es fehlerhafte oder unvoll
standige Inforrnationen korrekt bearbeitet. So erkennen wir Gesichter uns vertrau
ter Personen, selbst wenn wir nur die Nase oder einen Teil der Augenpartie sehen.
Gerade unvollstandiges oder unscharfes Wissen bereitet den heute angewandten
heuristischen oder logikbasierten Verfahren der Kiinstlichen Intelligenz sehr gro
Be Schwierigkeiten.
Eine weitere beeindruckende Eigenschaft un seres Gehims ist die hohe Verar
beitungsgeschwindigkeit. Die irn Vergleich zu modemen Rechenelementen urn
den Faktor 105 bis 106 niedrigere Schaltzeit der Elementaroperatoren (Neuronen)
wird durch eine sehr hohe Parallelitat bei weitem ausgeglichen. Tabelle 1.1 ver
gleicht Rechenvorgange im Gehim mit denen heute eingesetzter Computer
2 1 Einleitung
Tabelle 1.1. Vergleich der Rechenvorgange im Gehim mit denen heute eingesetzter Com
puter.
Eigenscbaft Gebirn Computer
Parallelitat hoch niedrig
Prazision miiBig hoch
Fehlertoleranz hoch niedrig
Speicherzugriff global lokal
Erkennen von Mustem gut schlecht
Ausnutzen von Ahnlichkeiten ja nein
Numerisch prazise Berechnung schlecht gut
Fehlerloses Speichem von Daten schlecht gut
Rekonstruktion verrauschter Daten gut schlecht
Verallgemeinem von Beispielen gut schlecht
Selbstorganisation ja bisher nicht
Betrachtet man diese Liste von Eigenschaften unseres Gehims, so stellt sich so
fort die Frage: Kann man diese Leistung und diese Fahigkeiten iiberhaupt einmal
technisch realisieren? Geht man von Minskys These The Brain Happens to be a
Meat Machine aus, so miiBte es moglich sein, diese 'feuchte' Hardware nachzu
bauen oder zumindest ahnliche Strukturen zu schaffe n, die vergleichbare Lei
stung und Eigenschaften aufweisen. Der Forschungsbereich Konnektionistische
Systeme beschaftigt sich vor allem damit, wie man Modelle schaffe n kann, die
mit ahnlichen Arbeitsprinzipien diese Eigenschaften erzielen konnen. Die Hoff
nung, mit den hierbei entwickelten Verfahren ein kiinstliches Gehim nachbauen
zu konnen, ist beim derzeitigen Stand der Forschung reine Utopie.
Urn die in der Literatur oft unterschiedlich verwendeten Begriffe Konnektioni
stische Systeme und Neuronale Netze zu definieren, haben wir uns auf folgende
Begriffserklarungen festgelegt.
Konnektionismus: Forschungsrichtung, die sich mit hochparallelen
ProblemlOsungsprozessen mit Hiife von sehr einfach gehaltenen Einzel
elementen beschiiftigt.
Neuronales Netz: Konkrete Auspriigung eines hochparallelen Systems,
das sich an das biologische Vorbild biologisches Neuron, Nervensystem
1.2 Biologische Grundlagen 3
1.2 Biologiscbe Grundlagen
Die Frage, wie unser Gehirn wirklich funktioniert oder warum wir uns in unseren
kognitiven Fiihigkeiten von allen anderen Lebewesen so stark unterscheiden, in
teressiert die Menschheit nicht erst seit man versucht, intelligente Maschinen zu
bauen. Diese Frage wurde schon in friihester Zeit von Philosophen und Naturwis
senschaftlem gestellt.
Beispielsweise kam der griechische Arzt Hippokrates schon 500 v. Chr. zu der
Erkenntnis Mit dem Gehim denken wiT, nicht mit dem Herzen. Die Antike war al
lerdings gepdigt von den Vorstellungen Aristoteles, der glaubte, daB das Gehirn
nur zur Kiihlung des denkenden Herzens da sei. Erst 200 n. Chr. wurde die These
von Hippokrates durch den romischen Arzt Claudius Galenus bestatigt, der Expe
rimente an Gehirnen von Menschen durchftihrte. Nachdem es im Mittelalter zu
einem wissenschaftlichen Stillstand kam, verOffentlichte Descartes im Jahre 1637
das philosophisch bedeutende Werk Discours de la methode [Descartes 1637].
Hierin vertritt er die Ansicht, daB Tiere rein mechanische 'geistlose' Automaten
seien, deren Motorik man bald voll verstehen wiirde (siehe auch Kap. 2). In der
Folgezeit gab es weitere FortSchritte, begtinstigt durch die Erfindung technischer
Untersuchungsmethoden, wie etwa der Mikroskopie, der Zellfarbung oder der
Computertomographie. Dank dieser Methoden sind wir heute in der Lage, die Be
standteile und die Verarbeitungsmechanismen eines Neurons, des Grundbausteins
unseres Nervensystems sowie die elementare Informationsverarbeitung in einem
Gehirn recht genau zu besehreiben. Die nachfolgenden Erlauterungen zum Ner
vensystem sind an [Moller 1991] angelehnt.
Das Nervensystem besteht aus einer sehr groBen Anzahl von Nervenzellen,
den Neuronen. Sie bestehen aus dem Zellkorper (Soma), einem oder mehreren
Eingangen (Dendriten) und einem Ausgang (Axon), der am Ende aueh verzweigt
sein kann. An der Stelle, an der ein Axon auf die Zelloberftache eines Neurons
oder auf eine seiner Dendriten trifft, finden sich die Synapsen (siehe Abb. 1.1).
Hier werden iiber das Axon eintreffende Signale auf chemisehem (oder elektri
schem) Wege an das Neuron iibertragen.
Synapsen sind adaptiv, d.h. ihre Eigenschaften konnen dureh verschiedene au
Bere Einfliisse verandert werden. Deshalb wird ihnen eine entscheidende Rolle
bei allen Lemprozessen zugesehrieben. Eine biologisch plausible, aber noeh nieht
naehgewiesene Art der Modifikation ist die Hebb-Lemregel, naeh der Synapsen,
die gleichzeitig aktiv sind, starker miteinander gekoppelt werden. Uber den tat
saehlich verwendeten Lemalgorithmus liegen noch keine gesicherten Erkenntnis
se vor.
Aus der Sieht der Informationstechnik besitzt jedes Einzelneuron nur eine au
Berst primitive Funktion. Es summiert eintreffende Signale tiber den Ort des Ein
treffens und einen begrenzten Zeitbereich (Zeitfenster). Dieser Vorgang wird oft
als Ort-Zeit-Integration bezeichnet. Obwohl aIle Neuronen ein gemeinsames
Description:Dieses Buch beschreibt die aktuellen Einsatzmöglichkeiten neuronaler Netze für technische Anwendungen. Neben einer Kurzeinführung in das grundlegende Verständnis neuronaler Netze bietet es eine Übersicht über Anwendungen aus unterschiedlichen Gebieten, bei denen mit neuronalen Netzen bessere E