Table Of Content6
6
[}J IT] IT] [IJ
=
Forschung und Praxis
Band 99
Berichte aus dem
Fraunhofer-Institut fOr Produktionstechnik
und Automatisierung (lPA), Stuttgart,
Fraunhofer-Institut fOr Arbeitswirtschaft
und Organisation (lAO), Stuttgart, und
Institut fOr Industrielle Fertigung und
Fabrikbetrieb der Universitat Stuttgart
Herausgeber: H. J. Warnecke und H.-J. Bullinger
Gerhard Rigoll
Maschinelle Spracherkennung
zur Verbesserung der
Mensch-Maschine-Schnittstelle
Mit 55 Abbildungen
Springer-Verlag
Berlin Heidelberg New York Tokyo 1986
Dipl.-Ing. Gerhard Rigoll
Fraunhofer-Institut far Arbeitswirtschaft und Organisation (lAO), Stuttgart
Dr.-Ing. H. J. Warnecke
o. Professor an der Universitlit Stuttgart
Fraunhofer-Institut far Produktionstechnik und Automatisierung (IPAi, Stuttgart
Dr.-Ing. habil. H.-J. Bullinger
o. Professor an der Universitlit Stuttgart
Fraunhofer-Institut far Arbeitswirtschaft und Organisation (lAO), Stuttgart
093
ISBN-13:978-3-540-17350-2 e-ISBN-13:978-3-642-82975-8
001: 10.1007/978-3-642-82975-8
Das Werk isl urheberrechtlich geschatzt. Die dadurch begriindeten Rechte, insbesondere die
der Obersetzung, des Nachdrucks, der Enlnahme von Abbildungen, der Funksendung,
der Wiedergabe auf photomechanischem oder lihnlichem Wege und der Speicherung in
Datenverarbeitungsanlagen bleiben, auch bei nur auszugsweiser Verwendullg, vorbehalten.
Die Vergatungsanspriiche des § 54, Abs. 2 UrhG werden durch die ..V erwertungsgesellschaft
Wort", Manchen, wahrgenommen.
© Springer-Verlag, Berlin, Heidelberg 1986.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daB solche
Namen im Sinne der Warenzeichen-und Markenschulz-Geselzgebung als (rei zu betrachten
wliren und daher von jederrnann benutzt werden darften.
Gesamtherstellung: Copydruck GmbH, Heimsheim
2362/3020-543210
GELEITWORT DES HERAUSGEBERS
Die Umformtechnik zeichnet sich durch sehr gute Werkstoffaus
wertung und hohe Mengenleistung in der Serienfertigung gegen
Uber anderen Fertigungsverfahren aus, wobei Beibehaltung der
Masse, Anderung der Festigkeitseigenschaften wahrend eines Vor
gangs und elastische Rlickfederung der Werkstlicke nach einem
Vorgang wesentliche Merkmale sind. Weiter sind die benatigten
Krafte, Arbeiten und Leistungen sehr viel graBer als z.B. bei
spanenden Verfahren. Die sichere Beherrschung eines Verfahrens
in der industriellen Fertigung und die zunehmende Forderung
nach Vermeidung bzw. Minimierung spanender Nacharbeit erzwingen
die geschlossene Betrachtung des Systems "Umformende Fertigung"
unter zentraler BerUcksichtigung plastizitatstheoretischer,
werkstoffkundlicher und tribologischer Grundlagen.
Das Institut fUr Umformtechnik der Universitat Stuttgart stellt
entsprechend Forschung und Entwicklung zum einen auf die Erar
beitung von Grundlagenwissen in diesen Bereichen ab, zum anderen
untersucht und entwickelt es Verfahren unter Anwendung speziel
ler MeBtechniken mit dem Ziel einer genauen quantitativen Er
mittlung des Einflusses der Parameter von Vorgang, Werkstoff,
Werkzeug und Maschine. Die Behandlung von Problemen des Maschi
nenverhaltens, der Maschinenkonstruktion sowie der Werkzeugaus
legung und -beanspruchung, der Auswahl hochbeanspruchbarer,
verschleiBfester Werkzeugbaustoffe und schlieBlich der Tribo
logie gehart entsprechend ebenfalls zum Arbeitsgebiet, das
durch die Erfassung organisatorischer und betriebswirtschaft
licher Fragen abgerundet wird.
1m Rahmen der "Berichte aus dem Institut fUr Umformtechnik" er
scheinen in zwangloser Folge j.ahrlich mehrere Bande, in denen
Uber einzelne Themen ausflihrlich berichtet wird. Dabei handelt
es sich vornehmlich um AbschluBberichte von Forschungsvorhaben,
Dissertationen, aber gelegentlich auch urn andere Texte. Diese
Berichte sollen den in der Praxis stehenden Ingenieuren und
Wissenschaftlern zur Weiterbildung dienen und eine Hilfe bei
der Lasung umformtechnischer Aufgaben sein. FUr die Studieren-
den bieten sie die Moglichkeit zur Vertiefung der Kenntnisse.
Die seit zwei Jahrzehnten bewahrte freundschaftliche Zusammen
arbeit mit dem Springer~Verlag sehe ich als beste Voraussetzung
fUr das Gelingen dieses Vorhabens an.
Kurt Lange
Vorwort
Die vorliegende Arbeit entstand wihrend meiner Titigkeit in
der Forschungsgruppe "Kunstliche Intelligenz und Sprachverar
beitung" am Fraunho~er-Institut ~ur Arbeitswirtscha~t und Or
ganisation (lAO) in stuttgart.
Herrn Pro~essor Or.-Ing. habil. H.-J. Bullinger, dem Oirektor
des Fraunho~er-Instituts ~ur Arbeitswirtscha~t und Organisa
tion (lAO) und Leiter des Lehrstuhls ~ur Arbeitswissenscha~t
am Institut ~ur Industrielle Fertigung und Fabrikbetrieb
(IFF) der Universitit stuttgart, danke ich herzlich ~Or die
groBzOgige Forderung der Arbeit und die zahlreichen Ver
besserungsvorschlige.
Mein weiterer Dank gilt Herrn Pro~essor Or.-Ing. G.
Pritschow, dem Oirektor des Instituts ~ur Steuerungstechnik
der Werkzeugmaschinen und Fertigungseinrichtungen an der
Universitit Stuttgart, ~ur die Obernahme des Mitberichts, der
eingehenden Ourchsicht der Arbeit und die sich daraus
ergebenden Verbesserungsvorschlige.
Weiterhin mochte ich mich bei allen Kollegen der
Forschungsgruppe "Kunstliche Intelligenz und Sprachverarbei-
tung" sowie den Mitarbeitern des Zeichenburos ~Or ihre Hil~e
bedanken. Oem Leiter der Abteilung "Neue In~ormations- und
Kommunikationssysteme" am lAO, Herrn Oipl.-Math. K.-P.
Fihnrich, danke ich da~ur, daB er mir die Forschungsarbeiten
au~ dem Gebiet "Sprachverarbeitung" ermoglichte.
Nicht zuletzt mochte ich mich bei meiner Frau Ingrid und bei
meinen Kindern Isabelle und Alexander bedanken, die die ~ami
liiren Belastungen eines Promotionsver~ahrens mit groBer Ge
duld ertragen haben.
stuttgart, im September 1986 Gerhard Rigoll
lnhaltsverzeichnis
o Abkurzungsverzeichnis 12
Einleitung 16
2 Spracherkennung als Teilgebiet der
Mensch-Maschine-Komrnunikation 19
2.1 Anwendungsbereiche der maschinellen
Spracherkennung 20
2.2 Stand der Forschung und Oarstellung der
wesentlichen Forschungsrichtungen 22
2.3 Technische Probleme der maschinellen
Spracherkennung 25
2.4 Bedeutung der Systemtheorie fur die
Spracherkennung 27
2.5 Grundlagen der Spracherzeugung 29
3 Merkmalsextraktion 34
3.1 Verwendete Hard- und Softwarekonfiguration 34
3.2 Verwendeter Testwortschatz 34
3.3 ~insatz rekursiver Parameterschitzverfahren
zur Ermittlung von Vokaltraktparametern 36
3.3.1 Rekursive LPC-Parameterschitzung 39
3.3.2 Einsatz von Kalman-Filtern zur LPC
~arameterbestimrnung 41
3.3.3 Ermittlung von Formanten mit rekursiven
Verfahren 48
3.3.4 Einsatz eines erweiterten Kalman-Filters zur
direkten Ermittelung der Formanten aus dem
,5prachsignal 50
3.4 Ermittlung phonetischer Parameter mit
Hilfe wahrscheinlichkeitstheoretischer und
statistischer Verfahren 61
- 10 -
3.4.1 Unterscheidung der Lautklassen stimmhaTtl
stimmlos/nasal/Pause 63
3.4.2 VokalklassiTizierung 72
3.5 ZusammenTassung 78
4 AbstandsmaBe und Wortklassifizierung 80
4.1 Zeitnormierung 80
4.1.1 Lineare Zeitnormierung 81
4.1.2 Nichtlineare Zeitnormierung mit HilTe der
dynamischen Programmierung 82
4.2 AbstandsmaBe Tur LPC-Parameter 83
4.2.1 KlassiTizierung mit HilTe der Oynamik
zeitvarianter ObertragungsTunktionen 84
4.2.1.1 KlassiTizierung unter Verwendung von
Sprungantworten 84
4.2.1.2 Klassifizierung unter Verwendung von
parametrischen EmpfindlichkeitsTunktionen B7
4.2.1.3 AbstandsmaBe im Zustandsraum 90
4.2.2 Spektrale LPC-AbstandsmaBe 93
4.2.3 Vergleich von spektralen und systemtheore
tischen LPC-AbstandsmaBen 95
4.3 AbstandsmaBe fur phonetische Parameter auf
der Basis wahrscheinlichkeitstheoretischer
und stochastischer Madelle 98
4.3.1 Wahrscheinlichkeitstheoretisches AbstandsmaB 99
4.3.2 Klassifizierung mit HilTe von Markov-Modellen 103
4.3.2.1 Ermittlung der Modellparameter 108
4.3.2.2 Klassifizierungsalgorithmen 113
4.3.3 Vergleich von wahrscheinlichkeitstheore
tischem AbstandsmaB und Markov-Modellen 118
4.4 Zusammenfassung 119
5 Worterkennung mit hybridem Ansatz 121
6 ZusammenTassung und Ausblick 123
- , 1 -
7 Literaturverzeichnis 126
o Abkyrzyngsverzeichnis
Abkur- Oimen- Erk1arung
zung sion
Alk) - zeitvariante Systemmatrix der Zustandsg1ei
chungen zum Abtastzeitpunkt k
A - Matrix von Resonatorkoe~~izienten des Resona
j tors j
-
a i-ter LPC-Parameter
i
A - Vektor der LPC-Parameter; Re~erenzvektor
A * - modi~izierter LPC-Parametervektor
**
A - modi~izierter LPC-Parametervektor
AI.li,k) - Vektor von nicht1inearen System~unktionen des
Zustandsvektors .li zum Abtastzeitpunkt k
B Hz Bandbreite des i-ten Resonators
i
£ - Parametervektor eines Re~erenzsigna1s
£. - modi~izierter Vektor der Resonatorkoe~fizien
J ten beim j-ten Rekursionsschritt
Clk) - zeitvariante MeBmatrix der Zustandsg1eichun
gen zum Abtastzeitpunkt k
C - Kovarianzmatrix fur Lautk1assenparameter der
K K1asse K
c - Konstante zur Verhinderung von numerischen
Prob1emen
Sl.li, k) - Vektor von nicht1inearen MeBfunktionen des
Zustandsvektors .li zum Abtastzeitpunkt k
c - 1. Koeffizient des i-ten Resonators
i
S. - Vektor von partie11en Ab1eitungen der 1. Re
J sonatorkoeffizienten beim j-ten Rekursions
schritt
0 :. Abstandsfunktion
d - 2. Koef~izient des i-ten Resonators
i
.9.. - Vektor von partie11en Ab1eitungen der 2. Re
J sonatorkoef~izienten beim j-ten Rekursions
schritt
DP .-. dynamische Programmierung
E 10garithmische Signa1energie
el k) - LPC-Schatzfeh1er zum Abtastzeitpunkt k
e I k) - parametrische Empfind1ichkeits~unktion des
j j-ten LPC-Parameters zum Abtastzeitpunkt k