6 6 [}J IT] IT] [IJ = Forschung und Praxis Band 99 Berichte aus dem Fraunhofer-Institut fOr Produktionstechnik und Automatisierung (lPA), Stuttgart, Fraunhofer-Institut fOr Arbeitswirtschaft und Organisation (lAO), Stuttgart, und Institut fOr Industrielle Fertigung und Fabrikbetrieb der Universitat Stuttgart Herausgeber: H. J. Warnecke und H.-J. Bullinger Gerhard Rigoll Maschinelle Spracherkennung zur Verbesserung der Mensch-Maschine-Schnittstelle Mit 55 Abbildungen Springer-Verlag Berlin Heidelberg New York Tokyo 1986 Dipl.-Ing. Gerhard Rigoll Fraunhofer-Institut far Arbeitswirtschaft und Organisation (lAO), Stuttgart Dr.-Ing. H. J. Warnecke o. Professor an der Universitlit Stuttgart Fraunhofer-Institut far Produktionstechnik und Automatisierung (IPAi, Stuttgart Dr.-Ing. habil. H.-J. Bullinger o. Professor an der Universitlit Stuttgart Fraunhofer-Institut far Arbeitswirtschaft und Organisation (lAO), Stuttgart 093 ISBN-13:978-3-540-17350-2 e-ISBN-13:978-3-642-82975-8 001: 10.1007/978-3-642-82975-8 Das Werk isl urheberrechtlich geschatzt. Die dadurch begriindeten Rechte, insbesondere die der Obersetzung, des Nachdrucks, der Enlnahme von Abbildungen, der Funksendung, der Wiedergabe auf photomechanischem oder lihnlichem Wege und der Speicherung in Datenverarbeitungsanlagen bleiben, auch bei nur auszugsweiser Verwendullg, vorbehalten. Die Vergatungsanspriiche des § 54, Abs. 2 UrhG werden durch die ..V erwertungsgesellschaft Wort", Manchen, wahrgenommen. © Springer-Verlag, Berlin, Heidelberg 1986. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daB solche Namen im Sinne der Warenzeichen-und Markenschulz-Geselzgebung als (rei zu betrachten wliren und daher von jederrnann benutzt werden darften. Gesamtherstellung: Copydruck GmbH, Heimsheim 2362/3020-543210 GELEITWORT DES HERAUSGEBERS Die Umformtechnik zeichnet sich durch sehr gute Werkstoffaus wertung und hohe Mengenleistung in der Serienfertigung gegen Uber anderen Fertigungsverfahren aus, wobei Beibehaltung der Masse, Anderung der Festigkeitseigenschaften wahrend eines Vor gangs und elastische Rlickfederung der Werkstlicke nach einem Vorgang wesentliche Merkmale sind. Weiter sind die benatigten Krafte, Arbeiten und Leistungen sehr viel graBer als z.B. bei spanenden Verfahren. Die sichere Beherrschung eines Verfahrens in der industriellen Fertigung und die zunehmende Forderung nach Vermeidung bzw. Minimierung spanender Nacharbeit erzwingen die geschlossene Betrachtung des Systems "Umformende Fertigung" unter zentraler BerUcksichtigung plastizitatstheoretischer, werkstoffkundlicher und tribologischer Grundlagen. Das Institut fUr Umformtechnik der Universitat Stuttgart stellt entsprechend Forschung und Entwicklung zum einen auf die Erar beitung von Grundlagenwissen in diesen Bereichen ab, zum anderen untersucht und entwickelt es Verfahren unter Anwendung speziel ler MeBtechniken mit dem Ziel einer genauen quantitativen Er mittlung des Einflusses der Parameter von Vorgang, Werkstoff, Werkzeug und Maschine. Die Behandlung von Problemen des Maschi nenverhaltens, der Maschinenkonstruktion sowie der Werkzeugaus legung und -beanspruchung, der Auswahl hochbeanspruchbarer, verschleiBfester Werkzeugbaustoffe und schlieBlich der Tribo logie gehart entsprechend ebenfalls zum Arbeitsgebiet, das durch die Erfassung organisatorischer und betriebswirtschaft licher Fragen abgerundet wird. 1m Rahmen der "Berichte aus dem Institut fUr Umformtechnik" er scheinen in zwangloser Folge j.ahrlich mehrere Bande, in denen Uber einzelne Themen ausflihrlich berichtet wird. Dabei handelt es sich vornehmlich um AbschluBberichte von Forschungsvorhaben, Dissertationen, aber gelegentlich auch urn andere Texte. Diese Berichte sollen den in der Praxis stehenden Ingenieuren und Wissenschaftlern zur Weiterbildung dienen und eine Hilfe bei der Lasung umformtechnischer Aufgaben sein. FUr die Studieren- den bieten sie die Moglichkeit zur Vertiefung der Kenntnisse. Die seit zwei Jahrzehnten bewahrte freundschaftliche Zusammen arbeit mit dem Springer~Verlag sehe ich als beste Voraussetzung fUr das Gelingen dieses Vorhabens an. Kurt Lange Vorwort Die vorliegende Arbeit entstand wihrend meiner Titigkeit in der Forschungsgruppe "Kunstliche Intelligenz und Sprachverar beitung" am Fraunho~er-Institut ~ur Arbeitswirtscha~t und Or ganisation (lAO) in stuttgart. Herrn Pro~essor Or.-Ing. habil. H.-J. Bullinger, dem Oirektor des Fraunho~er-Instituts ~ur Arbeitswirtscha~t und Organisa tion (lAO) und Leiter des Lehrstuhls ~ur Arbeitswissenscha~t am Institut ~ur Industrielle Fertigung und Fabrikbetrieb (IFF) der Universitit stuttgart, danke ich herzlich ~Or die groBzOgige Forderung der Arbeit und die zahlreichen Ver besserungsvorschlige. Mein weiterer Dank gilt Herrn Pro~essor Or.-Ing. G. Pritschow, dem Oirektor des Instituts ~ur Steuerungstechnik der Werkzeugmaschinen und Fertigungseinrichtungen an der Universitit Stuttgart, ~ur die Obernahme des Mitberichts, der eingehenden Ourchsicht der Arbeit und die sich daraus ergebenden Verbesserungsvorschlige. Weiterhin mochte ich mich bei allen Kollegen der Forschungsgruppe "Kunstliche Intelligenz und Sprachverarbei- tung" sowie den Mitarbeitern des Zeichenburos ~Or ihre Hil~e bedanken. Oem Leiter der Abteilung "Neue In~ormations- und Kommunikationssysteme" am lAO, Herrn Oipl.-Math. K.-P. Fihnrich, danke ich da~ur, daB er mir die Forschungsarbeiten au~ dem Gebiet "Sprachverarbeitung" ermoglichte. Nicht zuletzt mochte ich mich bei meiner Frau Ingrid und bei meinen Kindern Isabelle und Alexander bedanken, die die ~ami liiren Belastungen eines Promotionsver~ahrens mit groBer Ge duld ertragen haben. stuttgart, im September 1986 Gerhard Rigoll lnhaltsverzeichnis o Abkurzungsverzeichnis 12 Einleitung 16 2 Spracherkennung als Teilgebiet der Mensch-Maschine-Komrnunikation 19 2.1 Anwendungsbereiche der maschinellen Spracherkennung 20 2.2 Stand der Forschung und Oarstellung der wesentlichen Forschungsrichtungen 22 2.3 Technische Probleme der maschinellen Spracherkennung 25 2.4 Bedeutung der Systemtheorie fur die Spracherkennung 27 2.5 Grundlagen der Spracherzeugung 29 3 Merkmalsextraktion 34 3.1 Verwendete Hard- und Softwarekonfiguration 34 3.2 Verwendeter Testwortschatz 34 3.3 ~insatz rekursiver Parameterschitzverfahren zur Ermittlung von Vokaltraktparametern 36 3.3.1 Rekursive LPC-Parameterschitzung 39 3.3.2 Einsatz von Kalman-Filtern zur LPC ~arameterbestimrnung 41 3.3.3 Ermittlung von Formanten mit rekursiven Verfahren 48 3.3.4 Einsatz eines erweiterten Kalman-Filters zur direkten Ermittelung der Formanten aus dem ,5prachsignal 50 3.4 Ermittlung phonetischer Parameter mit Hilfe wahrscheinlichkeitstheoretischer und statistischer Verfahren 61 - 10 - 3.4.1 Unterscheidung der Lautklassen stimmhaTtl stimmlos/nasal/Pause 63 3.4.2 VokalklassiTizierung 72 3.5 ZusammenTassung 78 4 AbstandsmaBe und Wortklassifizierung 80 4.1 Zeitnormierung 80 4.1.1 Lineare Zeitnormierung 81 4.1.2 Nichtlineare Zeitnormierung mit HilTe der dynamischen Programmierung 82 4.2 AbstandsmaBe Tur LPC-Parameter 83 4.2.1 KlassiTizierung mit HilTe der Oynamik zeitvarianter ObertragungsTunktionen 84 4.2.1.1 KlassiTizierung unter Verwendung von Sprungantworten 84 4.2.1.2 Klassifizierung unter Verwendung von parametrischen EmpfindlichkeitsTunktionen B7 4.2.1.3 AbstandsmaBe im Zustandsraum 90 4.2.2 Spektrale LPC-AbstandsmaBe 93 4.2.3 Vergleich von spektralen und systemtheore tischen LPC-AbstandsmaBen 95 4.3 AbstandsmaBe fur phonetische Parameter auf der Basis wahrscheinlichkeitstheoretischer und stochastischer Madelle 98 4.3.1 Wahrscheinlichkeitstheoretisches AbstandsmaB 99 4.3.2 Klassifizierung mit HilTe von Markov-Modellen 103 4.3.2.1 Ermittlung der Modellparameter 108 4.3.2.2 Klassifizierungsalgorithmen 113 4.3.3 Vergleich von wahrscheinlichkeitstheore tischem AbstandsmaB und Markov-Modellen 118 4.4 Zusammenfassung 119 5 Worterkennung mit hybridem Ansatz 121 6 ZusammenTassung und Ausblick 123 - , 1 - 7 Literaturverzeichnis 126 o Abkyrzyngsverzeichnis Abkur- Oimen- Erk1arung zung sion Alk) - zeitvariante Systemmatrix der Zustandsg1ei chungen zum Abtastzeitpunkt k A - Matrix von Resonatorkoe~~izienten des Resona j tors j - a i-ter LPC-Parameter i A - Vektor der LPC-Parameter; Re~erenzvektor A * - modi~izierter LPC-Parametervektor ** A - modi~izierter LPC-Parametervektor AI.li,k) - Vektor von nicht1inearen System~unktionen des Zustandsvektors .li zum Abtastzeitpunkt k B Hz Bandbreite des i-ten Resonators i £ - Parametervektor eines Re~erenzsigna1s £. - modi~izierter Vektor der Resonatorkoe~fizien J ten beim j-ten Rekursionsschritt Clk) - zeitvariante MeBmatrix der Zustandsg1eichun gen zum Abtastzeitpunkt k C - Kovarianzmatrix fur Lautk1assenparameter der K K1asse K c - Konstante zur Verhinderung von numerischen Prob1emen Sl.li, k) - Vektor von nicht1inearen MeBfunktionen des Zustandsvektors .li zum Abtastzeitpunkt k c - 1. Koeffizient des i-ten Resonators i S. - Vektor von partie11en Ab1eitungen der 1. Re J sonatorkoeffizienten beim j-ten Rekursions schritt 0 :. Abstandsfunktion d - 2. Koef~izient des i-ten Resonators i .9.. - Vektor von partie11en Ab1eitungen der 2. Re J sonatorkoef~izienten beim j-ten Rekursions schritt DP .-. dynamische Programmierung E 10garithmische Signa1energie el k) - LPC-Schatzfeh1er zum Abtastzeitpunkt k e I k) - parametrische Empfind1ichkeits~unktion des j j-ten LPC-Parameters zum Abtastzeitpunkt k