Kristian Kroschel Statistische Informationstechnik Springer-Verlag Berlin Heidelberg GmbH ONLINE LIBRARY http:// www.springer.de/ eng i ne-de/ Kristian Kroschel Statistische Informationstechnik Signal- und Mustererkennung, Parameter- und Signalschätzung 4., neu bearbeitete Auflage Mit 130 Abbildungen Springer Prof. Dr.-Ing. Kristian Kroschel Universität Karlsruhe Institut für Nachrichtentechnik Kaiserstr. 12 76128 Karlsruhe E-Mail: kroschel@int. uni -karlsruhe.de und Fraunhofer-Institut für Informations- und Datenverarbeitung (IITB) Fraunhoferstr. 1 76131 Karlsruhe E-Mail: [email protected] Ursprünglich erschienen unter dem Titel "Statistische Nachrichtentheorie" ISBN 978-3-540-40237-4 ISBN 978-3-662-10041-7 (eBook) DOI 10.1007/978-3-662-10041-7 Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http://dnb.ddb.de > abrufbar. Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksen dung, der Mikroverfilmung oder der Vervielfaltigung auf anderen Wegen und der Speicherung in Daten verarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfaltigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzli chen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. http://www.springer.de © Springer-Verlag Berlin Heidelberg 1973, 1986, 1996 and 2004 Ursprünglich erschienen bei Springer Verlag Berlin Heidelberg New Yo rk 2004 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürfen. Sollte in diesem Werk direkt oder indirekt auf Gesetze, Vorschriften oder Richtlinien (z.B. DIN, VDI, VDE) Bezug genommen oder aus ihnen zitiert worden sein, so kann der Verlag keine Gewähr für die Richtigkeit, Vollständigkeit oder Aktualität übernehmen. Es empfiehlt sich, gegebenenfalls für die eigenen Arbeiten die vollständigen Vorschriften oder Richtlinien in der jeweils gültigen Fassung hinzuzuziehen. Buchherstellung: PTP-Berlin Protago-TeX-Production GmbH, Berlin Einbandgestaltung: medio technologies AG, Berlin Gedruckt auf säurefreiem Papier 7/3020Yu -5 4 3 2 1 0 - Vorwort Das vorliegende Buch stellt die 4. Auflage des Buches mit dem Titel Statistische Nach richtentheorie als Studienausgabe dar. Der Inhalt beschränkt sich auf die Kernfragen der Themenbereiche Detektion und Estimation und berücksichtigt neuere Entwicklungen in der Technik. Dazu zählt die Tatsache, dass Systeme der Informationstechnik wegen der Genauigkeitsanforderungen bei der Realisierung und der daraus folgenden Kosten nur in digitaler Technik realisiert werden. Deratige digitale Systeme findet man heute bei vielen Massenanwendungen wie der Mobiltelefonie oder der Fahrzeugnavigation. Eine Studienausgabe sollte auch auf Anschaulichkeit Wert legen und als Lehrbuch Handfertigkeiten vermitteln. Deshalb findet man im Text eingestreute Übungsaufgaben und Veranschaulichungen durch Simulationen mit MATLAB®, um den studentischen Le sern die Möglichkeit zu bieten, sich den Stoff selbständig zu erarbeiten und gegebenenfalls auf Prüfungen vorzubereiten. Dabei geht es nicht um routinemäßiges Einsetzen von Zah lenwerten in vorgegebene Formeln, vielmehr soll jede gelöste Aufgabe eine weitere Einsicht in das Stoffgebiet liefern. Die Lösungen wurden deshalb nicht beigefügt, um ein tieferes Nachdenken nicht durch einen vorzeitigen Blick in die Lösungen abzubrechen. Man findet Musterlösungen und Hinweise zu den Aufgaben über die Internetseite unter http://www.springer.de/cgi/svcat/bag_generate.pl?ISBN=3-540-40237-3. Es wird dabei vorausgesetzt, dass der Leser Kenntnisse auf den Gebieten Systemtheorie einschließlich Fourier-und Laplace- bzw. z-Transformation besitzt und auch über Grund kenntnisse der Übertragungstechnik verfügt. Auf die in diesem Buch benötigten Kenntnisse der Statistik wird dagegen etwas ausführlicher eingegangen, auch wenn die im Grundstu dium der Informationstechnik vermittelten Grundkenntnisse der Statistik, z.B. [Kre68], [Pap65], [Han83], vorausgesetzt werden. Das in diesem Buch zusammengefasste Material entstammt Vorlesungen in Karlsruhe und Harnburg sowie Vorträgen in der Industrie und an Einrichtungen zur Weiterbildung im Bereich der Ingenieur- und Naturwissenschaften. Inhaltlich wendet es sich an Studieren de höheren Semesters der Fachrichtungen Informationstechnik und Informatik sowie der Elektrotechnik und Regelungstechnik oder auch der Technomathematik Es wird auch für Ingenieure und Naturwissenschaftler von Interesse sein, die aufgrundihres Arbeitsgebietes einen einführenden Einblick in die statistische Informationstechnik gewinnen wollen. Für weitergehende Betrachtungen auf diesem Gebiet und spezielle Anwendungen, z.B. in der Radartechnik oder der Spektralschätzung, sei auf die entsprechende Literatur [Sko62], [Woo64], [Ber65], [Nah68], [Pil93] verwiesen. Im ersten Kapitel werden die hier behandelten Begriffe Detektion und Estimation eingeführt, wobei immer auf praktische Anwendungen Bezug genommen wird. Eine Zusammenfassung der hier benötigten Begriffe der Statistik stellt das zweite Ka pitel dar. Leider gibt es keine allgemein anerkannte Nomenklatur für diese Begriffe. In der DIN 13 303 wird die Schreibweise für Beschreibungsgrößen von Zufallsvariablen einge führt, die in diesem Buch auf Zufallsprozesse erweitert wird. Am Schluss stehen Modelle zur Beschreibung stationärer und instationärer gestörter Zufallsprozesse. VI Vorwort Obwohl in diesem Buch vorwiegend zeitdiskrete Signale behandelt werden, die durch Abtastung aus analogen Signalen enstehen, so dass bereits eine für Aufgaben der sta tistischen Informationstechnik geeignete Darstellungsform vorliegt, wird dieses Thema im dritten Kapitel aufgegriffen, um z.B. die auf sinusförmigen Größen beruhende Darstellung von digital modulierten Signalen als Vektoren verstehen zu können. Die einfache und multiple Detektion mit ihren verschiedenen Optimalitätskriterien werden im vierten Kapitel behandelt. Dazu zählt auch, die Fehlerwahrscheinlichkeit zu minimieren. Bei vorgegebener Signalenergie werden dazu optimale Signalvektorkonfigura tionen und deren Entscheidungsgebiete bestimmt. Aufbauend auf den im vierten Kapitel behandelten Grundlagen für die Detektionstheo rie werden im fünften Kapitel Systeme für die Signal- und Mustererkennung dargestellt: Neben dem altbekannten Korrelationsempfänger auch neuere Ansätze wie künstliche neu ronale Netze oder auf der Fuzzy-Logik basierende Systeme sowie Clusterverfahren, die bei der Mustererkennung eingesetzt werden. Während der erste Teil dieses Buches sich mit der Detektion beschäftigt, wird im zwei ten Teil auf die Estimation, d.h. die Parameter- und Signalschätzung näher eingegangen. Im sechsten Kapitel wird die Parameterschätzung behandelt. Hier findet man die Bayes und die Maximum-Likelihood-Schätzer. Schließlich werden die Grenzen der Schätzgenau igkeit an Hand der Cramer-Rao-Ungleichung diskutiert. Das siebte Kapitel stellt eine Einführung in die lineare Parameterschätzung dar, die auch bei der Signalschätzung eine Rolle spielt, da in beiden Fällen das Orthogonalitäts prinzip zur Herleitung der Schätzsysteme verwendet wird. Der Rest des Buches befasst sich mit Problemen der Signa/schätzung. Im achten Kapi tel werden die Wiener-Filter behandelt. Dabei wird auf die drei Formen der Signalschät zung Filterung, Prädiktion und Interpolation eingegangen. Anwendungen dazu sind die Kompression von Quellensignalen mit Hilfe von DPCM und die Geräuschreduktion von gestörten Sprachsignalen. Das neunte Kapitel ist den Kaiman-Filtern als den Systemen zur Schätzung instatio närer Prozesse gewidmet. In den Aufgaben findet man als Anwendung die Echokompen sation bei der Datenkommunikation. An dieser Stelle möchte ich all denen danken, die zum Entstehen dieses Buches durch Diskussionen und Hinweise innerhalb und außerhalb von Vorlesungen und Kursen und durch Rezensionen beigetragen haben. Bei der technischen Erstellung, z.B. der Abbil dungen, unterstützten mich u.a. Frau Eva-Maria Schubart und Frau Angelika Olbrich. Den Herren Dipl.-Ing. Dirk Bechler, Dipl.-Ing. Martin Heckmann und Dipl.-Ing. Markus Schlosser danke ich sehr herzlich für Diskussionen über inhaltliche Darstellungen und die kritische Durchsicht des Textes. Unbeschadet dieser Mitwirkung liegt die Verantwortung für die Form der Darstellung, die Auswahl des Stoffes und die Aufgaben bei mir. Hinweise auf Unstimmigkeiten und Verbesserungsvorschläge sind stets willkommen und werden bei der nächsten Auflage Beachtung finden. Mein besonderer Dank gilt meiner Frau, die mir die vielen Stunden nachsah, die ich über die übliche Arbeitszeit hinaus beim Schreiben dieses Buches verbrachte. Dem Verlag gilt mein Dank für die Ermutigung zu dieser neuen Konzeption des Buches und die gute Zusammenarbeit bei seiner Erstellung. Karlsruhe, im April 2003 Kristian Krasehel Inhaltsverzeichnis 1 Detektion und Estimation 1 1.1 Detektion . . . . . . . . 3 1.1.1 Signalerkennung. 3 1.1.2 Mustererkennung 4 1.2 Estimation . . . . . . . . 6 1.2.1 Parameterschätzung 6 1.2.2 Signalschätzung . 7 1.3 Entwurfsansätze . . . . . . 8 2 Grundbegriffe der Statistik 11 2.1 Zufallsvariable .. 11 2.2 Zufallsprozesse ..... . 15 2.3 Transformationen . . . . . 18 2.3.1 Transformation von Zufallsvariablen. 18 2.3.2 Transformation von Prozessen 19 2.4 Aufgaben ............ . 21 3 Signaldarstellung durch Vektoren 23 3.1 Vektordarstellung determinierter Signale 23 3.2 Darstellung von Prozessen durch Vektoren . . . . 24 3.2.1 Diskrete Karhunen-Loeve-Transformation. 26 3.2.2 Diskrete Cosinus-Transformation ... 28 3.3 Darstellung von instationären Prozessen . . . 29 3.3.1 Definition der Wavelet-Transformation 31 3.3.2 Diskrete Wavelet-Transformation . . . 32 3.3.3 Basisfunktionen für die Wavelet-Transformation 33 3.3.4 Wavelet-Transformation mit Hilfe von Filterbänken 35 3.3.5 Beispiel für ein Analysefilter ............ . 36 3.3.6 Implementation der diskreten Wavelet-Transformation 39 3.4 Vektordarstellung von M Signalen . . . . . 40 3.4.1 Analyse und Synthese von Signalen 40 3.4.2 Gram-Schmidt-Verfahren . 42 3.5 Irrelevante Information 43 3.6 Vektorkanäle 44 3. 7 Aufgaben . . . . . . . 45 4 Signal- und Mustererkennung 47 4.1 Binäre Detektion . . . . . . . . . . . . . . . . . 47 4.1.1 Bayes-Kriterium ............. . 48 4.1.2 Maximum-a-posteriori-Kriterium (MAP) 50 VIII Inhaltsverzeichnis 4.1.3 Neyman-Pearson-Kriterium .. 54 4.1.4 Der Likelihood-Verhältnis-Test . 55 4.1.5 Empfängerarbeitscharakteristik 56 4.1.6 Entscheidungsräume bei binärer Detektion 58 4.1. 7 Rückweisung . . . . . . . . . . . . . 64 4.2 Multiple Detektion . . . . . . . . . . . . . . . 67 4.2.1 MAP-Prinzip für multiple Detektion . 68 4.2.2 Entscheidungsregel bei Gaußprozessen 69 4.2.3 Wahl der Signalvektoren . . . . . . . . 71 4.2.4 Signalvektorkonfigurationen ..... . 72 4.2.5 Abschätzung der Fehlerwahrscheinlichkeit 79 4.2.6 Vergleich der Signalvektorkonfigurationen . 82 4.3 Klassifikation durch Cluster ...... . 84 4.3.1 Vektorquantisierer ....... . 88 4.3.2 Cluster mit scharfen Partitionen . 90 4.3.3 Cluster mit unscharfen Partitionen 93 4.4 Klassifikation ohne Kenntnis der Dichtefunktion 97 4.4.1 Schätzung der A-posteriori-Wahrscheinlichkeiten . 99 4.4. 2 Nächster-Nachbar-Klassifikator 101 4.4.3 Parzen-Fenster-Klassifikator . 103 4.4.4 Mehrreferenzen-Klassifikation 104 4.5 Vergleich der Verfahren . 105 4.6 Aufgaben . . . . . . . . . . . . ... 106 5 Systeme für die Signal- und Mustererkennung 109 5.1 Signalerkennung mit Korrelationsempfängern . 109 5.2 Polynomklassifikator .............. . 116 5.3 Klassifikatoren als neuronale Netze ...... . 119 5.3.1 Strukturen künstlicher neuronaler Netze 121 5.3.2 Mehrschichten-Perzeptron ....... . 122 5.3.3 Koeffizienten des zweischichtigen Perzeptrons . 125 5.4 Klassifikation mit Fuzzy-Logik ......... . 129 5.4.1 Fuzzifizierung der Eingangsgrößen ... . 131 5.4.2 Fuzzy-Inferenz mit Hilfe einer Regelbasis 132 5.4.3 Defuzzifizierung des Inferenz-Ergebnisses 136 5.5 Vergleich der Klassifikationssysteme . 137 5.6 Aufgaben . . . . . . . . . . . . . 138 6 Parameterschätzung {Estimation) 141 6.1 Beurteilungskriterien für Schätzwerte ...... . 142 6.2 Parameterschätzung mit A-priori-Information .. 144 6.2.1 Kostenfunktion des quadratischen Fehlers. 146 6.2.2 Kostenfunktion des absoluten Fehlers ... 147 6.2.3 Kostenfunktion mit konstanter Gewichtung großer Fehler 148 6.2.4 Invarianz des Bayes-Schätzwertes bezüglich der Kostenfunktion 149 6.3 Parameterschätzung ohne A-priori-Information . . . . . . . . 151 6.4 Minimaler mittlerer quadratischer Schätzfehler . . . . . . . . . . . . . . 157 6.4.1 Minimale Fehlervarianz bei fehlender A-priori-Dichte . . . . . . 158 6.4.2 Minimaler mittlerer quadratischer Fehler bei bekannter A-priori- Dichte .................................. 161 Inhaltsverzeichnis IX 6.5 Multiple Parameterschätzung 162 6.5.1 Schätzverfahren 162 6.5.2 Schätzfehler 164 6.6 Aufgaben ...... . 164 7 Lineare Parameterschätzsysteme 167 7.1 Gauß-Markoff-Theorem ........... . 167 7.2 Additive unkorrelierte Störungen ..... . 172 7.3 Parametervektor ohne A-priori-Information . 174 7.4 Verbesserung der Schätzwerte ...... . 174 7.5 Schätzsystem als lineares Transversalfilter 178 7.6 Adaptive Parameterschätzung 182 7.7 Aufgaben .......... . 186 8 Wiener-Filter 189 8.1 Zeitkontinuierliche Wiener-Filter. 191 8.1.1 Aufgabenstellung und Annahmen . 191 8.1.2 Die Wiener-Hopf-Integralgleichung 193 8.1.3 Lösung der Wiener-Hopf-Integralgleichung 194 8.2 Eigenschaften von Wiener-Filtern ........ . 197 8.2.1 Schätzung einfacher Signalprozesse ... . 197 8.2.2 Wiener-Filterund konventionell entworfene Filter 204 8.3 Zeitdiskrete Wiener-Filter ............... . . 207 8.3.1 Minimaler mittlerer quadratischer Schätzfehler . . 210 8.4 Anwendungen von Wiener-Filtern ........ . . 211 8.4.1 DPCM-Codierer zur Redundanzreduktion 211 8.4.2 Geräuschreduktion bei Sprachübertragung 217 8.5 Aufgaben ..................... . 220 9 Kaiman-Filter 223 9.1 Aufgabenstellung und Annahmen . 224 9.2 Prädiktion ............ . . 225 9.2.1 Prädiktion um einen Schritt . 225 9.2.2 Prädiktion für beliebig viele Schritte . 235 9.3 Filterung . . . . . . . . . . . . . . . . . . . . . 240 9.4 Interpolation . . . . . . . . . . . . . . . . . . 243 9.4.1 Interpolation von einem festen Zeitpunkt aus . 244 9.4.2 Interpolation für einen festen Zeitpunkt . . . 250 9.4.3 Interpolation über einen festen Zeitabstand . 255 9.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . 258 Literaturverzeichnis 259 Index 265 1 Detektion und Estimation Die statistische Informationstechnik befasst sich mit so unterschiedlichen Aufgaben wie der Extraktion von verrauschten Daten, die über einen gestörten Kanal übertragen wur den, der Erkennung gesprochener Wörter, der Schätzung der Impulsantwort eines un bekannten Übertragungskanals unter Störeinfluss, der Vorhersage des Signalverlaufs zum Laufzeitausgleich bei der Quellencodierung oder der Kompensation von akustischen Echos, die beim Gegensprechen über Freisprecheinrichtungen entstehen können. Zur Veranschaulichung zeigt dazu Abb. 1.1 zwei Musterfunktionen r( t) eines verrausch ten binären Datenprozesses, bei dem die Zustände low und high bzw. - 1 und +1 durch einen negativen bzw. positiven Rechteckimpuls s(t) codiert werden. Die beiden Muster funktionen unterscheiden sich durch das Signal-zu-Rauschverhältnis (SNR), das SNR = 3 dB bzw. SNR = -3 dB beträgt. Die Aufgabe der Signalerkennung im Rauschen besteht darin, zu jedem Zeittakt T mit möglichst geringer Fehlerwahrscheinlichkeit zu entscheiden, welcher dieser Zustände vorliegt. 2 0 I 2 3 4 5 6 7 0 I 2 3 4 5 6 7 8 9 10 II TaktT TaktT Abb. 1.1: Binärer gestörter Datenprozess für zwei Signal-zu-Rauschverhältnisse Ein Beispiel zur Mustererkennung zeigt Abb. 1.2: Von einer Sprecherirr und einem Sprecher wurde das Wort "Sprache" artikuliert. Es ist Aufgabe der Mustererkennung, trotz der verschiedenen Signalverläufe dasselbe Wort zu erkennen. Diese Detektionsaufgabe wird noch schwerer, wenn das Sprachsignal z.B. durch Umgebungsgeräusche gestört wird. Gemeinsam ist allen genannten Aufgaben, dass ein Empfänger zu entwerfen ist, der aus dem gestörten Empfangs- oder Messsignal die darin steckende Information durch Schätzung extrahiert. Zur Veranschaulichung zeigt Abb. 1.3 das Modell der Informati onsübertragung. Beim ersten Beispiel emittiert die Quelle die binären Daten, denen im Sender das rechteckförmige Zeitsignal zugeordnet wird, so dass das Sendesignal s(t) ent steht. Im Kanal überlagern sich die Störungen, so dass dem Empfänger zur Extraktion der Quellendaten nur das gestörte Signal zur Verfügung steht. Beim zweiten Beispiel liefert die Quelle die Wortbedeutung, die hier dem Wort "Sprache" entspricht. Die Umsetzung in K. Kroschel, Statistische Informationstechnik © Springer-Verlag Berlin Heidelberg 2004