ebook img

Soft-Computing : mit Neuronalen Netzen, Fuzzy-Logic und evolutionären Algorithmen ; mit 27 Tabellen PDF

566 Pages·2006·9.418 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Soft-Computing : mit Neuronalen Netzen, Fuzzy-Logic und evolutionären Algorithmen ; mit 27 Tabellen

eXamen.press eXamen.pressisteineReihe,dieTheorieund PraxisausallenBereichenderInformatikfür dieHochschulausbildungvermittelt. Wolfram-Manfred Lippe Soft-Computing mit Neuronalen Netzen, Fuzzy-Logic und Evolutionären Algorithmen Mit227Abbildungenund27Tabellen 123 Wolfram-ManfredLippe InstitutfürInformatik UniversitätMünster Einsteinstr.62 48149Münster [email protected] BibliografischeInformationderDeutschenBibliothek DieDeutscheBibliothekverzeichnetdiesePublikationinderDeutschen Nationalbibliografie;detailliertebibliografischeDatensindimInternetüber http://dnb.ddb.deabrufbar. ISSN1614-5216 ISBN-103-540-20972-7SpringerBerlinHeidelbergNewYork ISBN-13978-3-540-20972-0SpringerBerlinHeidelbergNewYork DiesesWerkisturheberrechtlichgeschützt.DiedadurchbegründetenRechte,insbesondere diederÜbersetzung,desNachdrucks,desVortrags,derEntnahmevonAbbildungenund Tabellen,derFunksendung,derMikroverfilmungoderderVervielfältigungaufanderenWe- genundderSpeicherunginDatenverarbeitungsanlagen,bleiben,auchbeinurauszugsweiser Verwertung,vorbehalten.EineVervielfältigungdiesesWerkesodervonTeilendiesesWerkes istauchimEinzelfallnurindenGrenzendergesetzlichenBestimmungendesUrheberrechts- gesetzesderBundesrepublikDeutschlandvom9.September1965inderjeweilsgeltenden Fassungzulässig.Sieistgrundsätzlichvergütungspflichtig.Zuwiderhandlungenunterliegen denStrafbestimmungendesUrheberrechtsgesetzes. SpringeristeinUnternehmenvonSpringerScience+BusinessMedia springer.de ©Springer-VerlagBerlinHeidelberg2006 PrintedinGermany DieWiedergabevonGebrauchsnamen,Handelsnamen,Warenbezeichnungenusw.indiesem WerkberechtigtauchohnebesondereKennzeichnungnichtzuderAnnahme,dasssolche NamenimSinnederWarenzeichen-undMarkenschutz-Gesetzgebungalsfreizubetrachten wärenunddahervonjedermannbenutztwerdendürften.TextundAbbildungenwurden mitgrößterSorgfalterarbeitet.VerlagundAutorkönnenjedochfüreventuellverbliebene fehlerhafteAngabenundderenFolgenwedereinejuristischeVerantwortungnochirgendeine Haftungübernehmen. SatzundHerstellung:LE-TEX,Jelonek,Schmidt&VöcklerGbR,Leipzig Umschlaggestaltung:KünkelLopkaWerbeagentur,Heidelberg GedrucktaufsäurefreiemPapier 33/3142YL – 543210 Vorwort Soft-Computing beruht auf den Prinzipien der natürlichen Informationsver- arbeitung. Die wesentlichste Eigenschaft von Soft-Computing-Systemen und -Methoden ist die Fähigkeit, aus Erfahrungen zu lernen. Im Gegensatz zur „klassischen“ Programmierung, die aus den Teilschritten Analyse des Problems, Erarbeiten eines Lösungsalgorithmus und Codierung besteht, werden beim Soft-Computing Beispieldaten des Problems benötigt, aus de- nen selbstständig eine approximative Lösung erstellt wird. Auf Grund die- ser Fähigkeit haben Soft-Computing-Methoden sich inzwischen in der Pra- xis ein weites Anwendungsspektrum in den Bereichen Mustererkennung, Analysesysteme, Data-Mining, Optimierung, Diagnose und Prozeßsteue- rung erobert. Dieses Buch soll einen Überblick über die wesentlichsten Soft-Compu- tingdisziplinen Künstliche Neuronale Netze, Fuzzy Logik und Evolutionäre Algorithmen sowie über Kombinationsmöglichkeiten dieser Teildisziplinen geben. Es richtet sich sowohl an Studenten der Informatik, der Wirtschafts- informatik und der Ingenieurwissenschaften als auch an Wissenschaftler al- ler Disziplinen, die nach alternativen Methoden zum Lösen ihrer Probleme suchen. Wenn man ein so umfangreiches Buch schreibt, macht man Fehler. Soll- ten Sie als Leser Fehler in diesem Buch finden, so würde ich mich freuen, wenn Sie mir dies mitteilen würden, damit diese Fehler in folgenden Auf- lagen korrigiert werden können. Auch Berichte über eigene Erfahrungen und Entwicklungen sind willkommen. Zum Schluß möchte ich allen denen danken, die zur Erstellung dieses Lehrbuches beigetragen haben. Hier sind zunächst die vielen Studenten zu nennen, die in ihren Seminar-, Staatsexamens- und Diplomarbeiten ver- schiedene Aspekte des Soft-Computings aufgearbeitet und weiterentwickelt haben. Ferner gebührt mein Dank den Drs. Feuring, Tenhagen, Niendieck und Borschbach sowie Herrn Dipl.-Math. Mertens, die durch ihre Arbeiten und ihre Hilfe dieses Buch erst ermöglicht haben. Besonders zu nennen sind hier Herr Feuring, der im Rahmen eines Lehrauftrages ein Skript zu dem Bereich der Fuzzy-Systeme erstellt hat, auf das ich zurückgreifen konnte, Herr Borschbach, der im Rahmen eines Lehrauftrages den Bereich der Evo- lutionären Algorithmen aufgearbeitet und darüber hinaus wesentliche Teile des Kap. 1 mitgestaltet hat sowie Herr Mertens, der die aufwendige Arbeit VI Vorwort des Korrekturlesens übernommen hat. Ferner gilt mein Dank den Damen meines Vorzimmers, Frau Giesa und Frau Gentes, die meine handschriftli- chen Vorlagen in oft mühevoller Arbeit in eine druckfähige Form umgesetzt haben. Zum Schluß möchte ich mich noch bei meiner Familie für ihre Ge- duld bedanken, mit der sie besonders in der Endphase der Erstellung dieses Lehrbuches einen streßgeplagten Familienvater erduldet hat. Sommer 2005 Wolfram-M. Lippe Einführung Unter dem Begriff „Soft-Computing“ sind in den letzten Jahren vier Dis- ziplinen zusammengewachsen, die zunächst vollkommen unabhängig von- einander entstanden sind. Bei diesen vier Disziplinen handelt es sich um: (cid:16) Künstliche Neuronale Netze (cid:16) Fuzzy-Logik (cid:16) Evolutionäre Algorithmen (cid:16) Chaos-Theorie Allen ist gemeinsam, daß sie sich an dem Vorbild der natürlichen Infor- mationsverarbeitung orientieren. Der Begriff „Soft-Computing“ geht auf eine Initiative von L. Zadeh an der University of California in Berkeley zurück. Auf Grund der Orientierung an Prinzipien der natürlichen Informa- tionsverarbeitung stehen beim Soft-Computing nicht die exakten Lösun- gen, sondern ausreichend gut approximierte Lösungen im Vordergrund. Im Rahmen des biologischen Prozesses der natürlichen Informationsver- arbeitung ist der Beitrag, den jedes einzelne Neuron leistet, relativ gering. Erst durch das Zusammenspiel einer sehr großen Anzahl von Neuronen ent- steht die enorme Leistungsfähigkeit bei der natürlichen Informationsverar- beitung. Die hierbei zu Grunde liegenden Prozesse sind dabei vollkommen verschieden von denjenigen, mit denen heute üblicherweise unsere Compu- ter programmiert werden. Grundlage dieser „klassischen“ Programmierung ist die sequentielle von-Neumann-Architektur moderner Rechner, bestehend aus Programm- und Datenspeicher sowie einer Verarbeitungseinheit. Zum Lösen eines Problems muß dieses zunächst in allen Einzelheiten analysiert werden. Danach muß ein Lösungsalgorithmus gefunden und dieser an- schließend implementiert (codiert) werden. Diese Vorgehensweise ist be- kanntlich sehr fehleranfällig. Bei der natürlichen Informationsverarbeitung kommt es dagegen zu einem fortwährenden Prozeß des Lernens durch Er- fahrungen. Dieses Lernen durch Erfahrungen kann auf unterschiedliche Arten geschehen. Man kann z.B. auf Grund eines gemachten Fehlers lernen. Die Größe des Fehlers erkennt man entweder selbst oder erfährt ihn durch einen Dritten. Im diesem Fall spricht man von „überwachtem Lernen“. Die Erziehung eines Hundes dagegen erfolgt lediglich durch Lob und Tadel. Man spricht hier von „verstärkenden Lernen“. Die dritte Form des Lernens VIII Einführung in der Natur ist das „unüberwachte Lernen“, bei dem uns die vielen Eindrü- cke, die wir fortlaufend verarbeiten, unbewußt verändern und prägen. Die genauen Vorgänge der biologischen Informationsverarbeitung sind bis heute nur unzureichend bekannt. Ihre Erforschung ist Gegenstand der aktuellen Forschung. Erfolge sind in jüngster Zeit vor allem durch das hinterdiszipliniere Zusammenwirken von Medizinern, Psychologen, Bio- chemikern und Informatikern zu verzeichnen. Um sich ein Bild von der Komplexität und der Schwierigkeit dieser For- schungen zu machen, kann man sie mit dem Lösen eines riesigen Puzzles vergleichen, wobei das Lösen mit einigen zusätzlichen Erschwernissen verbunden ist. So ist im Gegensatz zu einem herkömmlichen Puzzle das Endbild nicht bekannt, d.h. man hat keine Vorlage. Außerdem sind die Bausteine, mit denen die Wissenschaftler arbeiten, nicht immer korrekt. Sie sind zum Teil falsch, fehlerhaft oder unvollständig. Ferner ist die Grö- ße des Puzzels unvorstellbar groß. Trotz unseres somit nur rudimentären Wissens über die Arbeitsweise der biologischen Informationsverarbeitung, konnten mit der auf sie auf- bauenden Theorie große Erfolge bei praktischen Anwendungen erzielt werden. Entsprechend den unterschiedlichen Teilbereichen des oben skiz- zierten Puzzels, die bereits zusammengesetzt wurden, entstanden hierbei auch unterschiedliche Konzepte. Allen ist gemeinsam, daß sie nicht expli- zit programmiert werden, sondern daß ihre Fähigkeiten zum Lösen eines Problems durch Lernen aus präsentierten Beispielen erfolgt. Das „Finden“ eines Lösungsalgorithmus durch den Programmierer entfällt. Die älteste der vier Disziplinen ist die Theorie der Künstlichen Neurona- len Netze. Ihre Anfänge gehen bis in die vierziger Jahre zurück. Sie beruht auf der Modellierung der Arbeitsweise von Nervenzellen (Neuronen). Der Lernvorgang beruht hierbei in der Fähigkeit der Netze zur Selbstmodifika- tion. Unterschiede bestehen in der Architektur (z.B. mit oder ohne Rück- kopplungen), in der Art des Lernens (überwacht, verstärkend, unüber- wacht) und der Art der Selbstmodifikation. Auf Grund ihrer Ausrichtung an den Prinzipien der biologischen Informationsverarbeitung besitzen die Künstlichen Neuronalen Netze die gleichen Stärken und Schwächen. Sie sind de facto nicht für numerische Berechnungen geeignet, aber z.B. in den Bereichen Mustererkennung, Prozeßsteuerung, Diagnose oder Data- Mining konventionellen Rechnern meist überlegen. Zu dieser Überlegen- heit zählt z.B. ihre Fähigkeit, sich dynamisch Veränderungen anzupassen und relativ unempfindlich gegenüber verrauschten Daten zu sein. Auf Grund der Erfolge bei den praktischen Anwendungen traten bei der Wei- terentwicklung der einzelnen Konzepte oft die ursprüngliche Motivation, d.h. die Modellierung der Natur, in den Hintergrund und verbesserte und erweiterte Anwendungen in den Vordergrund. Erst seit neuestem ist mit der Entwicklung des Konzepts der Spike-Neuronen, eine Rückbesinnung Einführung IX „back to the roots“ zu beobachten. Neben dem Vorteil, daß bei Künstli- chen Neuronalen Netzen eine Programmierung im eigentlichen Sinne nicht mehr erforderlich ist, sondern lediglich Beispieldaten für das Problem notwendig sind, besitzen sie jedoch einen Nachteil. Für den Benutzer sind sie eine „black box“. Ihr exaktes Verhalten für beliebige Eingabedaten ist nicht bekannt, d.h. das Wissen, welches sich das Netz auf Grund der Bei- spiele angelernt hat, ist nicht aus dem Netz extrahierbar. Auch Testdaten, mit denen das Verhalten des Netzes überprüft wird, sind nur beschränkt geeignet das Verhalten des Netzes zu überprüfen. So wurde in den sechzi- ger Jahren vom amerikanischen Verteidigungsministerium ein Projekt initiiert, auf der Basis von Künstlichen Neuronalen Netzen ein System zu entwickeln, um im Gelände getarnte Panzer und Fahrzeuge zu erkennen. Als Trainingsdaten dienten Fotos eines Truppenübungsplatzes, der zu- nächst ohne Fahrzeuge und danach mit getarnten Fahrzeugen fotografiert wurde. Die Laborergebnisse nach Training eines entsprechenden Künstli- chen Neuronalen Netzes waren hervorragend. Die Erkennungsquote betrug fast 100%. Danach erfolgte die praktische Erprobung im Gelände. Das Ergebnis war niederschmetternd, das System versagte vollständig. Zu- nächst konnte man sich das Versagen nicht erklären, bis man die Ursache fand: Die Aufnahmen ohne Fahrzeuge wurden bei Sonnenschein gemacht, die Aufnahmen mit den getarnten Fahrzeugen dagegen bei bedecktem Himmel. Das System hatte nur perfekt gelernt, gutes Wetter von schlech- tem Wetter zu unterscheiden. Man sieht an diesem Beispiel, wie wichtig eine sorgfältige Auswahl der Trainings- und Testdaten für den Einsatz von Künstlichen Neuronalen Netzen ist. Historisch gesehen als nächstes entstanden die Fuzzy-Logik und hierauf aufbauend die Fuzzy-Systeme. Mitte der sechziger Jahre wurden sie von L. Zadeh entwickelt. Auch sie orientieren sich an der Erkenntnis, daß die Informationsverarbeitung z.B. im menschlichen Gehirn nicht auf der Basis der klassischen zweiwertigen Logik erfolgt. Beobachtet man sich selbst beim Sprechen, so stellt man fest, daß man sich in vielen Fällen „graduell“ ausdrückt. So sagt man z.B. „dies ist aber ziemlich teuer“ oder „mir ist etwas kalt“. Dies läßt darauf schließen, daß der Mensch nicht in Ja-Nein-Mustern, sondern graduell denkt. Entsprechend ist die Fuzzy-Logik eine graduelle Logik, die für eine Aussage nicht nur die Wahrheitswerte „ja“ und „nein“ kennt, sondern es auch ermöglicht, eine Antwort wie „dies ist ziemlich rich- tig“ zu modellieren. Große Erfolge in praktischen Anwendungen hat die Fuzzy-Logik als Basis von Fuzzy-Controllern zur Steuerung von Systemen. Hierbei ist das Wissen über die Steuerung in Form von „wenn-dann“- Regeln in einer Regelbasis hinterlegt. Beruhen diese Regeln und ihre Aus- wertungsstrategien auf der Fuzzy-Logik, so ist es möglich, auch vages Wis- sen zu erfassen. Hierdurch ist oftmals eine wesentlich feinere Steuerung möglich. Erstmalig eingesetzt wurden Fuzzy-Controller im Zusammenhang X Einführung mit der Steuerung von Stabilatoren, die das Verwackeln bei Camcordern verhindern. Inzwischen haben sie in vielen Bereichen, von der Waschma- schine bis zu Automobilen, die klassischen Controller verdrängt. Ihr Vorteil gegenüber Künstlichen Neuronalen Netzen besteht darin, daß ihr Verhalten auf Grund der Speicherung des Wissens in „wenn-dann“-Regeln, relativ einfach nachvollziehbar ist. Vorhandenes Wissen kann leicht integriert werden. Ein Nachteil dieser Systeme besteht darin, daß sie keine adaptiven Fähigkeiten besitzen und daher nicht durch Beispiele trainiert oder verbes- sert werden können. Aus diesem Grund wird verstärkt versucht, Künstliche Neuronale Netze und Fuzzy-Logik zu kombinieren, um die jeweiligen Vor- teile auszunutzen und ihre Nachteile zu vermeiden. Ein weiterer wichtiger Prozeß in der Natur ist das erstmalig ausführlich von Darwin postulierte Evolutions-Prinzip. Jede Population unterliegt fort- während kleinen und größeren Veränderungen. Einige dieser Veränderun- gen machen einzelne Individuen lebensfähiger und setzen sich daher durch, andere Veränderungen schwächen sie. Die Natur arbeitet in diesem Fall gemäß einem „try-and-error-Prinzip“. Das Gütemaß ist hierbei die Lebensfähigkeit. Wird sie durch eine Veränderung verbessert, so wird diese Veränderung beibehalten, tritt eine Verschlechterung ein, so wird sie verworfen. Das Evolutionsprinzip beruht auf drei einfachen Teilprinzipien: Mutati- on des Erbgutes, Rekombination der Erbinformation und Selektion auf- grund der Tauglichkeit. Diese Teilprinzipien ergänzen sich in idealer Wei- se, da sie gerichtetes und ungerichtetes Vorgehen kombinieren. Die Mutation ist ein ungerichteter Prozeß. Durch ihn werden „willkürlich“ Varianten und Alternativen erzeugt. Hierdurch wird u.a. dem Problem des Verharrens in lokalen Minima bei der Optimierung begegnet. Die Rekom- bination ist ein im wesentlichen zielgerichteter Prozeß. Zwar werden die Stellen, an denen eine Rekombination stattfindet, vermutlich zufällig be- stimmt, und bewirken somit ein zufälliges Mischen des Erbgutes, die Re- kombination unterliegt aber gewissen statistischen Gesetzmäßigkeiten (z.B. Mendelsche Gesetze). So werden nahe beieinanderliegende und funk- tional verknüpfte Gengruppen seltener getrennt als weiter auseinander liegende. Die Selektion steuert die Richtung des Evolutionsprozesses. Sie legt fest, welche Phänotypen sich auf Grund der besseren Lebensfähigkeit stärker vermehren und welche weniger stark, und bestimmt dadurch die grundlegende Ausprägung und Ausrichtung des Genoms einer Art. Sie ist prinzipiell ein deterministischer Prozeß. Allerdings unterliegt die Selektion auch gewissen Störungen, wodurch auch sie, wenn auch in geringem Ma- ße, einem gewissen Nichtdeterminismus unterliegt. Dieses Evolutionsprin- zip wurde bereits von A. Turing als Vision für die Entwicklung von Pro- grammen aufgegriffen. Konkretisiert wurde dieses Vorgehen jedoch erst ab den sechziger Jahren. Das Grundprinzip ist hierbei das folgende: Das

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.