E(cid:14)zientes Probleml(cid:127)osen durch (cid:13)exible Wiederverwendung von F(cid:127)allen auf verschiedenen Abstraktionsebenen Ralph Bergmann vom Fachbereich Informatik der Universit(cid:127)at Kaiserslautern zur Verleihung des akademischen Grades Doktor der Naturwissenschaften (Dr. rer. nat.) genehmigte Dissertation Dekan: Prof. Dr. Hans Hagen Berichterstatter: Prof. Dr. Michael M. Richter Prof. Dr. Fritz Wysotzki Tag der wissenschaftlichen Aussprache: 28. Juni 1996 D 386 Geleitwort des Doktorvaters Die Suche nach Aktionspl(cid:127)anen, die einen vorgegebenen Anfangs- in einen geforderten Ziel- zustand u(cid:127)berfu(cid:127)hren, ist bekannterma(cid:25)en komplex und Gegenstand vielf(cid:127)altiger Untersu- chungen.Gefordert ist einerseits,da(cid:25) diePl(cid:127)ane korrektsind, d. h. nur zul(cid:127)assige Teilschritte enthalten und zum anderen, da(cid:25) sie m(cid:127)oglichst geringe Kosten und einen m(cid:127)oglichst hohen Nutzen haben. Zu den drei wichtigstenMethoden der Suchraumeinschr(cid:127)ankunggeh(cid:127)oren die Einbringung und Verwendung von Hintergrundwissen (vor allem fu(cid:127)r die Kontrollstruktu- ren), die Verwendung von fru(cid:127)her bereits gel(cid:127)osten und m(cid:127)oglichst (cid:127)ahnlichen Planungsf(cid:127)allen sowie der U(cid:127)bergang zu abstrakteren Ebenen. Jede dieser dreiVorgehensweisen ist geeignet, die Komplexit(cid:127)at der Suche fu(cid:127)r spezielle Anwendungen zu reduzieren. Die bisherige Erfah- rung zeigt jedoch, da(cid:25) die einzelne Anwendung derartiger Vorgehensweisen nur selten zu den gewu(cid:127)nschten Ergebnissen fu(cid:127)hrt und ihre Kombination sehr wu(cid:127)nschenswert w(cid:127)are. Die vorliegende Arbeit hat sich die Aufgabe gestellt, die drei genannten Vorgehensweisen zu integrieren. Dazu mu(cid:25)te das vorhandene Methodenspektrum zun(cid:127)achst aufgearbeitet und erweitert werden und sodann mu(cid:25)ten die n(cid:127)otigen Grundlagen zur Integration gescha(cid:11)en werden. Darauf aufbauend hat der Verfasser dann in Paris (Plan Abstraction and Re(cid:12)ne- mentin an Integrated System)ein konkretes integriertesSystemkonzipiertund implemen- tiert. Dieses System ist praktisch orientiertund mu(cid:25)neben der e(cid:14)zientenPlangenerierung auch Aspekte wie Dom(cid:127)anenunabh(cid:127)angigkeit und inkrementelleErweiterbarkeit beru(cid:127)cksich- tigen. In der Aktionsplanung ist es stets zweckm(cid:127)a(cid:25)ig,als logischeBasis eine Formder Modallogik zu w(cid:127)ahlen und so wird auch hier vorgegangen. Bei der Verwendung von F(cid:127)allen erfordern Planungsaufgaben stets die Adaption der L(cid:127)osungen (also der fru(cid:127)heren Pl(cid:127)ane). Im Prin- zip erfolgt die Vorgehensweise nach dem bekannten Schema von Aamodt und Plaza. Im Kontext der vorliegenden Arbeit mu(cid:25) jedoch eine wichtige Besonderheit beachtet werden. U(cid:127)blicherweisewerdenzwarnichtidentischesondern nur(cid:127)ahnlicheF(cid:127)allebetrachtet,sieliegen jedoch stets auf der gleichen Abstraktionsebene. Hier mu(cid:25) jedoch beru(cid:127)cksichtigt werden, da(cid:25) sich F(cid:127)alle auf unterschiedlichen Abstraktionsebenen bewegen; deshalb spielen Metho- den zurFallabstraktion und -verfeinerungeinewesentlicheRolle.DieunterschiedlichenAb- straktionsebenenh(cid:127)angen mitdemvorhandenenHintergrundwisseninderWeisezusammen, da(cid:25) manches Wissen erst auf bestimmten Beschreibungsebenen vorhanden ist und deswe- gen geeignete Abstraktions- und Konkretisierungsabbildungen n(cid:127)otig werden. Es ist auch bekannt, da(cid:25) ein Wechselder Beschreibungsebenezu einemWechselder Komplexit(cid:127)atsklas- sen fu(cid:127)hren kann. Das Einbringen von Hintergrundswissen selbst und der Zusammenhang zwischen Generalisierung und Spezialisierung von F(cid:127)allen wird imPrinzip mitder Methode des erkl(cid:127)arungsbasierten Lernens angegangen. ii Ich sehe den Wert der vorliegenden Arbeit vor allem darin, da(cid:25) ein umfassender neuer Ansatz fu(cid:127)r die Aktionsplanung vorgestellt wird. Um eine Verbindung zwischen Grundla- genforschung und Anwendungsorientierung herzustellen, ist dieser Ansatz auf drei Ebenen behandelt worden, auf der formal-logischen Ebene, der Ebene der Algorithmen und Me- thoden sowie schlie(cid:25)lich der Ebene der Datenstrukturen und der Implementierung. Das Paris-Systemist keine lose hybrideSammlungunterschiedlicherVorgehensweisen sondern eine echte Integration, die auf einer detaillierten methodischen Analyse basiert. Ich denke, da(cid:25) gerade dieserletzteGesichtspunktAnla(cid:25) zuweiterenDiskussionen und Arbeitengeben wird. Prof. Dr. Michael M. Richter Danksagungen Mein erster Dank gilt Herrn Prof. Dr. Michael M. Richter fu(cid:127)r die Betreuung dieser Arbeit sowie Herrn Prof. Dr. Fritz Wysotzki fu(cid:127)r die Bereitschaft zur U(cid:127)bernahme des Korrefe- rats. Prof. Richter hat mir durch die Aufnahme in seine Arbeitsgruppe die Anfertigung dieser Arbeit u(cid:127)berhaupt erst erm(cid:127)oglicht und mich in vielen Diskussionen auf wichtige Zu- sammenh(cid:127)ange aufmerksam gemacht und mein Verst(cid:127)andis von fallbasiertem Schlie(cid:25)en und maschinellen Lernen deutlich mitgepr(cid:127)agt. Prof. Wysotzki hat durch seine gro(cid:25)es Interesse und seine Diskussionsbereitschaft zur Pr(cid:127)azisierung wichtiger Sachverhalte beigetragen. Dank gebu(cid:127)hrt allen meinen Kollegen, die immero(cid:11)en fu(cid:127)r Diskussionen waren und fu(cid:127)r Fra- gen zur Verfu(cid:127)gung standen. Insbesondere m(cid:127)ochte ich danken: Klaus-Dieter Altho(cid:11), Stefan We(cid:25) und Wolfgang Wilke fu(cid:127)r viele anregende Diskussionen zum fallbasierten Schlie(cid:25)en; Christoph Globig fu(cid:127)r Diskussionen u(cid:127)ber theoretische Fragen und ganz praktische Dinge; Frank Maurer fu(cid:127)r Diskussionen zum Thema Knowledge Engineering; H(cid:19)ector Mun~oz fu(cid:127)r einen regen Gedankenaustausch u(cid:127)ber viele Fragen des fallbasierten Planens; Ju(cid:127)rgen Pau- lokat und Frank Weberskirch fu(cid:127)r ihre Fachkompetentz im Bereich der Planung. Dank gebu(cid:127)hrt auch denjenigen, mit denen ich w(cid:127)ahrend der letzten Jahre u(cid:127)ber viele ver- schiedene Aspekte meiner Arbeit diskutieren konnte und deren Anmerkungen immer eine Bereicherung fu(cid:127)r mich waren. Hier sind zu nennen: Aagnar Aamodt, David Aha, Katy B(cid:127)orner, Stefan Boschert, Karl Branting, Jaime Carbonell, Padraig Cunningham, Fausto Giunchiglia, Robert Holte, Alexander Horz, Subbarau Kambhampati, Gabriele Schmidt, Barry Smyth und Manuela Veloso. Des weiteren m(cid:127)ochte ich mich bei all denjenigen Studenten bedanken, die im Rahmen von Projekt- oder Diplomarbeitensowie durch T(cid:127)atigkeitenals wissenschaftlicheHilfskr(cid:127)aftedie- se Arbeit ganz wesentlich unterstu(cid:127)tzt haben: Wolfgang Wilke hat die Lernkomponenten des in dieser Arbeit beschriebenen Paris-Systems implementiert und daru(cid:127)ber hinaus in vielen Diskussionen zur Detaillierung meiner Ideen wesentlich beigetragen; Andreas Dan- nenmann, Wolfgang Haupenthal, Gerd Pews, Thomas Reinartz, und Dagmar Surmann haben durch ihre Arbeiten ebenfalls wichtige Beitr(cid:127)age geleistet. Wichtig fu(cid:127)r das Zustandekommen dieser Arbeit war auch die au(cid:25)erordentlich gute und kooperative Arbeitsatmosph(cid:127)are innerhalb unserer Arbeitsgruppe. Hierfu(cid:127)r danke ich Prof. MichaelM. Richter,Klaus-DieterAltho(cid:11), Martin Br(cid:127)auer,Cesar Carranza, Barbara Dellen, Stefan Dittrich, Christoph Globig, Edith Hu(cid:127)ttel, Willi Klein, Gunnar Krug, Wolfgang Lenski, Frank Maurer, H(cid:19)ector Mun~oz, Ju(cid:127)rgen Paulokat, Gerd Pews, Reinhard Praeger, Ju(cid:127)rgen Rahmel, Werner Schirp, Ilka Steuerwald, Aldo von Wangenheim, Oliver Wendel, Stefan We(cid:25), Elisabeth Wette-Roch und Wolfgang Wilke. Fu(cid:127)r das Korrekturlesen von Rohfassungen dieser Arbeit m(cid:127)ochteich michauch ganz beson- ders bedanken bei Christoph Globig, Edith Hu(cid:127)ttel, Manuela Mohr, H(cid:19)ector Mun~oz, Frank Weberskirch und Wolfgang Wilke. AuchmeinenEltern dankeichan dieserStelledafu(cid:127)r, da(cid:25) sie mirdieAusbildung erm(cid:127)oglicht und mich stets nach allen Kr(cid:127)aften unterstu(cid:127)tzt haben. Besonderer Dank gebu(cid:127)hrt auch Ma- nuela Mohr, fu(cid:127)r ihr Verst(cid:127)andnis, ihre Hilfe und die notwendigen Ablenkungen von wissen- schaftlichen und sonstigen Problemen. Kaiserslautern, im Januar 1996 Ralph Bergmann Zusammenfassung Generische wissensbasierte Systeme zur L(cid:127)osung konstruktiver (synthetischer) Aufgaben erfordern das Durchsuchen gro(cid:25)er, meist exponentiell gro(cid:25)er L(cid:127)osungsr(cid:127)aume und haben somit einen sehr gro(cid:25)en Rechenzeitbedarf. Dieses Problem tritt typischerweise bei Akti- onsplanungsaufgaben auf, die in dieser Arbeit eingehend betrachtet werden. Hierbei geht es darum,eine Folge von Aktionen,genannt Plan, zu (cid:12)nden, deren Ausfu(cid:127)hrung, ausgehend von einer Ausgangssituation, ein bestimmtes Ziel erreicht. Der Gegenstand dieser Arbeit ist, Methoden zu entwickeln und zu analysieren, die in der Lage sind, durch die Wiederverwendung von F(cid:127)allen { das sind Beschreibungen bekannter Probleml(cid:127)osungen { neue Probleme e(cid:14)zient zu l(cid:127)osen. Hierzu werden die bekannten F(cid:127)alle in einer Fallbasis gespeichert. Ein neues Problem wird dadurch gel(cid:127)ost, da(cid:25) ein geeigneter Fall aus der Fallbasis ausgew(cid:127)ahlt und die im Fall enthaltene L(cid:127)osung im Kontext des neuen Problems wiederverwendet wird. Eine wesentliche Schwierigkeit, die sich insbesondere in synthetischen Bereichen ergibt, ist, da(cid:25) das Spektrum der vom System zu l(cid:127)osenden Pro- bleme sehr gro(cid:25) ist und da(cid:25) jedes Problem in der Regel eine individuelleL(cid:127)osung erfordert. Daher mu(cid:127)ssenF(cid:127)alle auf vielf(cid:127)altigeWeise angepa(cid:25)t werden.Die entwickeltenMethoden set- zenAbstraktions- und Generalisierungstechnikenein,umF(cid:127)alleauf m(cid:127)oglichst(cid:13)exibleWeise fu(cid:127)r neue Probleme wiederverwendbarzu machen.Durch die Abstraktion und nachfolgende Konkretisierung von F(cid:127)allen l(cid:127)a(cid:25)t sich das in den F(cid:127)allen enthaltene Wissen auf verschiede- nen Abstraktionsebenen wiederverwenden, wobei unterschiedliche Beschreibungssprachen fu(cid:127)r verschiedene Abstraktionen eingesetzt werden k(cid:127)onnen. Die Generalisierung von F(cid:127)allen erlaubt es, einen vorliegendenFall zu einer ganzen Klasse von Problemenund L(cid:127)osungen zu erweiternund durch das Einbeziehenvon Hintergrundwissen u(cid:127)ber den Anwendungsbereich die Korrektheit der entstehenden L(cid:127)osungen zu garantieren. Um die Methoden zu testen und detailliert bewerten zu k(cid:127)onnen, wurden sie in einem System, Paris (Plan Abstraction and Re(cid:12)nement in an Integrated System) genannt, vollst(cid:127)andig implementiert. Die realisierten Wiederverwendungsmethoden sind dom(cid:127)anenu- nabh(cid:127)angig, setzen jedoch eine hierarchische Modellierung des betrachteten Gegenstands- bereichs voraus. Vorliegende F(cid:127)alle k(cid:127)onnen vollkommenautomatisch zur L(cid:127)osung neuer Pla- nungsprobleme wiederverwendet werden. Durch die exemplarischeModellierung eines rea- len Anwendungsbereiches(Arbeitsplanung fu(cid:127)r die Fertigung von DrehteilenimMaschinen- bau) wurde die Tragf(cid:127)ahigkeit der entwickeltenMethoden demonstriert. In einer Reihe von empirischen Untersuchungen, bei denen verschiedene Bedingungen systematisch variiert wurden, lie(cid:25)en sich wichtige Eigenschaften der Wiederverwendungsmethoden belegen. So konnte im Mittel eine signi(cid:12)kant h(cid:127)ohere Leistungsf(cid:127)ahigkeit (erforderliche Rechenzeit zur Probleml(cid:127)osung) im Vergleich zu generischem Probleml(cid:127)osen nachgewiesen werden. Au(cid:25)er- dem zeigte sich eine hohe Flexibilit(cid:127)at der Wiederverwendung, d. h. ein vorliegender Fall konnte fu(cid:127)r eine Vielzahlsehr unterschiedlicherProbleme e(cid:14)zientwiederverwendetwerden. Die Arbeit diskutiert detailliert die Vor- und Nachteile der beschriebenen Methoden und liefert Kriterien fu(cid:127)r ihre erfolgreiche Anwendung. Inhaltsverzeichnis 1 Einleitung 1 1.1 Gegenstand der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.2 Anforderungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.3 Methodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.4 Voraussetzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.1.5 Bewertungskriterien . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2 Vorbemerkungen zur Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.1 Voraussetzungen an den Leser . . . . . . . . . . . . . . . . . . . . . 8 1.2.2 Darstellungsebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3 Gliederung der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 I Grundlagen und Basismethoden 11 2 Grundlagen aus dem Bereich des Probleml(cid:127)osens 13 2.1 Probleml(cid:127)osen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.1.1 Ver(cid:127)anderliche Welten . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.1.2 Eine Beispieldom(cid:127)ane: Arbeitsplanung fu(cid:127)r rotationssymmetrische Drehteile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2 Formale Repr(cid:127)asentation (Syntax) . . . . . . . . . . . . . . . . . . . . . . . 16 2.2.1 Relevante Grundbegri(cid:11)e der Pr(cid:127)adikatenlogik . . . . . . . . . . . . . 17 2.2.2 Repr(cid:127)asentation von Welten . . . . . . . . . . . . . . . . . . . . . . . 18 2.2.3 Repr(cid:127)asentation von Aktionen . . . . . . . . . . . . . . . . . . . . . 22 2.2.4 Probleml(cid:127)osedom(cid:127)ane . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 viii INHALTSVERZEICHNIS 2.3 Formale Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.4 Beschr(cid:127)ankungen dieses Probleml(cid:127)osebegri(cid:11)es . . . . . . . . . . . . . . . . . 28 2.5 Der Probleml(cid:127)oseproze(cid:25) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.5.1 Suche im Zustandsraum . . . . . . . . . . . . . . . . . . . . . . . . 31 2.5.2 Suche im L(cid:127)osungsraums . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5.3 Suche im Zustandsraum vs. Suche im L(cid:127)osungsraum . . . . . . . . . 32 2.5.4 Komplexit(cid:127)at des Probleml(cid:127)osens . . . . . . . . . . . . . . . . . . . . 33 3 Leistungssteigerung von Probleml(cid:127)osern 35 3.1 Fallbasiertes Schlie(cid:25)en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1.1 Die Grundidee des fallbasierten Schlie(cid:25)ens . . . . . . . . . . . . . . 36 3.1.2 Fallbasis und verwendete Repr(cid:127)asentationsformen . . . . . . . . . . . 38 3.1.3 Retrieve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.1.4 Reuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.1.5 Revise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.1.6 Retain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.1.7 Fallbasiertes Schlie(cid:25)en in der Aktionsplanung . . . . . . . . . . . . 42 3.1.8 Einige Aspekte und Probleme bei Derivational Analogy . . . . . . . 43 3.2 Erkl(cid:127)arungsbasiertes Lernen . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.2.1 Die Grundidee des erkl(cid:127)arungsbasierten Lernens . . . . . . . . . . . 44 3.2.2 Die Lernphase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.2.3 Eine allgemeine Prozedur zum erkl(cid:127)arungsbasierten Lernen . . . . . 48 3.2.4 Die Anwendungsphase . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.2.5 Nu(cid:127)tzlichkeitsbetrachtungen. . . . . . . . . . . . . . . . . . . . . . . 50 3.2.6 Einige Aspekte und Probleme des erkl(cid:127)arungsbasierten Lernens . . . 53 3.2.7 Hintergrund: Urspru(cid:127)nge des erkl(cid:127)arungsbasierten Lernens . . . . . . 55 3.2.8 Vergleich von erkl(cid:127)arungsbasiertem Lernen und Derivational Analogy 56 3.3 Abstraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.3.1 Abstraktion und Konkretisierung . . . . . . . . . . . . . . . . . . . 57 3.3.2 Hierarchisches Probleml(cid:127)osen . . . . . . . . . . . . . . . . . . . . . . 59 3.3.3 Vorgehensweise beim hierarchischen Probleml(cid:127)osen . . . . . . . . . . 61 3.3.4 Kosten beim hierarchischen Probleml(cid:127)osen. . . . . . . . . . . . . . . 63 INHALTSVERZEICHNIS ix 3.3.5 Bildung von Abstraktionsebenen . . . . . . . . . . . . . . . . . . . 65 3.3.6 Einige Probleme beim Einsatz von Abstraktion . . . . . . . . . . . 66 II PARIS: Flexible Wiederverwendung von F(cid:127)allen durch Ab- straktion und Generalisierung 69 4 U(cid:127)berblick 71 4.1 F(cid:127)alle auf verschiedenen Abstraktionsebenen . . . . . . . . . . . . . . . . . 71 4.1.1 Fallbasiertes Schlie(cid:25)en und Abstraktion . . . . . . . . . . . . . . . . 71 4.1.2 F(cid:127)alle auf verschiedenen Abstraktionsebenen . . . . . . . . . . . . . 72 4.1.3 Die Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 4.1.4 Ein Beispiel fu(cid:127)r die Fallabstraktion . . . . . . . . . . . . . . . . . . 74 4.2 Erkl(cid:127)arungsbasiertes Generalisieren abstrakter F(cid:127)alle . . . . . . . . . . . . . 79 4.2.1 Generalisierte F(cid:127)alle . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 4.2.2 Die Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4.2.3 Integration von Abstraktion und Generalisierung . . . . . . . . . . 82 4.2.4 Ein Beispiel fu(cid:127)r die Fallgeneralisierung . . . . . . . . . . . . . . . . 83 4.3 Fallauswahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.3.1 Aufwand zur L(cid:127)osungsverfeinerung . . . . . . . . . . . . . . . . . . . 84 4.3.2 Aufwand durch die L(cid:127)osungsspezialisierung . . . . . . . . . . . . . . 85 4.3.3 Gesamter Wiederverwendungsaufwand . . . . . . . . . . . . . . . . 85 4.3.4 Retrievalaufwand und Wiederverwendungsaufwand . . . . . . . . . 86 4.3.5 Indexierung der Fallbasis . . . . . . . . . . . . . . . . . . . . . . . . 86 4.3.6 Ein Beispiel fu(cid:127)r eine Klassi(cid:12)kationshierarchie . . . . . . . . . . . . . 88 4.4 Die PARIS-Architektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 4.4.1 Die Lernphase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 4.4.2 Die Probleml(cid:127)osephase . . . . . . . . . . . . . . . . . . . . . . . . . 90 5 Fallabstraktion und Verfeinerung 91 5.1 Modell der Fallabstraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.1.1 Abstraktion durch Wechsel der Repr(cid:127)asentationssprache . . . . . . . 92 5.1.2 Voraussetzung zum Wechsel der Repr(cid:127)asentationsebenen . . . . . . . 93
Description: