ebook img

Information-Retrieval und künstliche Intelligenz PDF

252 Pages·2007·1.727 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Information-Retrieval und künstliche Intelligenz

Helmut Jarosch Information Retrieval und Künstliche Intelligenz WIRTSCHAFTSINFORMATIK Helmut Jarosch Information Retrieval und Künstliche Intelligenz Deutscher Universitäts-Verlag Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http://dnb.d-nb.de> abrufbar. . . 1. Au 1. Auflage April 2007 Alle Rechte vorbehalten © Deutscher Universitäts-Verlag | GWVFachverlage GmbH, Wiesbaden 2007 Lektorat: Brigitte Siegel / Britta Göhrisch-Radmacher Der Deutsche Universitäts-Verlag ist ein Unternehmen von Springer Science+Business Media. www.duv.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbe- sondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. indiesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: Regine Zimmer, Dipl.-Designerin, Frankfurt/Main Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-8350-0598-3 Vorwort In nahezu allen Unternehmen gilt heute die effiziente Nutzung der Ressource „Wissen“ als einer der kritischen Erfolgsfaktoren; dem Wissensmanagement wird immer größere Aufmerksamkeit geschenkt. Häufig steht man dabei vor dem Problem, aus einer ständig wachsenden Menge gespeicherter Text-Doku- mente die für eine aktuelle Fragestellung relevanten Dokumente herauszu- suchen. Information-Retrieval-Systeme sollen den Benutzer bei der Informationssuche unterstützen. Die verfügbaren Information-Retrieval-Systeme bieten dem unge- übten Benutzer jedoch zu wenig Unterstützung. Da die zu recherchierenden Texte in der Regel ohne lexikalische Kontrolle – und häufig noch dazu in ver- schiedenen Sprachen - verfasst wurden, ist es dem Benutzer kaum möglich, die treffenden Termini für seine Suchanfrage zu „erraten“. Die Benutzeroberfläche solcher Systeme muss so gestaltet werden, dass auch der ungeübte Benutzer seinen Informationsbedarf in einfacher Weise formulieren kann. Nach der im vorliegenden Buch entwickelten Methode soll dieses Ziel erreicht werden, indem Methoden, die im Forschungsgebiet der Künstlichen Intelligenz (KI) entwickelt wurden, auf das Problem des Information Retrieval übertragen werden: Zwischen den Benutzer und das Information-Retrieval-System soll sich ein sogenannter KI-Assistent schieben, der dem Benutzer in dreierlei Hinsicht Hilfe anbietet: 1. Durch eine geeignete Menüführung soll der Benutzer dabei unterstützt werden, seine Suchanfrage nach einer semantisch orientierten Methode zu konstruieren. 2. Mittels statistischer Verfahren sollen aus den textorientierten Recherche- Ergebnissen Wörter ausgewählt und dem Benutzer zur Aufnahme in seine Begriffskonstrukte angeboten werden. VI Vorwort 3. Unter Verwendung von Methoden des Begriffslernens soll der Benutzer dazu angeleitet werden, durch Boole’sche Operatoren und Kontext-Opera- toren eine geeignete Verknüpfung seiner Begriffskonstrukte vorzunehmen, so dass akzeptable Recherche-Ergebnisse erzielt werden. Um diese Ziele schnell und effizient erreichen zu können, wird zunächst eine spezielle System-Architektur entwickelt, durch die keine Eingriffe in die Soft- ware des Information-Retrieval-Systems erforderlich sind. Ein KI-Assistent, der zusätzliche Intelligenz in den Rechercheprozess einbringen soll, vermittelt zwi- schen dem Benutzer und dem Information-Retrieval-System und hebt dadurch die Benutzerkommunikation auf ein höheres Niveau. Die Kommunikation des KI-Assistenten mit dem Benutzer und mit dem Infor- mation-Retrieval-System sowie die Steuerungs- und Nachrichtenflüsse, die zwi- schen den Komponenten des KI-Assistenten ablaufen, werden durch ein Modell abstrakter Maschinen beschrieben. Für die Formulierung der Algorithmen, nach denen die abstrakten Maschinen arbeiten sollen, wird die Programmiersprache KOMPROMISS entworfen, die eine objektorientierte Programmierung ermöglicht. Um die Leistungsfähigkeit dieses Ansatzes zu demonstrieren, wird ein spezieller KI-Assistent entwickelt, der den Benutzer bei der Online-Recherche unter- stützen soll. Die dafür eingesetzten Lernverfahren aus dem Gebiet der Künst- lichen Intelligenz und die Algorithmen der Massendatenverarbeitung werden durch Teilsysteme abstrakter Maschinen realisiert. Ihre objektorientierte Archi- tektur und ihre Kommunikationsflüsse werden aus der Aufgabenstellung abge- leitet. Das Niveau der Software ist dabei durch abstrakte Datentypen und Kopro- gramme charakterisiert. Wichtige Anregungen für die Konzeption dieses Buches gehen auf Diskussionen mit Herrn Prof. Dr. Erich Mater und Herrn Prof. Dr. Fritz Wysotzki zurück. Ihnen sei an dieser Stelle herzlich gedankt. Dank gilt auch der Fachhochschule für Wirtschaft Berlin, die mir die ungestörte Arbeit an diesem Buch ermöglichte. Helmut Jarosch VII Inhaltsverzeichnis Abbildungsverzeichnis ..................................................................................... XI Abkürzungsverzeichnis ................................................................................. XIII Symbolverzeichnis ........................................................................................... XV 1 Einführung ................................................................................................... 1 1.1 Wissen als kritischer Erfolgsfaktor....................................................... 1 1.2 Aufgaben des Information-Retrieval-Systems...................................... 1 1.3 Aufgaben des KI-Assistenten ............................................................... 3 2 Entwurfsentscheidungen ............................................................................ 5 2.1 Erweiterungen auf dem Client oder auf dem Server? ........................... 5 2.2 Programmschnittstelle oder programmierter Dialog?........................... 6 2.3 Unterprogramme oder Koprogramme?................................................. 8 3 Modell der Einbindung eines KI-Assistenten ......................................... 13 3.1 Überblick über die Steuerungsflüsse .................................................. 13 3.2 Modell der Steuerungsflüsse .............................................................. 17 3.3 Routinen und Prozesse ....................................................................... 30 VIII Inhaltsverzeichnis 3.4 Typische Teilsysteme abstrakter Maschinen ...................................... 37 3.4.1 Lösung einer Aufgabe in Teilschritten .................................... 37 3.4.2 Abfordern von Teilergebnissen durch mehrere Maschinen .... 39 3.4.3 Exemplare abstrakter Datentypen............................................ 41 3.4.4 Die Maschine 'IRS' ................................................................ 44 3.4.5 Teilsysteme von Komaschinen ................................................ 45 3.5 Kommunikation des KI-Assistenten mit dem Benutzer ..................... 47 3.6 Entstehen und Vergehen des KI-Assistenten...................................... 49 3.7 Formen der Kommunikation............................................................... 50 4 Programmiersprache für den KI-Assistenten ........................................ 53 4.1 Sendepunkte ....................................................................................... 54 4.1.1 Nachrichtenaustausch .............................................................. 54 4.1.2 Steuerungsübergabe ................................................................ 58 4.1.2.1 Generierungspunkt .................................................... 58 4.1.2.2 Aktivierungspunkt ..................................................... 59 4.1.2.3 Aktivator-Rückkehrpunkt.......................................... 60 4.1.2.4 Endpunkt ................................................................... 60 4.2 Kommunikationspunkte...................................................................... 61 4.2.1 Lexikalische Analyse .............................................................. 61 4.2.2 Eintrittspunkt ........................................................................... 70 4.2.3 Dialogpunkt ............................................................................. 71 4.2.4 Austrittspunkt .......................................................................... 73 4.3 Steuerungsdienste ............................................................................... 73 4.4 Spezielle Datentypen .......................................................................... 74 4.4.1 Listen ....................................................................................... 74 4.4.2 Zeichenketten .......................................................................... 85 4.5 Implementierung der Programmiersprache ...................................... 105 Inhaltsverzeichnis IX 5 Entwurf eines KI-Assistenten ................................................................ 107 5.1 Aufgabenstellung für den KI-Assistenten ........................................ 107 5.2 Die Monitormaschine 'RECHERCHE' .......................................... 109 5.3 Die Maschine 'SUCHANFRAGE' ................................................ 110 5.3.1 Die Struktur der Suchanfrage ................................................ 110 5.3.2 Die Bearbeitung der Suchanfrage.......................................... 114 5.3.3 Das Teilsystem 'WÖRTERBUCH' .................................... 117 5.3.3.1 Modell des Wörterbuchs ......................................... 118 5.3.3.1.1 Aufbau des Wörterbuchs ........................ 120 5.3.3.1.2 Suche im Wörterbuch ............................. 128 5.3.3.2 Entwurf des Teilsystems 'WÖRTERBUCH' ....... 129 5.3.3.2.1 Verwaltung einer Wortmenge durch einen Präfixbaum.................................... 132 5.3.3.2.2 Die Maschine 'ENDUNGSLISTE' ..... 139 5.3.3.2.3 Die Maschine 'WORTLISTE' ............. 142 5.3.3.3 Die durch das Teilsystem 'WÖRTERBUCH' realisierte Intelligenz ............................................... 152 5.4 Das Teilsystem 'BEGRIFFSKONSTRUKTE PRÄZISIEREN' ............................................................................. 153 5.5 Das Teilsystem 'SUCHANFRAGE KONSTRUIEREN' .......... 157 5.5.1 Problemstellung ..................................................................... 157 X Inhaltsverzeichnis 5.5.2 Methode für die Konstruktion des Klassifikators.................. 163 5.5.2.1 Ein allgemeiner Rekursions-Schritt......................... 166 5.5.2.1.1 Zuordnung der gesamten Objektmenge zu einer Klasse........................................ 167 5.5.2.1.2 Ermittlung der zweckmäßigsten Zerlegung ............................................... 171 5.5.2.1.3 Durchführung der Zerlegung.................. 179 5.5.2.1.4 Die durch den allgemeinen Rekursions- Schritt realisierte Intelligenz................... 183 5.5.2.2 Der Gesamtprozess zur Konstruktion des Klassifikators .................................................... 185 5.5.2.3 Optimierung des Klassifikators ............................... 187 5.5.3 Entwurf des Teilsystems 'SUCHANFRAGE KONSTRUIEREN'............................................................. 196 5.6 Erreichte Ergebnisse beim Entwurf des KI-Assistenten ................... 206 6 Fazit und Ausblick .................................................................................. 209 Literaturverzeichnis ........................................................................................ 213 Glossar ............................................................................................................ 231

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.