Informatik - Fachberichte Band 99: K. K!lspert, Fehlererkennung und Fehlerbehandlung in Band 122: Ch. Habei, Prinzipien der Referentialltlit Untersuchun Speicherungsstrukturen von Datenbanksystemen. IX, 294 Seiten. gen zur proposltlonalen Reprlisentstlon von Wissen. X, 308 Selten. 1985. 1986. Band 100: W. Lamersdorf, Semantische Reprlisentstion komplexer Band 123: Arbeit und Informationstechnik. GI-Fachtsgung. Objektstrukturen. IX, 187 Seiten. 1985. Proceedlngs, 1986. Herausgegeben von K. T. SchrOder. IX, 435 Seiten. 1986. Band 101: J. Koch, Relationale Anfragen. VIII, 147 Selten. 1985. Band 124: GWAI-86 und 2. Österreichische Artificlal-Intelllgence Band 102: H.-J. Appelrath, Von Datenbanken zu Expertensystemen. Tagung. Oltensteln/NiederOsterreich, September 1986. Herausge VI,159 Seiten. 1985. geben von C.-R. Rollinger und W. Horn. X, 360 Seiten. 1986. Band 103: GWAI-84. 8th German Workshop on Artlficlal Intelli Band 125: Mustererkennung 1986. 8. DAGM-Symposium, Pader gence. WingstlStsde, October 1984. Edltsd by J. Laubseh. VIII, born, September/Oktober 1986. Herausgegeben von G. Hartmann. 282 Selten. 1985. XII, 294 Seiten, 1986. Band 126: GI-16. Jahrestsgung.lnformatik-Anwendungen -Trends Band 104: G. ~agerer,.ßarstellung und Nutzung von ExpertIInwis und Perspektiven. Berlln, Oktober 1986. Herausgegeben von G. sen fOr ein Bildanalysesystem. )(111, 270 Seiten. fli85. Hommel und S. Schindler. XVII, 703 Selten. 1986. Band 105: G. E. Maler, Exceptionbehandlung und Synchronisation. Band 127: GI-17. Jahrestsgung.lnformatik-Anwendungen -Trends IV, 359 Seiten. 1985. und Perspektiven. Berlln, Oktober 1986. Herausgegeben von G. Hommel und S. Schindler. XVII, 685 Seiten. 1986. Band 106: Österreichische Artificial Inteiligence Tagung. Wien, September 1985. Herausgegeben von H. Trost und J. Relti. VIII, Band 128: W. Benn, Dynamische nicht-normalisierte Relationen 211 Seiten. 1985. und symbolische Bildbeschreibung. XIV, 153 Selten. 1986. Band 129: Informatlk-Grundblldung in Schule und Beruf. GI-Fach Band 107: Mustererkennung 1985. Proceedlngs, 1985. Herausge tsgung, Kaiserslautern, September/Oktober 1986. Herausgege geben von H. Niemann. XIII, 338 Selten. 1985. ben von E. v. Pultkamer. XII, 486 Seiten. 1986. Band 108: GIIOCG/ÖGJ-Jahrestsgung 1985. Wien, September Band 130: Kommunikation in Verteilten Systemen. GIINTG-Fach 1985. Herausgegeben von H. R. Hansen. XVII, 1086 Selten. 1985. tsgung, Aachen, Februar 1987. Herausgegeben von N. Gerner und O.Spanloi. XII, 812 Seiten. 1987. Band 109: Simulationstechnik. Proceedlngs, 1985. Herausge geben von D. P. F. MOlIer. XIV, 539 Seiten. 1985. Band 131: W.Scherl, Bildanalyse allgemeiner Dokumente. XI, 205 Seiten. 1987. Band 110: Messung, ModelIIerung und Bewertung von Rechen Band 132: R. Studer, Konzepte fOr eine verteilte wissensbasierte systemen. 3. GIINTG-Fachtagung, Dortmund, Oktober 1985. Her Softwareproduktionsumgebung. XI, 272 Seiten. 1987. ausgegeben von H. Beilner. X, 389 Seiten. 1985. Band 133: B. Freisieben, Mechanismen zur Synchronisation paral Band 111: Kommunikation in Verteilten Systemen 11. GIINTG-Fach leler Prozesse. VIII, 357 Seiten. 1987. tagung, Karlsruhe, Mlirz 1985. Herausgegeben von D. Heger, G.KrOger, O.Spaniol und W.Zorn. XII, 236 Selten. 1985. Band 134: Organisation und Betrieb der verteilten Datenverarbei tung. 7. GI-Fachgesprlich, M!lnchen, Mlirz 1987. Herausgegeben Band 112: Wissensbasierte Systeme. GI-KongreB 1985. Heraus von F.Pelschl. VIII, 219 Seiten. 1987. gegeben von W. Brauer und B. Radig. XVI, 402 Seiten, 1985. Band 135: A. Meier, Erweiterung relationaler Datenbanksysteme fOr technische Anwendungen. IV, 141 Selten. 1987. Band 113: Datenschutz und Datensicherung im Wandel der Infor mationstechnologien. 1. GI-Fachtsgung, MOnehen, Oktober 1985. Band 136: Datenbanksysteme In BOro, Technik und Wissenschaft. Proceedings, 1985. Herausgegeben von P. P. Sples. VIII, 257 Seiten. GI-Fachtsgung, Darmstsdt, April 1987. Proceedings. Herausge 1985. geben von H.-J.Schek und G.Schlageter. XII, 491 Selten. 1987. Band 114: Sprachverarbeitung in Information und Dokumentstion. Band 137: D. Llenert, Die KonfIgurierung modular aufgebauter Da Proceedings, 1985. Herausgegeben von B. Endres-Niggemeyer tenbanksysteme. IX, 214 Seiten. 1987. und J. Krause. VIII, 234 Seiten. 1985. Band 138: R. Mlinner, Entwurf und Realisierung eines MultIprozes sors. Das System .Heidelberger POLYp·. XI, 217 Seiten. 1987. Band 115: A. Kobsa, Benutzermodellierung in Dialogsystemen. XV, 204 Seiten. 1985. Band 139: M. MarhOfer, Fehlerdiagnose fOr Schaltnetze aus Mo dulen mit partiell injektiven Pfadfunktionen. XIII, 172 Selten. 1987. Band 116: Recent Trends in Dats Type Specification. Edited by H.-J. Kreowski. VII, 253 pages. 1985. Band 140: H.-J. Wunderlich, ProbabIlIstische Verfahren fOr den Test hochintegrierter Schaltungen. XII, 133 Seiten. 1987. Band 117: J. ROhrich, Parallele Systeme. XI, 152 Seiten. 1986. Band 141 : E. G. Schukat-Talamazzini, Generlerung von Worthypo Band 118: GWAI-85. 9th German Workshop on Artlflcial Intelli thesen In kontinuierlicher Sprache. XI, 142 Seiten. 1987. gence. DassellSolling, September 1985. Edited by H. Stoyan. X, Band 142: H.-J. Novak, Textgenerierung aus visuellen Daten: Be 471 pages.1986. schreibungen von StraBenszenen. XII, 143 Seiten. 1987. Band 119: Graphik in Dokumenten. GI-Fachgesprlich, Bremen, Band 143: R. R. Wagner, R. Traunm!lller, H. C. Mayr (Hrsg.l,lnforma Mlirz 1986. Herausgegeben von F. Nake. X, 154 Selten. 1986. tionsbedarfsermlltlung und -analyse fOr den Entwurf von Infor mationssystemen. Fachtsgung EMISA, Llnz, Juli 1987. VIII, 257 Band 120: Kognitive Aspekte der Mensch-Computer-Interaktlon. Seiten. 1987. Herausgegeben von G. DirIich, C. Freksa, U. Schwatlo und K. Wim Band 144: H.Oberquelle, Sprachkonzepte fOr benutzergerechte mer. VIII, 190 Seitsn. 1986. Systsme. XI, 315 Seiten. 1987. Band 121: K. Echtle, Fehlermaskierung durch verteilte Systeme. Band 145: K. Rothermel, Kommunikationskonzepte f!lr verteilte X, 232 Seiten. 1986. transaktionsorientierte Systeme. XI, 224 Seiten. 1987. Informatik-Fachberichte 185 Herausgegeben von W. Brauer im Auftrag der Gesellschaft für Informatik (GI) Bernhard Mitschang Ein Molekül-Atom Datenmodell für Non-Standard -Anwend un gen Anwendungsanalyse, Datenmodell entwurf und Implementierungskonzepte Springer-Verlag Berlin Heidelberg New York London Paris Tokyo Autor Bernhard Mitschang Universität Kaiserslautern, Fachbereich Informatik Postfach 3049, 6750 Kaiserslautern CR SUbject Classifications (1987): H.2, J.6 ISBN-13: 978-3-540-50346-0 e-ISBN-13: 978-3-642-74122-7 DOl: 10.1007/978-3-642-74122-7 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabel len, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch Im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9.September1965 in der Fassung vom 24.Juni1985 zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestim mungen des Urheberrechtsgesetzes. © by Springer-Verlag Berlin Heidelberg 1988 2145/3140 -54321 0 - Gedruckt auf säurefreiem Papier vorwort Diese Arbeit entstand während meiner Tätigkeit als wissenschaftlicher Mitarbeiter im Teilprojekt 02 "Arbeitsplatzorientierte OB-Architekturen fOr Anwendungen mit hoher algorithmischer Parallelität" des Sonderforschungsbereichs 124 "VLSI-Entwurfsmethoden und Parallelität" am Fachbereich Informatik der Universität Kaiserslautern von 1983 bis 1988. FOr die Anregung, mich mit dem Thema "Datenmodellierung in Non-Standard-Anwendungen" zu befassen, die fortlaufende UnterstOtzung und Diskussionsbereitschaft sowie schließlich auch die Hinweise zur Gestaltung der Arbeit bin ich meinem akademischen Lehrer, Herrn Prof. Dr. Theo Härder, zu besonderem Dank verpflichtet. Herrn Prof. Dr. G. Zimmermann danke ich dafOr, daß er sich trotz des engen Zeitrahmens bereiterklärt hat, die Arbeit durchzusehen und die zweite Berichterstattung zu Obernehmen. Auch meinen Kollegen an der Universität und auch meinen frOhe ren Kollegen, die mittlerweile weggegangen sind, gilt es zu danken, weil sie mir ein kritisches Forum fOr meine Ideen waren und mich oft veranlaßten, Konzepte genauer zu untersuchen. Die allgemeinen Überlegungen zum PRIMA-System, die einen wesentlichen Teil meines Forschungsrahmens mitbestimmten, sind in solchen Arbeitsgruppendiskussionen entstanden. Mein Dank gilt weiterhin den vielen Diplomanden, ohne die es gar nicht möglich wäre, Prototypen in einer Hochschulumgebung zu entwiCkeln. Einer Reihe von Personen habe ich fOr ihre unerrnOdliche Hilfe bei der Umsetzung des Manuskripts in eine druckfertige Form dieser Arbeit zu danken. Schließlich geht mein herzlicher Dank an alle hier Ungenannten, besonders auch an meine Eltern und Geschwister, die mit ihrer moralischen UnterstOtzung entscheidend zum Gelingen der vorliegenden Arbeit beigetragen haben. Teile dieser Arbeit wurden im Zusammenhang mit anderen Personen erarbeitet. Im folgenden schließt sich deshalb eine Aufstellung an, die die einzelnen Themenkreise den Personen zuordnet, die wesentlichen Anteil an deren Bearbeitung hatten. Alle hier nicht erwähnten Bereiche wurden vom Verfasser selbst bearbeitet. VI Die Prototypsysteme KUNICAD, DBGEO, DBCHIP, mit Ausnahme des DBMED-Systems [HMP87), wurden ausschließlich im Rahmen von Diplomarbeiten unter der Betreuung durch den Verfasser entwickelt. Die Kooperation mit dem SFB-Teilprojekt B4 sei im Rahmen der DBCHIP-Entwicklung und der Folgearbeiten hier erwähnt. Die Implementierungsarbeiten am PRIMA-System wurden ebenfalls mit Diplomanden durchgeführt. Die mehr konzeptionellen Architekturfragen wurden im Kreise des SFB-Projekt-Kollegiums erarbeitet. Abschließend seien noch einige wichtige Veröffentlichungen aufgeführt, die wesentliche Teile der vorliegenden Arbeit berühren: [HHMM87, HHMS87, HR8S, Mi88]. Dem Springer-Verlag danke ich für die Veröffentlichung dieser Arbeit. Kaiserslautem, im August 1988 ~mhard Mitschang Zusammenfassung Ziel der vorliegenden Arbeit ist die Erarbeitung und Nutzbarmachung von Datenbankkonzepten für sog. Non-Standard-Anwendungen. Darunter versteht man im OB-Bereich Anwendungen aus den Gebieten CAD/CAM, VlSI-Entwurf, Software-Entwicklung, Büroautomatisierung, Expertensysteme etc. Die zentralen Fragestellungen, zu denen es Antworten zu finden gilt, sind: • Welche Anforderungen werden von den Non-Standard-Anwendungen an die Datenhaltung gestellt? • Wie sehen dazu passende Architekturen und Datenmodelle für NDBS (das sind DBS für Non-Standard-Anwendungen) aus? • Nach welchen Konzepten sind solche NDBS zu entwerfen und zu implementieren? Dazu werden verschiedene OB-basierte Prototypen analysiert und vergleichend einander gegenübergestellt. Im einzelnen wurden basierend auf konventionellen Datenbanksystemen verschiedenen Typs (Netzwerk-und Relationenmodell) Anwendungssysteme aus unterschiedlichen ingenieurwissenschaftlichen Bereichen (3D-Modellierung, Verwaltung geographischer. Daten und VlSI-Entwurfswerkzeug) sowie aus dem Expertensystembereich (Diagnosesystem) entwickelt; ihr leistungsverhalten wurde unter einer praxisnahen last aufgezeichnet und detailliert untersucht. Ausgehend von diesen Analyse- und Vergleichsergebnissen wird ein Anforderungskatalog erstellt, der konkrete Aussagen über die Datenstrukturen der Anwendungsobjekte und die zugehörigen Verarbeitungscharakteristika zusammenfaßt. Dieser Katalog dient dann als leitlinie für den Entwurf eines NDBS. Die wesentlichen Zielvorgaben umfassen die dynamische Aggregation von Objekten sowie die effektive Unterstützung von höheren anwendungsbezogenen Operationen. Diese werden vom Molekül-Atom-Datenmodell (MAD-Modell) in adäquater Weise berücksichtigt. Die geforderte Objektunterstützung wird im MAD-Modell durch das Konzept der dynamischen Molekülbildung und Molekülverarbeitung erfüllt. Die zugehörige Sprache Mal (moleeule query language) wird anhand der Teilsprachen zur Daten- und lastdefinition sowie zur Datenmanipulation, durch Beispiele ergänzt, erklärt. Die definierte Molekülalgebra dient, als Formalisierung des MAD-Modells, zur präzisen Semantikdefinition. Die sogenannte NDBS-Kern-Architektur wird dann als Rahmenarchitektur zur MAD-Implementierung im Prototypsystem PRIMA (Prototyp-Implementierung des MAD-Modells) verwendet. Das MAD-Modell mit seiner deskriptiven Spezifikation von dynamisch aggregierten Objekten definiert neue Aufgaben bzgl. der Objektabbildung und Objektverarbeitung und erlaubt daher im Gegensatz zu den herkömmlichen Datenmodellen neue Konzepte bei seiner Implementierung zu berücksichtigen. Die verwendeten Implementierungskonzepte werden erläutert und innerhalb des zugrundeliegenden Prototyps aufgezeigt. Inhaltsverzeichnis Seite 1. Einleitung und Motivation 2. Analyse von Non-Standard-Anwendungen 7 2.1 Beschreibung verschiedener Anwendungsklassen 8 2.2 Einige Prototypsysteme aus den Ingenieuranwendungen 13 2.2.1 Das KUNICAD-System 16 2.2.1.1 Systembeschreibung 16 2.2.1.2 Systembewertung 26 2.2.2 Das DBGEO-System 31 2.2.2.1 Systembeschreibung 32 2.2.2.2 Systembewertung 38 2.2.3 Das DBCHIP-System 44 2.2.3.1 Systembeschreibung 44 2.2.3.2 Systembewertung 50 2.3 Wissensbasierte Systeme 53 2.3.1 Aspekte der Datenhaltung in Expertensystemen am Beispiel des DBM ED-Systems 53 2.3.2 Wissensrepräsentation mit Frames 57 2.4 Charakteristika der Non-Standard-Anwendungen 64 2.4.1 Verallgemeinerung der Abbildungshierarchie 64 2.4.2 Flexible Objektbeschreibung und Objektverarbeitung 65 2.5 Anforderungen an adäquate Datenmodelle 68 3. Das Molekül-Atom-Datenmodell 71 3.1 Die grundlegenden Konzepte des MAD-Modells 71 3.2 Die Sprache Mal 76 3.2.1 Die Datendefinitionssprache 76 3.2.2 Die Datenmanipulationssprache 80 3.2.2.1 Überblick über die DMl-Anweisungen 81 3.2.2.2 Die FROM-Klausel 84 3.2.2.3 Die WHERE-Klausel 89 3.2.2.4 Die Projektion 96 3.2.2.5 Die DMl-Anweisungen 98 3.2.3 Die lastdefinitionssprache 105 3.3 Formalisierung des MAD-Modells 108 3.3.1 Eine Atomtypalgebra 108 3.3.2 Eine Molekültypalgebra 118 x 3.4 Beispiele und Abgrenzung zu anderen Datenmodellen 133 3.4.1 Verwendungsbeispiele für Mal 133 3.4.2 Abgrenzung zu anderen Datenmodellen 137 4. Implementierung des MAD-Modells 142 4.1 Architekturvorschläge für NDBS 142 4.1 .1 Die Zusatzebenen-Architektur 143 4.1.2 Die Kombinations-Architektur 144 4.1.3 Die Erweiterungs-Architektur 145 4.1.4 Die NDBS-Kern-Architektur 146 4.2 Das PRIMA-System 147 4.2.1 Systembeschreibung 148 4.2.2 Dynamische Aspekte 152 4.3 Das Zugriffssystem 155 4.3.1 Überblick über die Datenabbildung und Verarbeitungsaspekte 156 4.3.2 Die Zugriffssystemschnittstelle 159 4.3.2.1 Metadatenoperationen 159 4.3.2.2 Operationen auf Atomen 160 4.3.2.3 Operationen auf Atommengen 160 4.4 Das Datensystem 161 4.4.1 Verfeinerung der Komponentensicht 162 4.4.2 Anweisungsübersetzung 165 4.4.2.1 Techniken zur Anfragetransformation 166 4.4.2.2 Überblick über die einzelnen Übersetzungsschritte 171 4.4.3 Anweisungsausführung 173 4.4.3.1 Aufbau einfacher Moleküle 174 4.4.3.2 Aufbau komplexer Moleküle 175 4.4.3.3 Beispiel 177 4.4.4 Implementierungsstruktur 179 4.4.5 Bewertung 183 5. Zusammenfassung und Ausblick 185 Abbildungsverzeichnis 191 Tabellenverzeichnis 193 XI Anhang A Das Meß-und Analysesystem MESASU 194 A.1 Die Grobarchitektur von MESASU 194 A.2 Das Modell zur Analyse der Meßdaten 195 A.2.1 Voraussetzung und Begriffsbildung 195 A.2.2 Analyseverfahren 197 A.3 Verwendungsmöglichkeiten von MESASU 202 A.4 Beispielanalysen 202 B Mal-Syntax 210 C Hilfsdefinitionen 220 Literaturverzeichnis 223