Datenanalyse und Klassifikation Herausgeber Herausgeber-Beiriite H. H. Bock, Aachen W. H. E. Day, St. John's O. Opitz, Augsburg E. Diday, Paris M. Schader, Mannheim A. Ferligoj, Ljubljana W. Gaul, Karlsruhe 1. C. Gower, Harpenden D.1. Hand, Milton Keynes P. Ihm, Marburg 1. Meulman, Leiden S. Nishisato, Toronto F.1. Radermacher, VIm R. Wille, Darmstadt Hans Goebl· Martin Schader (Hrsg.) Datenanalyse, Klassiflkation und Informations verarbeitung Methoden und Anwendungen in verschiedenen Fachgebieten Mit 58 Abbildungen Physica-Verlag Heidelberg Ein Untemehmen des Springer-Verlags Prof. Dr. Hans Goebl Universitat Salzburg Institut flir Romanistik Akademiestr. 24 A-S020 Salzburg Prof. Dr. Martin Schader Universitat Mannheim Lehrstuhl flir Wirtschaftsinformatik III SchloB 0-6800 Mannheim Gedruckt mit Unterstiitzung der Stiftungs-und Forderungsgesellschaft der Paris Lodron Uni versitat Salzburg. ISBN-13: 978-3-7908-0612-0 e-1SBN-13: 978-3-642-95893-9 DOl-10.1007/978-3-642-95893-9 Dieses Werk ist urheberrechtlich geschiitzt. Die dadurch begriindeten Rechte, insbesondere die der Ubersetzung, des Nachdruckes, des Vortrags, der Entnahme von Abbildungen und Ta bellen, der Funksendungen, der Mikroverfilmung oder der Vervielfliltigung aufanderen We gen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfliltigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechts gesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der Fassung vom 24. Juni 1985 zulassig. Sie ist grundsatzlich vergiitungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. © Physica-Verlag Heidelberg 1992 Softcover reprint of the hardcover I st edition 1992 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daB solche Na men im Sinne der Warenzeichen-und Markenschutz-Gesetzgebung als frei zu betrachten wa ren und daher von jedermann benutzt werden diirflen. Vorwort Der vorliegende Band umfaJ3t 24 Artikel, fiir die ingesamt 31 Autoren verantwortlich zeichnen. Es handelt sich dabei - mit Ausnahme des (von Herausgeberseite in Auft rag gegebenen) Beitrags von P. Simons - um Referate, die anlafilich der 15. Jahrestagung der Gesellschaft fiir Klassifikation an der Universitat Salzburg (Institut fiir Romanistik) in der Zeit vom 25. bis zum 27. Februar 1991 gehalten worden waren. Das wissenschaftliche Motto dieser Tagung lautete: Klassifikation, Datenanalyse und Informationsverarbeitung. Herausforderung fur die interdisziplinare Forschung. Tatsachlich deckten die mehr als 100 im Rahmen von Plenar- sowie Sektionsvortragen und von Workshops prasentierten Beitrage thematisch ein sehr breites Wissenschaftsspektrum ab, so daJ3 das interdisziplinare Programm der Jahrestagung eindrucksvoll realisiert wurde. Bei detaillierter Auflistung der an der Jahrestagung vertretenen Disziplinen konnen ins gesamt 14 Einzelwissenschaften genannt werden: Mathematik - Statistik - Linguistik - Philosophie - Bibliothekswesen - Datenbanken und Informationssysteme - Jurisprudenz - Wirtschaftswissenschaften - Demographie - K unst- und Altertumswissenschaften - Kriminologie - Medizin - Biologie - Geographie. Der im Rahmen des Kongresses iiber die Disziplingrenzen hinweg durchgefiihrte Ide enaustausch war wegen dieser sachlichen und methodischen Vielfalt iiberaus anregend und fruchtbar. Damit wurde einmal mehr bewiesen, daB das von der Gesellschaft fiir Klassifikation seit ihrer Griindung im Jahre 1977 konsequent verfolgte Programm des iibereinzelwissenschaftlichen Dialogs nicht nur ungebrochen zeitgemiiB ist, sondern auch von der communitas scientifica als notwendig und wiinschenwert angesehen wird. Ublicherweise wird nach Kongressen nur ein Teil der gehaltenen Referate in den Akten veroffentlicht. Von den zur Publikation eingereichten Beitriigen erscheinen - nach sorgfal tiger Vidierung durch unabhangige Referenten und einer entsprechenden Uberarbeitung - 35 auf englisch und 24 auf deutsch. Der englische Band wurde von Martin Schader (friiher Hamburg, jetzt Mannheim) herausgegeben und erschien 1991 beim Springer-Verlag (Hei delberg) unter dem Titel: "Analyzing and Modeling Data and Knowledge". Er stellt zugleich den zweiten Band der Reihe "Studies in Classification, Data Analysis, and Know ledge Organization" dar. Der hier vorliegende deutsche Band bildet dazu die inhaltliche Erganzung. Hinsichtlich der Anordnung seiner 24 Beitriige wurde von Herausgeberseite nach reifli cher Uberlegung den sachlich-inhaltlichen vor den methodischen Kriterien der Vorzug gegeben. Somit folgt die Gruppierung der einzelnen Artikel den in ihnen explizit oder implizit angesprochenen sachlich-inhaltlichen Thematiken. In lockerer Anlehnung an im deutschen Universitats- und Forschungsbetrieb iibliche Wissenschaftskataloge ergab sich solcherart eine siebenfache Untergliederung, die der Leser freilich eher cum grana salis als mittels einer Goldwaage beurteilen moge. Sie reicht von den Grund- und Integrativ wissenschaften (1), geht iiber die Geistes- (2) und Naturwissenschaften (3), umfaJ3t die Jurisprudenz (4) und die Dokumentationswissenschaften (5) und erstreckt sich bis zu den Wirtschaftswissenschaften (6) und der Medizin (7). vi Ruckblickend ergeht der Dank des Tagungsleiters an die folgenden Sponsoren der Salz burger Tagung: EMCO Maier GmbH, Hallein, Osterreichisches Bundesministerium fur Wissenschaft und Forschung, Wien, Osterreichische Forschungsgemeinschaft, Wien, Salzburger Landesregierung, Stadt Salzburg, Multimedia 2000, Salzburg. Dieser Dank schliefit auch die Mitarbeiter der Lehrkanzel III des Institutes fiir Romanistik der Universitat Salzburg ein, deren engagierter Einsatz den reibungslosen Ablauf der 15. Jahrestagung der Gesellschaft fUr Klassifikation sicherstellte. Was nunmehr diesen deutschen Tagungsband betrifft, so richtet sich die Dankbarkeit der Herausgeber an alle Autoren und an die bei der Begutachtung der Beitrage tatig gewordenen Referenten. Der Dialog zwischen beiden war in vielen Fallen uberaus intensiv und hilfreich und stellte damit eine indirekte Fortsetzung des im Februar 1991 in Salzburg begonnenen Gedankenaustausches dar. Bei der EDV-gestutzten Vorbereitung der Druckvorlagen und der Organisation des Fah nenkorrektur-Umlaufs waren mit Umsicht und Kompetenz die Herren Michael Eggerstedt und Stefan Marx tatig. Dafur gilt ihnen die besondere Dankbarkeit der Herausgeber, in die auch die Leitung des Physica-Verlags (Heidelberg) eingeschlossen werden solI, die sich zielstrebig fUr die Publikation dieses Buches eingesetzt hat. Salzburg, Mannheim, Dezember 1991 Hans Goebl Martin Schader Inhalt 1 Grund- und Integrativwissenschaften Klassifikation aus wissenschaftstheoretischer Perspektive J. Hafner . ..................... . 3 Die Art als basales Element des Systems der Organismen. Ein Klassifikationsproblem J. Hohenegger . . . . . . . . . . . . . . . . . . . . . 11 Philosophische Aspekte der Klassifikation P. Simons . ............. . 21 2 Geisteswissenschaften Zwei Grundprinzipien der Wortschatzklassifikation U.L. Figge .................. . 31 Sprachliche Klassifikation und Analyse von Nominalkomposita in Speisebezeichnungen anhand informatischer und statistischer Methoden M. Kauffer ......................... . 37 Einsatz numerischer Verfahren fiir Textiiberlieferungsprobleme J. K ristophson . . . . . . . . . . . . . . . . . . . . . . . . 47 Sprachgeographische Datenanalyse im germanophonen Lothringen M. Philipp, G. Levieuge und E. Levieuge-Colas ........ . 55 SERION - Programmpaket zur chronologischen und chorologischen Auswertung archaologischer Daten P. Stadler ......................... . 69 Nichtreduktive Darstellung und Analyse von Meinungs-Netzen mit PC-Unterstiitzung J. Zeiger . ......................... . 87 3 Naturwissenschaften Beispiele zur Klassifikation avifaunistischer Daten W. GerfJ ................... . 103 Kartographie und hochinteraktive Datenanalyse. Ein Konzept M. Nagel, H. Horing und K.-D. Wernecke ........ . 115 Stadtregionen und Agglomerationen: Die Vielfalt statistischer Definitionen von urbanen Raumen in Europa M. Schuler . . . . . . . . . . . . . . . . . . . . . . . .. ........ 125 Konstruktion von Beziehungen zwischen Klassifikationsklassen: Ein quantitativer Ansatz R. Todorov und M. Winterhager . . . . . . . . . . . . . . . . . . . . . . . 137 4 J urisprudenz Wahrscheinlichkeit, Statistik und Recht C. Scholl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Vlll 5 Dokumentationswissenschaften Drehscheibe ISBN: Weg zum internationalen Fachworterbuch H. Havekost . . . . . . . . . . . . . . . . . . . . . . . . 171 Sacherschlief3ung von Literatur durch Stichwortsuche im OPAC? B. Lorenz . ................................. . 189 TAXIS - Ein elektronischer Bibliotheks-Katalog L. Preuss . ................................. . 197 Halbautomatische Volltextanalyse, Datenbankaufbau und Document Retrieval M. Yolk, H. Mittermaier, A. Schurig und T. Biedassek . . . . . . . . . . . 205 6 Wirtschaftswissenschaften Dynamisierung strategischer Planungsinstrumente mit Hilfe multimodaler Analysemodelle O. Kessing . ...................... . . ... 217 Die Integration der Zeitreihenanalyse in Management-Entscheidungs systeme unter Berucksichtigung software-ergonomischer Entwurfs- und Bewertungskri terien H.-G. Nollau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Designanalyse und Packungsoptimierung C. Steckner. . . . . . . . . . . . . . 241 7 Medizin Untersuchungen zur Selektivitat formal erzeugter Deskriptoren bei der halbautomatischen Klassifizierung medizinischer Texte R.-J. Fischer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 Die Reprasentantenanalyse - ein neuer Weg zur Strukturierung von Variablen oder Objekten J. Grimm . ..................... . 265 Ein Diskriminationsverfahren fiir gemischte Datensatze K.-D. Wernecke . . . 271 Sach- und N amensindex 279 Teil! Grund- und Integrativwissenschaften Klassifikation aus wissenschaftstheoretischer Perspektive J. Hafner Institut fiir Wissenschaftstheorie und Wissenschaftsforschung, Universitiit Wi en Sensengasse 8, 1090 Wien, AUSTRIA Inhalt: Fiir ein besseres Verstandnis des Zusammenspiels von Klassifikation und empirischen Theorien ist es notwendig, iiber ein methodisches Instrumentarium zu verfUgen, das es gestat tet, vorhandene Verkniipfungen der Klassifikationsbegriffe und -methoden mit theoretischen Elementen (hypothetischen Voraussetzungen, theorienbeladenen und theoretischen Begriffen) gegebenenfalls festzustellen und genau zu spezifizieren. Mittels einer Unterscheidung und Klas sifikation von verschiedenen moglichen Arten des Theoriebezugs auf der begrifRichen Ebene soli die Basis fUr so ein Instumentarium gelegt werden. Dabei wird auf die modernen wissen schaftstheoretischen Methoden, u.a. speziell auf das neue Kriterium fUr Theoretizitat von J.D. Sneed zuriickgegriffen. Ein Anwendungsbeispiel skizziert die Moglichkeiten der vergleichenden und methodologischen Analyse, die durch diese Perspektive eroffnet werden, fUr die Diskussion innerhalb der biologischen Systematik. 1 Einleitung und Problemstellung Der allgemeine Zusammenhang zwischen Klassifikationen und wissenschaftlicher Theorie bildung ist auf weite Strecken noch nicht hinreichend gekliirt. Der rein mathematisch statistische Zugang, der solche Beziige zum Umfeld von Klassifikationsvorgiingen zu meist ausklammert bzw. nicht in den Mittelpunkt stellt, ist in Hinblick auf ein besseres Verstiindnis von Klassifikationen und deren Funktion in empirischen Theorien zu erganzen durch eine wissenschaftstheoretische Analyse der engen Verflechtung von klassifikatori schen Methoden und hypothetischen bzw. begrifHichen Voraussetzungen von Theorien, speziell jener, in der die Klassifikation erfolgt. Zentrale Fragen, die diese wechselseitige Abhiingigkeit betreffen, sind etwa: (A) Von welcher Art und wie groB ist der "theoretische Gehalt" einer Klassifikation? D.h. wo gehen von einer oder mehreren empirischen Theorien herstammende Ele mente (Hypothesen, theoriebeladene Begriffe) explizit oder implizit in eine Klassi fikation ein? (B) Welche Funktion hat umgekehrt die Klassifikation innerhalb einer Theorie? In wel chern AusmaB priigt sie die Struktur der Theorie und beeinfluBt deren Prognose bzw. Erk liirungspoten tial ? 1m folgenden mochte ich mich hier auf die Frage (A) konzentrieren, genauer: auf das Problem, ob und wie die Theorienabhiingigkeit von Klassifikationen im einzelnen aufge schliisselt und priizis bestimmt werden kann. 4 2 Allgemeine hypothetische Elemente in Klassifika tionen In einem ersten Zugang sind jene Voraussetzungen herauszuarbeiten, die grundlegend fiir jedes wissenschaftliche Vorgehen sind und insofern gewisserma.fien den elementarsten theoretischen "Input" in Klassifikationen darstellen. Wie Stegmiiller (1983) im Rahmen einer genaueren Analyse der Begriffsformen gezeigt hat, lassen sich nicht einmal die ein fachsten Begriffsformen: die qualitativen oder klassifikatorischen Begriffe allein auf der Basis von Konventionen einfiihren. Bei Beantwortung der Frage, ob die beiden Adaquatheitsbedingungen fur klassifikato rische Begriffe jeweils ediillt sind, namlich einen Gegenstandsbereich (i) vOllstandig in (ii) disjunkte Klassen zu zerlegen, mufi einerseits auf empirische Tatsachenfeststellungen, andererseits auf hypothetische Generalisierungen Bezug genommen werden. Dies gilt zu mindest dann, wenn die Bedingungen (i) und (ii) aus den Definitionen der die einzelnen Klassen konstituierenden Merkmale nicht schon logisch folgen. Das ist jedoch der wissen schaftlich wesentlich haufigere und interessantere Fall. In analoger Weise wie der Aufbau qualitativer Begriffe ist auch die Einfiihrung der hoheren - komparativen und metrischen - Begriffsformen notwendig mit empirisch-hypothetischen Voraussetzungen verbunden, etwa der Annahme von gewissen Adaquatheitsbedingungen fiir die Ordnungsrelationen oder allgemeinen Mafiprinzipien. (Diese grundlegenden theoretischen Komponenten von Klassifikationen auf der begrifHichen Ebene miissen scharf getrennt werden von den Hy pothesen, die mit praktischen Mefivedahren zusammenhangen. Letztere betreffen nicht die erstmalige Einfiihrung von Begriffen, sondern treten im Rahmen der statistischen Testtheorie auf, und zwar bei dem Problem der Ermittlung eines genauen Mefiwertes aus ungenauen Mefidaten.) 3 Theorienbeladenheit Ein weiterer theoretischer Faktor ist die sog. "Theorienbeladenheit" aller Beobachtungs daten. Sie stellt bereits eine iiber die element are, fast allen Theorien gemeinsame me thodische Ebene hinausgehende Verkniipfung mit speziellen wissenschaftlichen Theorien her. Es handelt sich dabei um die erstmals von Hanson (1958) formulierte These, daB es keine neutrale, theorienunabhangige Beobachtungssprache gibt, "daB das, was Tatsache fiir eine Theorie ist, durch eine andere Theorie bestimmt wird" (Stegmiiller (1985), S.34). Churchland (1975) unterscheidet innerhalb der Theorienbeladenheit weiter einen inten sionalen und einen extensionalen Aspekt. Ein Pradikat ist demnach theorienabhangig auf der intensionalen Ebene, wenn seine Bedeutung (teilweise) von einer Anzahl allgemei ner Satze einer wissenschaftlichen Theorie, in denen dieses Pradikat vorkommt, festgelegt wird. Eine vollig theoriefreie, rein phanomenologische Riickfiihrung des Vokabulars einer Thea rie auf Sinneswahrnehmungen ist nicht durchfiihrbar -auch die innerhalb einer Klassifika tion verwendeten Begriffe sind davon betroffen, selbst wenn keine explizite Bezugnahme auf eine konkrete Theorie stattfindet. Die extensionale Komponente bedeutet demge geniiber, daB unterschiedliche Beobachtungssprachen jeweils ganzlich andere Aufgliede rungen der Welt induzieren konnen: "possible observation vocabularies can differ radically in the extensional classes into which they divide the observational world" (Churchland