ebook img

Data Warehousing und Data Mining: Eine Einführung in entscheidungsunterstützende Systeme PDF

453 Pages·2002·15.96 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Data Warehousing und Data Mining: Eine Einführung in entscheidungsunterstützende Systeme

Springer-Lehrbuch Springer-Verlag Berlin Heidelberg GmbH Markus Lusti Data Warehousing und Data Mining Eine Einführung in entscheidungs unterstützende Systeme Zweite, überarbeitete und erweiterte Auflage Mit 197 Abbildungen und 33 Tabellen , Springer Professor Dr. Markus Lusti Universität Basel WWZI Abteilung Wirtschaftsinformatik Petersgraben 51 CH-4051 Basel Schweiz E-mail: [email protected] Additional material to this book can be downloaded from http://extras.springer.com. ISBN 3-540-42677-9 Die Deutsche Bibliothek - CIP-Einheitsaufnahme Data Warehousing und Data Mining: Eine Einführung in entscheidungs unterstützende Systeme 1 Markus Lusti. - 2., überarb. und erw. Aufl. - Berlin; Heidelberg; New York; Barcelona; Hongkong; London; MaiJand; Paris; Tokio: Springer, 2002 (Springer-Lehrbuch) ISBN 978-3-540-42677-6 ISBN 978-3-642-56033-0 (eBook) DOI 10.1007/978-3-642-56033-0 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbeson dere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildun gen und Tabellen, der Funksendung, der MikroverfiJmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Be stimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. Septem ber 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungs pflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsge setzes. http://www.springer.de © Springer-Verlag Berlin Heidelberg 1999, 2002 Ursprünglich erschienen bei Springer-Verlag Berlin Heidelberg New York 2002 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in die sem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: Design & Production GmbH, Heidelberg SPIN 10853196 42/2202-5 4 3 2 I 0 - Gedruckt auf säurefreiem Papier Vorwort Gegenstanddieses Lehrbuchssind Architekturen,Methoden und Werkzeuge entscheidungsunterstiitzenderSystememit einem Schwerpunktaufdem Data Warehousing und Data Mining. Lemziel ist wenigerder Erwerb von Repro duktionswissenalsdieselbstandigeAnwendungvonMethodenundWerkzeu gen. DieCDROMladtzumNachvollzugundzurNeuentwicklungpraktischer Anwendungenein. Entwurfs- und programmiersprachlicheAlgorithmenver tiefen den Hintergrund, und kapitelweise Vergleiche erleichtem die Bewer tung altemativerMethoden und Werkzeuge. ImUnterschiedzu Lehrbiichern mit ahnlichenInhalten ... • beschrankt sich der Inhalt nicht auf die blosse Beschreibung entschei dungsunterstiitzender Systeme, sondem fiihrt auch in reprasentative Soft ware em. • lemtder Leseram Entwurfs- und QuellcodeeinfacherProgrammeden al gorithmischenHintergrundder Demonstrationssoftware kennen. • enthaltendie meistenKapitelBeispieleundAufgaben.Dabei gehtesweni ger urndie"bellsandwhistles"vonSoftwarealsurndiegrundlegendenEi genschaften reprasentativer Werkzeugklassen. Bedienungshinweise fin den sich in den Beispielen und Aufgaben sowie aufder CD ROM. DerTextbehandeltnach denbegrifflichenKlarungendesersten Kapitelszwei traditionelleArtender Entscheidungsunterstiitzung,dieNutzwertanalyseund die Tabellenkalkulation: Der Analytische Hierarchieprozess (AHP) ist eine mathematische Verfeinerung der Nutzwertanalyse und eignet sich zur rech nergestiitzten LosungschlechtstrukturierterAufgaben(Kapitel 2). Das dritte KapitelstelltAnsatzezurLosungwohlstrukturierterProblemeVOL Esfiihrtan Spreadsheets indie Whatif- Analyseein und veranschaulichtdie Losungde terministischer Probleme an der linearen Optimierung. Wahrend diese hohe Anforderungen an die Messqualitat stellt, setzen die regelbasierten Systeme desviertenKapitels"nur"mehroderwenigerscharfeExpertenregelnvoraus. Die Forschungsinteressender angewandtenInformatikfolgen Konjunkturzy klen. Die Kapitel 5 und 6 fiihren von den "Expertensystemen" - einem Buzzword der achtzigerJahre -zu zwei Schwerpunkten der neunzigerJahre: Data Warehousesbereitendie InhalteoperativerDatenbankensoauf,dass sy stematischesundzuverlassigesDataMining moglichwird. NacheinemUber blick tiber die wichtigsten Data Mining-Verfahren (Kapitel 6) konzentrieren sich dassiebteundachte KapitelaufzweiderverbreitetstenVerfahren,dieRe gelinduktionund die neuronalenNetze.ImGegensatzzu den modellgetriebe nen Methoden der Kapitel 3 bis 6 arbeiten sie datengetrieben und erkunden grosse Datenmengen mit rechenintensiven Verfahren. vi Vorwort Einzelne Abschnittesindbesserverstandlich,wenn SieiiberGrundkenntnisse derTabellenkalkulationundDatenbankverwaltungverfiigen undineinerpro zeduralen Spracheprogrammiert haben.Elementare Kenntnisse der linearen Algebraund Statistikerieichterndas Verstandnis einigerAIgorithmen. Die didaktische Gestaltungorientiertsich an den folgenden Grundsatzen: • Jedes Kapitel fasstdiewichtigstenErgebnissethesenartigzusammen,und Wiederholungsfragen priifen den Lernfortschritt. Die Antworten konnen Siemit den Web Quizzes der CD ROM priifen. • Vertiefungsaufgaben helfen bei der aktiven Aneignungdes Stoffes. • BibliographischeHinweise nennen Lehrbiicher, Zeitschriftenund Websi tes,diesichzurVertiefungeignen.DerTextselbstverzichtetderLeserlich keit halber aufdetaiIIierte Quellnachweise. • Die beiliegende CD ROM stellt erganzendes Unterrichtsmaterial bereit und enthaltmehr als800interaktiveFarbfolienmitHyperlinkszumGlos sar,zu Beispielen, Aufgaben, Demonstrationssoftwareund Websites. Software ist kurzlebig. Der Buchtext beschrankt sich deshalb auf die grundsatzlichen Eigenschaften von Anwendungen, Methoden und Werk zeugklassen. Informationeniiber Softwaretrendserhalten SieiiberdieHy perlinks der Foliensammlungund der Softwareanleitungen. WerdenTextund dieCDROM imUnterrichteinsetzt,wirdjenach Stunden dotationdeneinen oderanderenAbschnittweglassen. Eineerste Variante be schranktsichaufdasunmittelbaranwendungsrelevanteMaterial undlasstdas methodische Hintergrundwissen der folgenden Abschnitte weg: 2.5 (AHP), 4.5 (Regelverkettung),7.5(Regelinduktion)und 8.4 (neuronaleNetze). Eine andere Strategiebehalt diealgorithmischenLernzielebei, lasstabervertiefen deAbschnitteweg,zumBeispieldieAbschnitte3.3.3(WeitereArtenderOpti mierung),4.4.2(Erklarungen),5.5(AufgabenteilunginRechnernetzen),8.4.4 (Mehrstufiges Perzeptron)und 8.4.5 (CCN-Netze). Buchtextund Foliensammlungverwendendie folgenden Konventionen: • ~verweistaufdasGIossar(InderFoliensammlungfiihrteinKlickzurDefi nition). • JeJ steht vor einer rechnerpraktischenUbungsaufgabe. • W stehtvoreinem PDF-Dokument.InderFoliensammlungladteinKlick AdobeAcrobatzusammenmit dem Dokument. • Q stehtvordeniibrigenausfiihrbarenDateien. WennderDateiverweiskei nen Pfad enthalt, finden Sie die Datei im Verzeichnis ...\BeispieleAufga ben. InderFoliensammlungladteinKlickdieSoftwarezusammenmitder Vorwort vii ausfiihrbaren Datei.WennSiezumBeispielR Kioskstandort.xls ankli cken,dannwirddieArbeitsmappeKioskstandort.xlsinMSExcelgeladen. DerTexthaltsichausserdemandiefolgende Notation: • NeueingefiihrteBegriffesindfettmarkiert, Hervorhebungenkursiv. • Programmcode istimCourier-Zeichensatzgeschrieben. • EinekonsequentgeschlechtsneutraleSpracheerschwertdieVerstandlich keit.DerTextverzichtetdeshalbaufdiegleichzeitigeNennungmannlicher und weiblicherFormen. DieCDROMenthalteinigeProgramme inVisualBasicfiirApplikationen. VBAistnichtnurweitverbreitet,sondemlasstsichunterderEntwicklungs umgebung vonMSExcelaucheinfachineineBenutzeroberflache einbetten (DieWahlvon VBAerfolgtaus pragmatischen Griinden und ist nichtmit einemUrteiliiberdasProgrammierkonzeptvonVisualBasicverbunden).Der TextselbstenthaltnurwenigCode.DiemeistenAIgorithmen werdenverbal undentwurfssprachlicheingefiihrt. MitetwasProgrammiererfahrungwerden SiedenVBA-CodederCDROMimProgrammeditorvonMSExcelnachvoIl ziehenkonnen-auchdann,wennSienochniemitVBAgearbeitethaben. Wersichentschliesst,BeispieleundAufgaben,insbesondereProgrammeauf zunehmen,nimmtzusatzlicheFehierquelleninKauf.FurHinweiseauf'inhalt licheoderformaleFehlerinTextundProgrammenbinichdankbar.Miteinem KlickaufdasBriefsymboleinerFoliekonnenSieIhreBemerkungperE-Mail andenAutorsenden.Korrekturen zuTextundCDROMfindenSieaufder Websitehttp://www.wwz.unibas.chlwilbookslbucheus.html. BeiderErstellungvonAufgaben habenDr.Andreas Born, AndreasThum heer,Dr.UteTrappundThomasZubermitgeholfen.AlessioIshizaka,Christi anRittmann, Dr.DirkKrampe undProf.Dr.Rosenkranz habenausgewahlte Kapitel durchgesehen.Dr.AndreasBornhatwertvolleHinweisezurVBA Programmierung beigesteuert, undThomasZuberhatdenWebQuizimple mentiert.IchdankeallenherzlichfiirihreHilfe. MarkusLusti Friihling1999,Herbst200I viii Vorwort Vorwort zur2.Auflage DieAnderungenderzweitenAuflageerstreckensichaufdengedrucktenText unddieCDROM.ZumeinenbetreffenSiedieFormunddieVerstandlichkeit desTextsundderAbbildungen,zumanderenwurdeneinigeInhalteneukonzi piertundeinzelneAufgabenhinzugefiigt. VieleHyperlinks wurdenaktuali siert.DieSeitenzahlhatvorallemausdenfolgendenGriindenleichtzugenom men: • Abschnitt2.5tiberdentheoretischenHintergrundvonAHPwurdenerwei tertundverstandlicherformuliert. • DieAufgaben 3.la (-t BILANZANALYSEmitMSExcel)und5.10 (-t LA DEN)wurdenneuhinzugefiigt, • EinzelneAbschnittemitVertiefungshinweisenwurdenurnaktuellebiblio- graphischeAngabenerganzt, DiemeistenAnderungenbetreffendiebeiliegendeCDROM.EingrosserTeil derAufgaben derbeidenVerzeichnisse ...\BeispieleAufgaben wurdenange passtoderersetzt.EinigeHerstellerbietenstattzeitlichunbeschrankter De monstrationsprogramme nurnochEvaluationsversionen mitZeitstempel an. WeiIsiehsolchePriifprogramme schlechtfurdenUnterricht eignen,enthalt das Verzeichnis ...\Demonstrationsprogramme derCDROMauchzeitliche unbeschrankte Demonstrationsprogramme zum vorletzten Release. Zu Co gnosPowerPlay findenSieDemonstrationsprogramme zur letztenund vor letztenVersion. DasCDROM-Verzeiehnis ...\GrundlagenExcel\Fallbeispiel TESTSenthalt eine Datenbankanwendung, mit der Sie Mehrfachwahl-, Zuordnungs- und EssayaufgabenfurschriftlicheundinteraktiveTestserstellenkonnen.TESTS istalsFallstudiefurVeranstaltungenwie"Datenbanken" und"Anwendungs entwieklung" entstanden. TESTS lasst Sie nieht nur Priifungen verwalten, sondernfiihrtSietiberdieHilfeauchindieEntwicklungsumgebungderKapi tel4und8ein. BeiderVorbereitungderzweitenAuflagehabenDr.AndreasBorn,Andreas Thurnheer, Alessio IshizakaundPatrickWirzmitgeholfen.Ichdankeihnen herzlichfurdieHilfe. MarkusLusti Herbst2001 Inbalt Vorwort v Vorwortzur 2.Auflage viii 1EntscheidungsunterstiitzendeSysteme 1 1.1Entscheidungen 2 1.2EntscheidungsunterstiitzendeSysteme 3 1.3Entscheidungsunterstiitzende Methoden 5 2Analytischer Hierarchleprozess 15 2.1 Unterrichtsmaterial , 16 2.2 Grundlagen 16 2.3Messproblematik 20 2.4AnwendungmitExpertChoice 25 2.5Ein Blickindie Blackbox 32 2.5.1Grobe Berechnungder Prioritaten 34 2.5.2 Exaktere BerechnungderPrioritatenund Inkonsistenzen 36 2.6AHPim Vergleich 43 3Was-Wenn-Analyse 51 3.1 Unterrichtsmaterial 52 3.2Elementare Verfahren 52 3.2.1Einfache Neuberechnung 53 3.2.2Mehrfachoperation 54 3.2.3 Szenario 54 3.2.4 Einfache Zielwertsuche 55 3.3LineareOptimierung 61 3.3.1 Fallbeispiel. 62 3.3.2Verallgemeinerung 69 3.3.3Weitere Arten derOptimierung 76 3.4Lineare Optimierungim Vergleich 77 x Inhalt 4RegelbasierteSysteme 85 4.l Unterrichtsmaterial 86 4.2Grundlagen 86 4.2.1Wissensdarstellung 86 4.2.2Wissensherleitung 89 4.2.3Expertensysteme 93 4.3Regeln undEntscheidungsbdume 95 4.4AnwendungmitXpertRule KBS 98 4.4.1Wissenserwerb und Problemlosung 98 4.4.2 Erklarungen 107 4.5EinBlickindieBlackbox lll 4.5.1Entwurfeines einfachenRegelinterpreters 111 4.5.2 Implementationeines einfachenRegelinterpreters 116 4.6ExpertensystemeinderPraxis 119 4.7Regelbasierte Systeme im Vergleich l2l 5Data Warehousing 129 5.l Grundlagen l29 5.1.1 Operativeund analytische Datenbanken 130 5.1.2 Data Mart und EnterpriseData Warehouse 135 5.1.3 MehrdimensionaleDaten 142 5.2 EndbenutzerzugrijJ l47 5.2.1Unterrichtsmaterial. 148 5.2.2Konventionelle Datenbankabfragen 148 5.2.3 On Line Analytical Processing(OLAP) 153 5.2.4 OLAP mit Cognos PowerPlay 155 5.2.5Arten vonOLAP-Werkzeugen 160 5.2.6 Auswahl von OLAP-Werkzeugen 168 5.2.7 OLAP imVerg1eich 170 5.3Modellierung l73

Description:
Im Mittelpunkt dieses anwendungsbezogenen Lehrbuchs stehen Architekturen, Methoden und Werkzeuge entscheidungsunterst?tzender Systeme. Beispiele und Aufgaben erm?glichen die Entwicklung von Anwendungen mit der Demonstrationssoftware der CD ROM. Eine interaktive Foliensammlung veranschaulicht den Buc
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.