ebook img

Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit SPSS PDF

371 Pages·2006·3.99 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit SPSS

Springer-Lehrbuch Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit SPSS MitBeiträgenvon MichaelSchomakerundMalteWißmann Fünfte,aktualisierteunderweiterteAuflage Mit196Abbildungen und48Tabellen 123 ProfessorDr.Dr.HelgeToutenburg PDDr.ChristianHeumann Ludwig-Maximilians-UniversitätMünchen InstitutfürStatistik Akademiestraße1 80799München [email protected] [email protected] Die2.AuflageerschienbeiPrenticeHall,München,1998,ISBN3-8279-9551-3 ISSN 0937-7433 ISBN-10 3-540-36338-6 SpringerBerlinHeidelbergNewYork ISBN-13 978-3-540-36338-5 SpringerBerlinHeidelbergNewYork ISBN 3-540-22233-2 4.AuflageSpringerBerlinHeidelbergNewYork BibliografischeInformationderDeutschenBibliothek DieDeutscheBibliothekverzeichnetdiesePublikationinderDeutschenNationalbibliografie;detaillierte bibliografischeDatensindimInternetüberhttp://dnb.ddb.deabrufbar. DiesesWerkisturheberrechtlichgeschützt.Diedadurch begründetenRechte,insbesonderedieder Übersetzung,desNachdrucks,desVortrags,derEntnahmevonAbbildungenundTabellen,derFunk- sendung,derMikroverfilmungoderderVervielfältigungaufanderenWegenundderSpeicherungin Datenverarbeitungsanlagen,bleiben,auchbeinurauszugsweiserVerwertung,vorbehalten.EineVer- vielfältigungdiesesWerkesodervonTeilendiesesWerkesistauchimEinzelfallnurindenGrenzender gesetzlichenBestimmungendesUrheberrechtsgesetzesderBundesrepublikDeutschlandvom9.Septem- ber1965inderjeweilsgeltendenFassungzulässig.Sieistgrundsätzlichvergütungspflichtig.Zuwider- handlungenunterliegendenStrafbestimmungendesUrheberrechtsgesetzes. SpringeristeinUnternehmenvonSpringerScience+BusinessMedia springer.de ©Springer-VerlagBerlinHeidelberg2000,2004,2006 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigtauchohnebesondereKennzeichnungnichtzuderAnnahme,dasssolcheNamenimSinne derWarenzeichen-undMarkenschutz-Gesetzgebungalsfreizubetrachtenwärenunddahervonjed- ermannbenutztwerdendürften.TextundAbbildungenwurdenmitgrößterSorgfalterarbeitet.Verlag undAutorkönnenjedochfüreventuellverbliebenefehlerhafteAngabenundderenFolgenwedereine juristischeVerantwortungnochirgendeineHaftungübernehmen. Satz: Herstellung:LE-TEXJelonek,Schmidt&VöcklerGbR,Leipzig Einbandgestaltung:WMXDesignGmbH,Heidelberg SPIN:11794004 154/3100–543210 GedrucktaufsäurefreiemPapier Vorwort Die bisher vier Auflagen des Buches ”Deskriptive Statistik” haben sich in zahlreichen Lehrveranstaltungen - insbesondere bei Statistik I fu¨r Wirt- schaftsstudenten - als wertvolles Hilfsmittel bei der Lehre selbst, in den U¨bungsgruppen und im Selbststudium erwiesen. Mit dieser 5. Auflage wurden - wie wir hoffen - alle noch vorhandenen Rechenfehler in den Aufgaben (durch Programmieren in R) beseitigt. Als zus¨atzliche Elemente wurden der Umgang mit fehlenden bzw. unvollst¨andi- genDaten,diesachgerechteGestaltungvonGrafikenselbstsowieexplorative Grafikenfu¨rmehrereVariablen,ModelleundMaßefu¨rdasRater-Agreement sowie eine Einfu¨hrung in das Statistik - Paket SPSS aufgenommen. Wir hof- fen,dassdieseVerbesserungen-diezumTeilkonkurrenzlosaufdiesemLevel sind - Anklang bei den Lesern finden. Die Autoren Mu¨nchen, im Juli 2006 Vorwort zur vierten Auflage In der Tagespresse und in den TV-Nachrichten sowie durch die zunehmende Verbreitung von Computern in Ausbildung und Beruf begegnen uns statisti- sche Ausdru¨cke wie Trends, Mittelwerte, H¨aufigkeiten usw. t¨aglich. Der Begriff Statistik wird heute in mehreren Bedeutungen verwendet: • synonym zum Begriff der amtlichen Statistik, • als wissenschaftliche Disziplin, • als praxisorientierte Methode zur Entscheidungshilfe. Umgangssprachlich ist die Statistik die Lehre der Analyse von Massen- erscheinungen. Die Statistik wird methodisch gegliedert in deskriptive und induktive Statistik. Ziel der deskriptiven Statistik ist die Aufbereitung und grafische Darstellung von Daten und damit die Konzentration von Daten- mengen auf aussagef¨ahige Maßzahlen und Plots. In der induktiven Statistik werden die notwendigen Verfahren zur statistischen Absicherung von Model- len und zur Pru¨fung von Hypothesen bereitgestellt. Es gibt eine Vielzahl deutschsprachiger Bu¨cher zur Statistik, wobei die Autoren unterschiedliche Schwerpunkte gesetzt haben – von der Darstellung spezifischer Lehrinhalte in ausgew¨ahlten Fachdisziplinen (Statistik fu¨r So- ziologen, Zahnmediziner, Mediziner etc.) bis hin zu ausgefeilten Methoden- sammlungen (Explorative Datenanalyse) oder erweiterten Handbu¨chern von Standard-Software. Das vorliegende Buch soll insbesondere • den Stoff der Vorlesung Statistik I in wesentlichen Teilen abdecken, • eine Verbindung zwischen den Methoden der deskriptiven Statistik und ihrer Umsetzung mit Standard-Software, hier am Beispiel von SPSS, her- stellen, • alsLehr-undU¨bungsmaterialdurchEinschlussvonAufgabenmitMuster- l¨osungen die Ausbildung der Studenten unterstu¨tzen. DerLehrstoffzumGebietInduktiveStatistikwirdineinemweiterenBand behandelt (Toutenburg, 2004). Der Autor und seine Mitarbeiter haben sich bemu¨ht,ihreErfahrungenausdemLehr-undU¨bungsbetriebsoumzusetzen, dass der Text den Anforderungen eines begleitenden Lehr- und U¨bungsma- terials gerecht wird. Die Einbeziehung von SPSS soll eine Erg¨anzung zum VIII Vorwort zur vierten Auflage u¨blichen Taschenrechnereinsatz sein und den Weg zur modernen Arbeitswei- se bei der Datenanalyse mit dem Computer ebnen. Der vorliegende Band stellt eine grundlegende U¨berarbeitung und Erwei- terung des Buches Deskriptive Statistik, an der Herr Dr. Christian Kastner und Herr Dr. Andreas Fieger maßgeblich beteiligt waren, dar und entstand aufEinladungdesSpringerVerlags,Heidelberg.Wirdankenallenjetzigenso- wiefru¨herenMitarbeiternderAGToutenburg,diedurchzahlreichekritische Hinweise die Gestaltung des Inhalts wesentlich unterstu¨tzt haben. Weiter- hin danken wir allen Tutoren, die bei der Gestaltung der Musterl¨osungen mitgewirkt haben. Natu¨rlich sind wir fu¨r alle enthaltenen Fehler selbst ver- antwortlich. Helge Toutenburg Inhaltsverzeichnis Vorwort ...................................................... V Vorwort zur vierten Auflage .................................. VII 1. Grundlagen............................................... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung......................................... 7 1.4 Datenaufbereitung...................................... 13 1.5 Aufgaben und Kontrollfragen ............................ 18 2. H¨aufigkeitsverteilungen................................... 21 2.1 Absolute und relative H¨aufigkeiten........................ 21 2.1.1 Qualitative Merkmale............................. 21 2.1.2 Quantitative Merkmale............................ 23 2.2 Empirische Verteilungsfunktion........................... 28 2.2.1 Ordinale Merkmale und diskrete Merkmale .......... 28 2.2.2 Stetige Merkmale................................. 31 2.3 Grafische Darstellung ................................... 34 2.3.1 Stab- oder Balkendiagramme ...................... 34 2.3.2 Kreisdiagramme.................................. 37 2.3.3 Stamm-und-Blatt-Diagramme...................... 38 2.3.4 Histogramme .................................... 40 2.3.5 Kerndichtesch¨atzer ............................... 44 2.4 Aufgaben und Kontrollfragen ............................ 45 3. Maßzahlen fu¨r eindimensionale Merkmale ................ 51 3.1 Lagemaße ............................................. 51 3.1.1 Modus oder Modalwert ........................... 52 3.1.2 Median und Quantile ............................. 54 3.1.3 Quantil-Quantil-Diagramme (Q-Q-Plots) ............ 59 3.1.4 Arithmetisches Mittel............................. 61 3.1.5 Geometrisches Mittel ............................. 67 3.1.6 Harmonisches Mittel.............................. 71 X Inhaltsverzeichnis 3.2 Streuungsmaße......................................... 74 3.2.1 Spannweite und Quartilsabstand ................... 75 3.2.2 Mittlere absolute Abweichung vom Median .......... 76 3.2.3 Varianz und Standardabweichung................... 77 3.2.4 Variationskoeffizient .............................. 82 3.3 Schiefe und W¨olbung ................................... 83 3.3.1 Schiefe .......................................... 83 3.3.2 W¨olbung ........................................ 84 3.4 Box-Plots ............................................. 85 3.5 Konzentrationsmaße .................................... 86 3.5.1 Lorenzkurven .................................... 88 3.5.2 Gini-Koeffizient .................................. 89 3.6 Aufgaben und Kontrollfragen ............................ 93 4. Maßzahlen fu¨r den Zusammenhang zweier Merkmale ..... 99 4.1 Darstellung der Verteilung zweidimensionaler Merkmale ..... 99 4.1.1 Kontingenztafeln bei diskreten Merkmalen........... 99 4.1.2 Grafische Darstellung bei diskreten Merkmalen....... 103 4.1.3 Maßzahlen zur Beschreibung der Verteilung bei steti- gen und gemischt stetig-diskreten Merkmalen ........ 105 4.1.4 Grafische Darstellung der Verteilung stetiger bzw. ge- mischt stetig-diskreter Merkmale ................... 107 4.2 Maßzahlenfu¨rdenZusammenhangzweiernominalerMerkmale109 4.2.1 Pearsons χ2-Statistik ............................. 111 4.2.2 Phi-Koeffizient................................... 114 4.2.3 Kontingenzmaß von Cramer ....................... 116 4.2.4 Kontingenzkoeffizient C ........................... 117 4.2.5 Lambda-Maße ................................... 118 4.2.6 Der Yule-Koeffizient .............................. 120 4.2.7 Der Odds-Ratio .................................. 122 4.3 Maßzahlen fu¨r den Zusammenhang ordinaler Merkmale...... 124 4.3.1 Gamma ......................................... 125 4.3.2 Kendalls tau-b und Stuarts tau-c ................... 127 4.3.3 Rangkorrelationskoeffizient von Spearman ........... 128 4.4 Zusammenhang zwischen zwei stetigen Merkmalen.......... 132 4.5 Explorative Grafiken fu¨r mehrere Variablen ................ 139 4.5.1 Coplots ......................................... 139 4.5.2 Chernoff Faces ................................... 144 4.6 Sachgem¨aße Gestaltung von Grafiken ..................... 146 4.6.1 Ad¨aquate Skalierung.............................. 147 4.6.2 Einfluss von Extremwerten ........................ 149 4.6.3 Geschickte Wahl einer Grafik ...................... 152 4.6.4 Probleme bei der Berechnung einer linearen Regression 157 4.7 Maße zur Messung der U¨bereinstimmung von Beobachtern... 158 4.7.1 Kappa–Koeffizient................................ 160 Inhaltsverzeichnis XI 4.7.2 Gewichtetes Kappa ............................... 164 4.8 Aufgaben und Kontrollfragen ............................ 167 5. Zweidimensionale quantitative Merkmale: Lineare Regres- sion....................................................... 171 5.1 Einleitung ............................................. 171 5.2 Plots und Hypothesen................................... 173 5.3 Prinzip der kleinsten Quadrate ........................... 175 5.3.1 Bestimmung der Sch¨atzungen ...................... 177 5.3.2 Herleitung der Kleinste-Quadrate-Sch¨atzungen ....... 177 5.3.3 Eigenschaften der Regressionsgeraden ............... 179 5.4 Gu¨te der Anpassung .................................... 183 5.4.1 Varianzanalyse................................... 183 5.4.2 Korrelation ...................................... 186 5.5 Residualanalyse ........................................ 191 5.6 Lineare Transformation der Originaldaten ................. 191 5.7 Multiple lineare Regression und nichtlineare Regression ..... 193 5.8 Polynomiale Regression ................................. 195 5.9 Lineare Regression mit kategorialen Regressoren............ 197 5.10 Spezielle nichtlineare Modelle – Wachstumskurven .......... 201 5.11 Aufgaben und Kontrollfragen ............................ 202 6. Zeitreihen ................................................ 207 6.1 Kurvendiagramme ...................................... 207 6.2 Zerlegung von Zeitreihen ................................ 208 6.3 Fehlende Werte, ¨aquidistante Zeitpunkte .................. 209 6.4 Gleitende Durchschnitte................................. 209 6.5 Saisonale Komponente, konstante Saisonfigur .............. 211 6.6 Modell fu¨r den linearen Trend............................ 215 6.7 Praktisches Beispiel mit SPSS............................ 217 6.8 Aufgaben und Kontrollfragen ............................ 219 7. Verh¨altniszahlen und Indizes ............................. 221 7.1 Einleitung ............................................. 221 7.2 Einfache Indexzahlen ................................... 223 7.2.1 Ver¨anderung des Basisjahres ....................... 224 7.3 Preisindizes............................................ 226 7.3.1 Preisindex nach Laspeyres......................... 227 7.3.2 Preisindex nach Paasche .......................... 228 7.3.3 Alternative Preisindizes ........................... 229 7.4 Mengenindizes ......................................... 229 7.4.1 Laspeyres-Mengenindex ........................... 230 7.4.2 Paasche-Mengenindex............................. 230 7.5 Umsatzindizes (Wertindizes) ............................. 230 7.6 Verknu¨pfung von Indizes ................................ 231 XII Inhaltsverzeichnis 7.7 Spezielle Probleme der Indexrechnung..................... 233 7.7.1 Erweiterung des Warenkorbs....................... 233 7.7.2 Substitution einer Ware ........................... 234 7.7.3 Subindizes....................................... 235 7.8 Standardisierung von Raten und Quoten .................. 237 7.8.1 Datengestaltung fu¨r die Standardisierung von Raten .. 240 7.8.2 Indirekte Methode der Standardisierung............. 240 7.8.3 Direkte Standardisierung .......................... 244 7.9 Ereignisanalyse......................................... 247 7.9.1 Problemstellung.................................. 247 7.9.2 Grundbegriffe der Lebensdaueranalyse .............. 250 7.9.3 Empirische Hazardrate und U¨berlebensrate .......... 252 7.10 Aufgaben und Kontrollfragen ............................ 256 8. Fehlende Daten........................................... 261 8.1 Betrachtung eines einzelnen Merkmals .................... 261 8.1.1 Behandlung fehlender Daten fu¨r ein bin¨ares Merkmal . 264 8.1.2 Behandlung fehlender Daten fu¨r ein nominales Merkmal269 8.1.3 Behandlung fehlender Daten fu¨r ein ordinales Merkmal 270 8.1.4 BehandlungfehlenderDatenfu¨reinmetrischesMerkmal274 8.2 Betrachtung zweier Merkmale............................ 279 8.2.1 Zwei bin¨are Merkmale ............................ 281 8.2.2 Zwei metrische Merkmale.......................... 285 9. Einfu¨hrung in SPSS ...................................... 289 9.1 Grundaufbau des Programms ............................ 289 9.1.1 Das Datenfenster................................. 290 9.1.2 Das Grafikfenster................................. 291 9.1.3 Das Syntaxfenster ................................ 291 9.2 Ein praktisches Beispiel ................................. 292 9.2.1 Aufbau des Datensatzes ........................... 292 9.2.2 Deskriptive Analyse .............................. 293 9.2.3 Zusammenhangsanalyse ........................... 297 9.2.4 Lineare Regression ............................... 300 9.2.5 Weiterfu¨hrende Analysen.......................... 301 L¨osungen zu den U¨bungsaufgaben ............................ 303 Sachverzeichnis ............................................... 367

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.