Datenanalyse mit Stata
von: Ulrich Kohler, Frauke Kreuter
De Gruyter Oldenbourg, 2008
ISBN: 9783486584561
Sprache: Deutsch
411 Seiten, Download: 3919 KB
Format: PDF, auch als Online-Lesen
Inhaltsverzeichnis | 6 | ||
Vorwort | 12 | ||
0 Zu diesem Buch | 14 | ||
0.1 Aufbau | 15 | ||
0.2 Material und Hinweise zur Benutzung | 16 | ||
0.3 Hinweise für Lehrende | 18 | ||
1 "Das erste Mal" | 20 | ||
1.1 Aufruf von Stata | 20 | ||
1.2 Gestalten der Bildschirmansicht | 21 | ||
1.3 Erste Analysen | 22 | ||
Eingabe von Befehlen | 22 | ||
Datensätze und Arbeitsspeicher | 22 | ||
Datensätze laden | 23 | ||
Variablen und Beobachtungen | 24 | ||
Betrachten der Daten | 25 | ||
Befehle unterbrechen und Befehle wiederholen | 26 | ||
Die Variablenliste | 27 | ||
Die in-Bedingung | 27 | ||
Zusammenfassende Maßzahlen | 28 | ||
Die if-Bedingung | 29 | ||
Definieren von fehlenden Werten | 30 | ||
Das Befehls-Präfix by | 30 | ||
Befehlsoptionen | 31 | ||
Häufigkeitsverteilungen | 32 | ||
Variablen-Label und Werte-Label | 33 | ||
Grafiken | 34 | ||
Die Hilfefunktionen | 35 | ||
Rekodierungen von Variablen | 37 | ||
Lineare Regressionsanalysen | 38 | ||
1.4 Do-Files | 38 | ||
1.5 Stata verlassen | 40 | ||
2 Arbeiten mit Do-Files | 42 | ||
2.1 Von der interaktiven Arbeit zum Do-File | 42 | ||
Alternative 1 | 43 | ||
Alternative 2 | 44 | ||
2.2 Do-Files sinnvoll gestalten | 48 | ||
2.2.1 Kommentare | 48 | ||
2.2.2 Zeilenwechsel | 48 | ||
2.2.3 Befehle, die in keinem Do-File fehlen sollten | 50 | ||
2.3 Arbeitsorganisation | 53 | ||
2.4 Kurzzusammenfassung | 58 | ||
3 Die Stata-Grammatik | 60 | ||
3.1 Elemente der Stata-Kommandos | 60 | ||
3.1.1 Der Befehl | 60 | ||
3.1.2 Die Variablenliste | 61 | ||
3.1.3 Optionen | 64 | ||
3.1.4 Die in-Bedingung | 66 | ||
3.1.5 Die if-Bedingung | 67 | ||
3.1.6 Ausdrücke | 70 | ||
3.1.7 Die Nummernliste | 73 | ||
3.1.8 Dateinamen | 73 | ||
3.2 Wiederholungähnlicher Befehle | 75 | ||
3.2.1 Das by-Präfix | 75 | ||
3.2.2 Die foreach-Schleife | 77 | ||
3.2.3 Die forvalues-Schleife | 80 | ||
3.3 Die Gewichtungsanweisung | 81 | ||
4 Eine allgemeine Bemerkung zu den Statistik-Kommandos | 86 | ||
5 Erstellen und Verändern von Variablen | 90 | ||
5.1 Die Befehle generate und replace | 90 | ||
5.1.1 Variablennamen | 91 | ||
5.1.2 Einige Beispiele | 92 | ||
5.1.3 Rekodieren mit by, n und N | 95 | ||
5.1.4 Explizite Subscripte | 99 | ||
5.2 Spezielle Rekodierungs-Befehle | 101 | ||
5.2.1 recode | 101 | ||
5.2.2 egen | 102 | ||
5.3 Weitere Werkzeuge zum Rekodieren von Daten | 103 | ||
5.3.1 String-Funktionen | 104 | ||
5.3.2 Datums- und Zeitfunktionen | 108 | ||
5.4 Befehle zum Umgang mit Missings | 114 | ||
5.5 Beschriftung von Variablen | 115 | ||
5.6 Storage-Types oder: der Geist in der Maschine | 118 | ||
6 Erstellen und Verändern von Grafiken | 120 | ||
6.1 Eine Vorbemerkung zur Syntax | 120 | ||
6.2 Typen von Grafiken | 122 | ||
6.2.1 Beispiele | 122 | ||
6.2.2 Spezielle Grafiken | 122 | ||
6.3 Elemente der Grafiken | 124 | ||
6.3.1 Erscheinungsbild der Daten | 126 | ||
6.3.2 Grafik- und Plotregion | 134 | ||
6.3.3 Informationen innerhalb der Plotregion | 137 | ||
6.3.4 Informationen außerhalb der Plotregion | 142 | ||
6.4 Multiple Grafiken | 150 | ||
6.4.1 Überlagerung mehrerer twoway-Grafiken | 150 | ||
6.4.2 Befehlsoption | 151 | ||
6.4.3 Zusammenführung von Grafiken | 152 | ||
6.5 Speichern und Drucken von Grafiken | 154 | ||
7 Die Beschreibung von Verteilungen | 158 | ||
7.1 Wenig oder viele Ausprägungen? | 159 | ||
7.2 Variablen mit wenig Ausprägungen | 160 | ||
7.2.1 Tabellarische Darstellungen | 160 | ||
7.2.2 Grafische Verfahren | 165 | ||
7.3 Variablen mit vielen Ausprägungen | 171 | ||
7.3.1 Häufigkeitsverteilung gruppierter Daten | 172 | ||
7.3.2 Beschreibung durch Maßzahlen | 175 | ||
7.3.3 Grafische Verfahren | 184 | ||
7.4 Kurzzusammenfassung | 196 | ||
8 Einführung in die Regressionstechnik | 198 | ||
8.1 Lineare Einfachregression | 201 | ||
8.1.1 Das Grundprinzip | 201 | ||
8.1.2 Lineare Regression mit Stata | 205 | ||
8.2 Die multiple Regression | 214 | ||
8.2.1 Multiple lineare Regression mit Stata | 215 | ||
8.2.2 Spezielle Kennzahlen der multiplen Regression | 217 | ||
8.2.3 Was bedeutet eigentlich unter Kontrolle ? | 220 | ||
8.3 Regressions-Diagnostik | 221 | ||
8.3.1 Die Verletzung von | 222 | ||
8.3.2 Die Verletzung von VAR(i) = ?2 | 238 | ||
8.3.3 Die Verletzung von COV(i,j) = 0 | 240 | ||
8.4 Verfeinerte Modelle | 241 | ||
8.4.1 Kategoriale unabhängige Variablen | 241 | ||
8.4.2 Interaktionseffekte | 244 | ||
8.4.3 Regressionsmodelle mit transformierten Daten | 248 | ||
8.5 Mehr zu Standardfehlern | 252 | ||
8.6 Weiterführende Verfahren | 256 | ||
8.6.1 Median-Regression | 256 | ||
8.6.2 Regressionsmodelle für Paneldaten | 258 | ||
8.7 Zusammenfassung | 269 | ||
9 Regressionsmodelle für kategoriale abhängige Variablen | 270 | ||
9.1 Das lineare Wahrscheinlichkeitsmodell | 271 | ||
9.2 Grundkonzepte | 275 | ||
9.2.1 Odds, Log-Odds und Odds-Ratios | 275 | ||
9.2.2 Exkurs: Das Maximum-Likelihood-Prinzip | 280 | ||
9.3 Logistische Regression mit Stata | 284 | ||
9.3.1 Der Koeffzientenblock | 286 | ||
9.3.2 Der Iterationsblock | 290 | ||
9.3.3 Der Modellit-Block | 291 | ||
9.4 Diagnostik der logistischen Regression | 296 | ||
9.4.1 Linearität | 296 | ||
9.4.2 Einflussreiche Fälle | 300 | ||
9.5 Likelihood-Ratio-Test | 304 | ||
9.6 Verfeinerte Modelle | 306 | ||
Nichtlineare Zusammenhänge | 306 | ||
Kategoriale unabhängige Variablen | 307 | ||
Interaktionseffekte | 309 | ||
9.7 Weiterführende Verfahren | 310 | ||
9.7.1 Probit-Modelle | 310 | ||
9.7.2 Multinomiale logistische Regression | 313 | ||
9.7.3 Ordinale Logit-Modelle | 317 | ||
9.8 Kurzzusammenfassung | 320 | ||
10 Daten lesen und schreiben | 322 | ||
10.1 Das Ziel: Die Datenmatrix | 322 | ||
10.2 Import maschinenlesbarer Daten | 324 | ||
10.2.1 Einlesen von System-Files anderer Programme | 325 | ||
10.2.2 Einlesen von ASCII- bzw. Textdateien | 325 | ||
10.3 Dateneingabe | 333 | ||
10.3.1 Dateneingabeüber den Editor | 333 | ||
10.3.2 Der input-Befehl | 335 | ||
10.4 Zusammenführung von Datensätzen | 338 | ||
10.4.1 Die Datenstruktur des GSOEP | 339 | ||
10.4.2 Der Befehl | 341 | ||
10.4.3 Der Befehl | 351 | ||
10.5 Datensätze speichern und exportieren | 353 | ||
10.6 Große Datensätze, große Probleme | 355 | ||
10.6.1 Regeln zum Umgang mit dem Arbeitsspeicher | 355 | ||
10.6.2 Die Verwendung zu großer Datensätze | 357 | ||
10.7 Kurzzusammenfassung | 358 | ||
11 Do-Files für Fortgeschrittene und eigene Programme | 360 | ||
11.1 Zwei Anwendungsbeispiele | 360 | ||
Anwendungsfall 1 | 360 | ||
Anwendungsfall 2 | 361 | ||
11.2 Vier Programmierwerkzeuge | 362 | ||
11.2.1 Makros | 362 | ||
11.2.2 Do-Files | 366 | ||
11.2.3 Programme | 366 | ||
11.2.4 Ado-Files | 369 | ||
11.3 Selbst programmierte Stata-Befehle | 373 | ||
11.3.1 Weitergabe von Variablenlisten | 376 | ||
11.3.2 Weitergabe von Optionen | 378 | ||
11.3.3 Weitergabe von if und in | 379 | ||
11.3.4 Bilden von Variablen unbekannter Anzahl | 380 | ||
11.3.5 Voreinstellungen | 383 | ||
11.3.6 Erweiterte Makrofunktionen | 385 | ||
11.3.7 Veränderungen am Datensatz vermeiden | 386 | ||
11.3.8 Help-Files | 387 | ||
11.4 Kurzzusammenfassung | 389 | ||
12 Rund um Stata | 390 | ||
12.1 Ressourcen mit Informationen | 390 | ||
12.2 Pflege von Stata | 391 | ||
12.3 Zusätzliche Prozeduren | 393 | ||
12.3.1 SJ- und STB-Ados | 393 | ||
12.3.2 SSC-Ados | 395 | ||
12.3.3 Andere Ados | 395 | ||
12.4 Bezugsquellen | 397 | ||
12.5 Kurzzusammenfassung | 398 | ||
Literaturverzeichnis | 400 | ||
Index | 404 | ||
Mehr eBooks bei www.ciando.com | 0 |