Multiple Imputationsmodelle für Knowledge Economy Indicators. Theorie, Implementierung und Verbesserungsvorschläge.

DSpace Repositorium (Manakin basiert)


Dateien:

Zitierfähiger Link (URI): http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-50771
http://hdl.handle.net/10900/47772
Dokumentart: Dissertation
Erscheinungsdatum: 2009
Sprache: Deutsch
Fakultät: 6 Wirtschafts- und Sozialwissenschaftliche Fakultät
Fachbereich: Wirtschaftswissenschaften
Gutachter: Schaich, Eberhard (Prof. Dr. Dr. h.c. mult.)
Tag der mündl. Prüfung: 2010-01-02
DDC-Klassifikation: 310 - Allgemeine Statistiken
Schlagworte: Statistik
Freie Schlagwörter: MCMC , EM-Algorithmus , KEI , Multiple Imputation
EM-Algorithm , Multiple Imputation , Computational Statistics
Lizenz: http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en
Gedruckte Kopie bestellen: Print-on-Demand
Zur Langanzeige

Inhaltszusammenfassung:

Im Rahmen des Europäischen Projekts KEI wurde die Universität Tübingen u.a. mit der Aufgabe betraut, einen mit 42% fehlenden Daten behafteten Datensatz zu rekonstruieren (imputieren), welcher die Grundlage für die Untersuchungen der anderen Partner-Institutionen darstellte. Angesichts des hohen Anteils fehlender Werte wurde zur Imputation des Datensatzes ein Imputationsmodell ausgewählt, das sich in der Fachliteratur aufgrund seiner hohen Leistungsfähigkeit einer großen Beliebtheit erfreut. Untersuchungen des Datensatzes haben jedoch ergeben, dass unterschiedliche Verletzungen der in diesem Basis-Modell getroffenen Annahme einer multivariaten Normalverteilung vorlagen, welche die Qualität der Imputationen gefährden konnten. Die Tatsache, dass die Stichproben per Definition von einem geringen Umfang sind, hat die Lage zusätzlich erschwert. Diese Annahmeverletzungen stellen jedoch keine Besonderheit des KEI-Datensatzes dar, sondern werden häufig in realistischen Datenlagen beobachtet. Diese Arbeit hat sich daher auf sechs beobachtete Probleme konzentriert und versucht, sie weitmöglichst zu beheben: 1) Präsenz von Ausreißern z.B. aufgrund uneinheitlicher Definition der Indikatoren in den untersuchten Ländern. 2) Große Abweichungen der empirischen Verteilungen von der Normalverteiltheit. 3) Variablen meist strikt positiv. 4) Nichtlinearität der Beziehungen zwischen Variablen. 5) Kleine Stichproben. 6) Hoher Anteil an fehlenden Werten (NA's). Die Vorgeschlagenen Lösungsansätze, welche die Leistungsfähigkeit computerintensiver Methoden wie MCMC-Verfahren und EM-Algorithmus mit modernen ökonometrischen Schätzverfahren kombinieren, versuchen das Basis-Imputationsmodell auf die besonderen Eigenschaften der Daten auszurichten.

Abstract:

Within the Sixth Framework Programme of the European commission the KEI (Knowledge Economy Indicators) project was entrusted with the development and improvement of composite indicators for the knowledge-based economy. Particularly, the analysis of aggregation techniques and the behaviour of the resulting composite indicators was a key issue of the project. In order to build the composite indicators, the availability of a complete dataset is needed. One single missing value (NA) may lead to a failure of the aggregation procedures. However, the KEI dataset has approximately 42% of missing values. To cope with this situation, enhancements of some well established multiple imputation models which combine the powerful MCMC-methods and the EM-Algorithm with modern econometric techniques were proposed and implemented.

Das Dokument erscheint in: