Die Suche nach abgeschlossenen Datensätzen teilt die Lager auf
ichIn Marienthal, einem Dorf in der Nähe von Wien, wurde 1931 fast die gesamte Bevölkerung arbeitslos, weil die örtliche Textilfabrik geschlossen werden musste. Was für die Bewohner eine Katastrophe war, erwies sich als großer Moment für die Sozialwissenschaften. Mehrere Monate lang zeichnete ein Team von Soziologen unter der Leitung von Paul Lazarsfeld und Marie Jahoda akribisch auf, wie Arbeitslosigkeit das Dorfleben prägte, die Gewohnheiten der Einwohner veränderte und ihre Psyche beeinflusste.
„Arbeitslos von Marienthal“ ist eine Studie, die mit ihrer Kombination aus direkter Beobachtung und detaillierter Datenerfassung als Klassiker der empirischen Sozialforschung gilt. Noch heute arbeiten Soziologen in dieser Tradition. Aber viele von ihnen recherchieren heute hauptsächlich an ihren Schreibtischen und vor dem Bildschirm: Sie entwerfen Untersuchungen, bestimmen Zufallsstichproben, entwerfen Fragebögen und bewerten Eingaben.
Auf der anderen Seite haben unabhängige Interviewer, die standardisierte Fragebögen verwenden, um nach Lebensbedingungen oder Einstellungen zu fragen, normalerweise direkten Kontakt zu den „Befragten“. Und die Distanz zwischen Wissenschaftlern und den Welten, die sie oft suchen, ist noch größer. Immer mehr Sozialwissenschaftler bewerten Daten für ihre Studien, die sie nicht selbst gesammelt haben, sondern Kollegen vor ihnen.
Wiederholung von Studien
Diese „Wiederverwendung“ ist mittlerweile nicht nur in der Soziologie, sondern auch in Wirtschaft, Psychologie und Bildung weit verbreitet. Dafür gibt es gute Gründe, sagt der Ökonom Gert G. Wagner von Max-Planck-Institut für die Bildungsforschung. „Es ist sinnvoll, Daten wiederzuverwenden, da Sie in der Vergangenheit keine Daten nachträglich erfassen können. Die Wiederverwendung der bereits gesammelten Daten ermöglicht aktuelle Längsschnittstudien über Lebensläufe hinweg. „“
Ein Beispiel sind die groß angelegten Studien des Sozioökonomischen Gremiums (SOEP), dessen Vorsitzender Wagner viele Jahre war. Sie untersuchen, wie soziale und wirtschaftliche Bedingungen, Arbeitsbedingungen oder der Zugang zu Bildung den Lebensverlauf beeinflussen. Gerade hat eine Studie mit 34.000 Teilnehmern begonnen, bei der Wissenschaftler von SOEP und Robert Koch Institut (RKI) wird die medizinischen und sozialen Auswirkungen der Koronarpandemie über mehrere Jahre untersuchen.
Eine günstige Voraussetzung dafür, dass gesammelte Forschungsdaten zu einem späteren Zeitpunkt und auch aus unterschiedlichen thematischen Perspektiven erneut analysiert werden, ist die Standardisierung von Fragen und möglichen Antworten. Dies ist die Norm in der quantitativen Sozialforschung. Der methodische Kern ihrer Projekte ist die statistische Darstellung und Orientierung am naturwissenschaftlichen Ideal. Die Testbedingungen sollten genau definiert und die Forschungsergebnisse wiederholt werden.
Solche Replikationen sind ein wichtiger Anwendungsbereich für die Wiederverwendung von Daten. In den letzten Jahren haben Kontrollanalysen in einer Reihe zuvor veröffentlichter Arbeiten in Soziologie und Psychologie schwerwiegende Mängel bei der Datenerfassung oder -analyse ergeben. Bekannte Zeitschriften wie die „Zeitschrift für Soziologie“ fordern ihre Autoren nun auf, ihre quantitativen Daten auf einem Replikationsserver zugänglich zu machen.