Von der Replikation zum Vorstellungsgespräch

Andreas Peichl über seine Open-Science-Erfahrungen

Porträt von Prof. Dr. Andreas Peichl

Die drei wesentlichen Learnings:

  • Replikationen helfen, Kontakte anzubahnen. Die Diskussion und der Austausch mit den Originalautor:innen kann manchmal sogar zu einem Jobangebot führen.
  • Die Veröffentlichung von Forschungsdaten und Codes erhöht die eigene Glaubwürdigkeit und verbessert das Image – insbesondere wenn der eigene Name in der Forschungscommunity noch unbekannt ist.
  • Präregistrierungen sind vor allem bei Experimenten sinnvoll –  zum Beispiel beim AAA Registry der American Economic Association.

Können Sie aus Ihrem Bereich ein Best Practice-Beispiel im Kontext Open Science nennen?

AP: Wir produzieren am ifo in meiner Abteilung zum Beispiel den ifo-Geschäftsklimaindex. Da ist es so, dass man alle Daten als Excel-Datei auf unserer ifo-Homepage herunterladen kann. Wir befragen hierfür jeden Monat rund 10.000 Unternehmen. Die Mikrodaten mit deren Antworten gibt es bei uns im Forschungsdatenzentrum EBDC. Wir bieten über unser Forschungsdatenzentrum den Zugang an, und das nutzen auch Forscher:innen weltweit. Hier machen wir als Datenproduzenten die Daten verfügbar und machen auch die Methodik transparent. Den Geschäftsklimaindex kommunizieren wir in unterschiedlichster Form, u.a. in einer monatlichen Pressekonferenz. Ein anderes Beispiel ist ein neues Open-Source Simulationsmodell zur Evaluierung von Politikreformen. Bislang hatte jedes Institut sein eigenes Modell. Seit ein paar Jahren sind wir zusammen mit IZA und ZEW dabei, dass wir einen gemeinsamen Code als Grundlage haben. Und es gibt jetzt auch ein Projekt zusammen mit den Instituten und der Universität Bonn, wo wir ein neues Modell namens GETTSIM basierend auf den alten Modellen entwickeln, was dann auch richtig als Open Source im Internet z.B. auf GitHub verfügbar ist, sodass das jede:r es nutzen kann.

Ist der Code schon verfügbar?

AP: In einer vereinfachten Form ist der Code auf GitHub verfügbar, aber das ganze Projekt ist noch in der Entwicklung. Wir haben dafür auch Fördermittel für ein DFG-Projekt bekommen, um dieses Modell zu entwickeln und das auch wirklich Open Source zu machen und so zu dokumentieren, dass es auch jede:r versteht und nutzen kann.

Welche Rolle spielen Replikationsstudien bei Ihnen?

AP: Ich bewege in der Lehre Studierende zu Replikationen, vor allem im Master. In Mannheim war das in einer Vorlesung mit Übung dazu. In der Übung wurden Papiere repliziert, die ich ausgesucht habe. Aktuell gebe ich in München ein Seminar, bei dem jede:r Teilnehmende eine Veröffentlichung bekommt, um diese zu replizieren und zu erweitern oder um sie auf einen anderen Datensatz zu übertragen. Die Studierenden bekommen zum Beispiel eine Veröffentlichung mit amerikanischen Daten und sollen sie auf deutsche Daten übertragen und dann schauen, wo die Unterschiede herkommen. Ich halte das für sehr wichtig für die Studierenden. Zum einen können sie sehen, wie Wissenschaft gemacht wird, zum anderen lernen sie, wie man es selbst macht. Sie können dabei auch zuschauen, ob sie eigentlich die gleichen Ergebnisse finden wie die Originalautor:innen. Und wenn nicht, wie können sie die Unterschiede erklären. Der Kurs ist immer ausgebucht und kommt sehr gut bei den Studierenden an.

Haben Sie im Kontext von Replikationen bereits persönlich positive Effekte erlebt?

AP: Ein positiver Effekt war, dass ich nach meiner Promotion ein Jobangebot bekommen habe. Das war auch eher so an der Schnittstelle zwischen wissenschaftlicher Arbeit und Politiksimulation. Damals gab es in Deutschland eine Diskussion um das Thema Bürgergeld. In einem Teil meiner Dissertation habe ich mich mit den Auswirkungen von solchen und anderen Reformvorschlägen beschäftigt. Unsere Berechnungen und die anderer Institute waren sehr verschieden und es kamen sehr unterschiedliche Ergebnisse heraus. Darüber gab es dann natürlich Diskussionen. Über diese Diskussionen kam tatsächlich der Kontakt zum IZA in Bonn zustande, wo ich nach meiner Promotion hingegangen bin. Das IZA hatte ich als potenziellen Arbeitgeber vorher gar nicht auf dem Schirm. Ich bin dann aufgrund dieses Austausches direkt zum Vorstellungsgespräch eingeladen worden. Ansonsten gibt es auf jeden Fall immer mal wieder Austausch und Diskussionen. Replikationen helfen, Kontakte anzubahnen. Gerade wenn man methodisch forscht, ist es nützlich, wenn man seine Software und seine Codes in irgendeiner Form zur Verfügung stellt, so dass andere diese auch nutzen können.

Wenn Sie diverse Publikationen vor sich liegen haben, würde der Autor bzw. die Autorin ein Bonussternchen für mehr Glaubwürdigkeit bekommen, wenn die Daten verfügbar sind?

AP: Auf jeden Fall, insbesondere bei einer Publikation in einem Journal. Wenn das Journal eine Data Availability Policy hat und dann von einem Autor oder einer Autorin eine Ausnahme beantragt wurde, versuche ich schon, zu verstehen, warum das der Fall ist. Also in dem Sinne gibt es schon dieses Bonussternchen, wenn die Daten zugänglich sind. Die Datenzugänglichkeit beeinflusst allerdings nicht, ob ich das Paper lese oder nicht. Aber wenn ich jetzt beispielsweise an so eine Metastudie denke, dann würde ich vielleicht die Papers, wo keine Daten verfügbar sind, etwas niedriger gewichten.

Würden Sie Nachwuchswissenschaftler:innen raten, ihre Daten dort zu veröffentlichen wo es möglich ist?

AP: Ja genau. Wir versuchen, Open Science so zu pushen, dass die Daten verfügbar sind. Was ich auf jeden Fall sinnvoll finde, ist, die Daten im Rahmen des Publikationsprozesses dem Journal zur Verfügung zu stellen. Wenn es Daten sind, die selbst erhoben wurden, ist das relativ unproblematisch, bei Daten aus anderen Quellen kann es manchmal aber Probleme geben. Gleichwohl muss man den wissenschaftlichen Wettbewerb berücksichtigen und einen guten Zeitpunkt für die Veröffentlichung seiner Daten wählen.

Teilen Sie Ihre Forschungsdaten im Economics & Business Data Center von LMU und ifo?

AP: Ja, im EBDC werden unsere Forschungsdaten archiviert, wenn das Daten sind, die wir in irgendeiner Form erheben und somit teilen und archivieren können. Bei anderen Projekten liegen archivierte Daten dann beim Datenanbieter, zum Beispiel Daten der Bundesagentur für Arbeit beim IAB in Nürnberg. In anderen Kontexten kommt es dann auch auf die Journals an, die dann ja teilweise unterschiedliche eigene Repositories haben oder nutzen. Dann werden dort halt letztlich die finalen Daten und Codes archiviert (siehe Beispiel). In der Regel speichern wir aber auch eine Version in unserem EBDC.

Wer hat Zugang zum EBDC und müssen sich potenzielle Sekundärdatennutzer:innen legitimieren?

AP: Der Zugang ist zunächst mal insbesondere für Wissenschaftler:innen. Man kann über unser Forschungsdatenzentrum einen Nutzungsantrag stellen, und dann gibt es halt entsprechend je nach Daten unterschiedliche Datenschutzanforderungen. Es gibt einen formalen Prozess, der je nach Datensatz unterschiedlich ist. Es gibt Fälle, da bekommt man die Daten zugeschickt und kann mit ihnen machen, was man möchte. Es gibt aber auch den Fall, wo ich nach München zu uns ins EBDC fahren muss und dort an einem sicheren Arbeitsplatz ohne Internetzugang die Daten einsehen darf. Wenn die Daten archiviert werden, werden die Zugangsmöglichkeiten definiert.

Wann wurden Sie das erste Mal für das Thema Open Science sensibilisiert und warum?

AP: Den genauen Zeitpunkt kann ich gar nicht datieren. Ich habe im Studium und während der Promotion versucht, andere Studien zu replizieren. Ich fand bestimmte Sachen interessant und hatte mich gefragt, wie die Forscher:innen das gemacht haben. Ich habe 2004 mein Diplom gemacht und in meiner Diplomarbeit versucht, eine Studie von Kollegen vom DIW zu replizieren. Ich war dann mit diesen Kollegen im Austausch und habe zum Beispiel auch Codes bekommen, um Sachen nachzuvollziehen. Danach am IZA in Bonn war ich im Data Committee des Forschungsdatenzentrums. Und auch dort im Forschungsdatenzentrum haben wir immer geschaut, wie wir unsere Daten archivieren und wie wir unsere auch Ergebnisse replizierbar machen können. Dass diese Aktivitäten unter dem Begriff Open Science gefasst werden, habe ich erst in den letzten fünf bis zehn Jahren so wahrgenommen. Wir in München stellen unsere Daten über unser Forschungsdatenzentrum EBDC bereit. Das gehört dazu, dass man die Daten und die Codes auch herausgibt. Das ist wichtig für die Wissenschaft, um Sachen nachvollziehen zu können.

Ihre eigenen Sachen liegen auch in Ihrem eigenen Forschungsdatenzentrum?

AP: Genau. Wir haben beispielsweise in München konkret einen Sonderforschungsbereich und da ist es sogar auch Pflicht, dass alle Daten etc. in unserem Forschungsdatenzentrum (EBDC) archiviert werden und dass es dort dann eben Zugangsmöglichkeiten gibt. Das Problem bei vielen Sachen, die ich mache, ist, dass mir die Daten nicht gehören. Also ich arbeite zum Beispiel viel mit Steuerdaten über das Statistische Bundesamt und diese Daten darf ich nicht veröffentlichen. Das ist oft ein Problem, wenn man mit administrativen Daten arbeitet. Man schließt mit dem Statistischen Bundesamt einen Vertrag für eine definierte Zeit; und wenn das dazugehörige Projekt abgeschlossen ist, habe auch ich keinen Zugriff mehr auf diesen Datensatz. Ich bin im wissenschaftlichen Beirat der Forschungsdatenzentren der statistischen Ämter, und auch da diskutieren wir immer wieder über das Zugriffsproblem auf gewisse Daten und versuchen, dort die Sensibilität zu schaffen, die auch vorhanden ist. Aber oft liegt es auch an fehlenden Ressourcen, dass diese Daten dort teilweise nicht archiviert werden können. Wir haben aktuell ein Projekt, bei dem wir mit 60 Millionen Steuererklärungen mit 2.000 Variablen arbeiten – und das über 20 Jahre. Und gerade für diese großen Datensätze fehlt teilweise die Infrastruktur bei den statistischen Ämtern oder den Anbietern dieser administrativen Daten, um den Datensatz, den ich in meinem Projekt genutzt habe, separat archivieren zu können. Es gibt immer wieder Datenupdates oder Gesetzesänderungen, d.h., wenn ich jetzt die Daten von heute nehme, sind das nicht zwingend die gleichen wie damals. Das ist auch ein Punkt, der es teils sehr schwierig macht.

Arbeiten Sie mit Präregistrierung? Und wenn ja, wo machen Sie das?

AP: Teilweise ja. Dann, wenn es angebracht ist z.B. Survey Experiment. Ich finde Präregistrierung vor allem bei Experimenten sinnvoll. Ich mache das bei der American Economic Association, bei dem AAA Registry.

Haben Sie Tipps für junge Wissenschaftler:innen beim Einstieg in das Themenfeld Open Science?

AP: Meiner Meinung nach gehört zum guten wissenschaftlichen Arbeiten definitiv dazu, dass man seine Sachen, soweit es geht, für andere verfügbar macht, dass es replizierbar wird. Das ist letztlich in gewisser Weise auch eine Voraussetzung für den Job als Wissenschaftler:in und deswegen sollte man das per se einfach machen, so gut es geht. Es gibt ein paar Probleme, Hindernisse an verschiedenen Stellen, dessen muss man sich bewusst sein. Wenn man Daten etc. auf seiner Homepage veröffentlich, schafft das ein positives Image. Das hinterlässt bei mir in jedem Fall den guten Eindruck einer transparent handelnden Person.

Wie sehen Sie die Zukunft der Open Science-Bewegung?

AP: Die Open-Science-Bewegung lässt sich meiner Meinung nach nicht mehr aufhalten – und das ist gut so. Ob es nun kleine oder große Schritte sind, hängt von der Perspektive ab. Was das Thema Publikationen im Wissenschaftsbereich angeht: Solange wir die Verlage mit den Journalen haben, die ein bestimmtes Geschäftsmodell haben, ist es natürlich schwierig, zu einem richtigen, sozusagen Open-Access-, Open-Science-Bereich zu kommen. Einfach, weil man immer Leute hat, die Geld daran verdienen, dass es Restricted Access ist in unterschiedlicher Form. Ähnlich ist es bei Patenten, sobald es wirtschaftliche Interessen gibt, gibt es einen Anreiz, das einzuschränken. Umgekehrt ist es natürlich so, dass ohne die wirtschaftlichen Interessen viele Investitionen und Innovationen unterbleiben würden. Was nicht funktionieren wird, ist zu sagen, dass alles Open Access sein muss – egal ob es über private oder öffentliche Gelder finanziert wird. Wenn man mehr Zugriff auf Daten oder auch auf Patente hätte, dann würden vielleicht noch weitere Innovationen entstehen und das ist immer das Problem, da die optimale Balance zu finden. Das ist ja auch das Thema, mit dem wir uns als Ökonom:innen beschäftigen.

Vielen Dank!

Das Interview wurde geführt von Dr. Doreen Siegfried.

Über Prof. Dr. Andreas Peichl

Prof. Dr. Andreas Peichl ist Leiter des ifo Zentrums für Makroökonomik und Befragungen. Er ist Professor für Volkswirtschaftslehre, insbesondere Makroökonomie und Finanzwissenschaft an der Volkswirtschaftlichen Fakultät der Ludwig-Maximilians-Universität München. Seine Forschungsschwerpunkte liegen in der Finanzwissenschaft, dem Steuer- und Transfersystem, der Verteilung und Ungleichheit, sowie dem Arbeitsmarkt. Prof. Dr. Andreas Peichl ist Mitglied des Wissenschaftlichen Beirates beim Bundesministerium der Finanzen. Zudem ist er Mitglied des Open Science Centers der Ludwig-Maximilians-Universität München.

Kontakt: https://www.ifo.de/peichl-a

ORCID-ID: 0000-0002-0680-8321

Twitter: https://twitter.com/apeichl?lang=de

GitHub: https://github.com/peichla

LinkedIn: https://www.linkedin.com/in/andreas-peichl-67041812a/?originalSubdomain=de




Zurück zum Open-Science-Magazin