Exzellenz in der Datenbildung
Die Zukunft verstehen: Experteneinblicke von der BERD Academy – Ein Interview mit Markus Herklotz
Selbst in einer zunehmend datengetriebenen Welt sind die Fähigkeiten im Bereich Data Science und Datenmanagement von unschätzbarem Wert – insbesondere für Wirtschaftsforschende. Die BERD Academy, ein integraler Bestandteil der BERD@NFDI-Initiative, hat es sich zur Aufgabe gemacht, Wissen über Data Science und Datenmanagement zugänglich und kostenlos für Wirtschaftsforschende bereitzustellen.
Wir haben mit dem Organisator der BERD Academy gesprochen, der seine Erfahrungen in einer Vielzahl von Themenbereichen teilt. Wir werden Einblicke in die didaktischen Ansätze, organisatorischen Aspekte und die Leidenschaft für Daten teilen, die ihn in seiner Arbeit antreiben.
Wer sind typische Teilnehmer:innen der BERD Academy?
MH: Im Allgemeinen haben wir zwei Gruppen von Teilnehmer:innen aus den Bereichen BWL, VWL und Sozialwissenschaften: Forschende und Datenspezialist:innen wie Data Stewards und Data Librarians. Je nach Thema haben die Teilnehmer:innen unterschiedliche Erfahrungen, Forschungsinteressen und Arbeitsaufgaben. Wir adressieren sowohl diejenigen, die schon mit unstrukturierten Daten arbeiten als auch jene, die wenig Erfahrung mitbringen, aber die Möglichkeiten neuer Datentypen und –methoden ausprobieren möchten. Die Lehrpläne an den Universitäten durchlaufen bereits Veränderungsprozesse, aber wir laden auch Studierende ein, die ihr Wissen mit unseren Angeboten erweitern möchten. Einige Trainingsmodule sind so gestaltet, dass sie alle Niveaus zusammenbringen.
Wie werden die Kurse an der BERD Academy konzeptioniert und didaktisch strukturiert, um die Lernziele effektiv zu erreichen?
MH: Da wir uns in erster Linie an Berufstätige wenden, ist es unser wesentliches Ziel, unser Angebot in Übereinstimmung mit den knappen Zeitressourcen der Teilnehmer:innen zu bringen. Die Teilnehmer:innen bringen auch sehr unterschiedliche Lernmuster mit – manche bearbeiten das Material lieber selbstständig und andere bevorzugen die Teilnahme in persönlichen Gruppen mit einem klaren Zeitplan. Wir versuchen deshalb eine Vielzahl von Formaten anzubieten um unterschiedliche Bedarfe abzudecken. Das geht von kleinen Coffee Lectures über ganztägige Workshops zu Flipped Classrooms, die mehrere Wochen dauern. Da sollten Alle etwas nach ihrem Geschmack finden.
Welche bewährten Methoden und Techniken gibt es, um Menschen aus dem Bereich Wirtschafts- und Sozialwissenschaften erfolgreich das Codieren und Datenmanagement beizubringen, insbesondere wenn sie keine vorherige Erfahrung in diesem Bereich haben?
MH: Ein vielversprechender Ansatz ist es, die Schulung so anwendungsorientiert wie möglich zu gestalten. Vor allem wenn die Zeit knapp ist, kann man Teilnehmer:innen besser erreichen mit etwas, das sie direkt anwenden können. Als Forschende haben sie alle nötigen Werkzeuge, um diese ersten Anwendungen weiter zu entwickeln. Der erste Schritt ist meistens die größte Hürde, weil sie zwar von bestimmten Methoden oder Datentypen gehört haben, aber nicht wissen, was sie lernen müssen, um die nötigen Fähigkeiten zu erwerben. Wir versuchen also diese Hürde abzubauen, einen interessanten Einstieg und Wege zur Weiterentwicklung zu schaffen.
Welche Herausforderungen und Fallstricke sollten vermieden werden, wenn man BWL-Studierenden bzw. -Forschenden aus den Wirtschafts- und Sozialwissenschaften das Arbeiten mit Daten beibringt, um ihre Lernreise effektiver zu gestalten?
MH: Man muss vor allem bedenken, dass sie nicht bei Null anfangen. Mit einem Abschluss in BWL, VWL oder Sozialwissenschaften verfügen die meisten bereits über einen wertvollen Werkzeugkasten für die Arbeit mit quantitativen Methoden. (Sozial-) Datenwissenschaft ist nicht zwingend eine völlig andere Disziplin, es kann einfach ein weitgefasster Begriff sein für alles, was mit Daten zu tun hat. Fortgeschrittene Methoden können also einfach nur eine Ergänzung sein zu dem Methodensatz, den sie bereits kennen. Sie haben wahrscheinlich einen völlig anderen Ansatz zu Datenwissenschaft als beispielsweise Informatiker:innen, das muss man berücksichtigen. Aber auch innerhalb einer Disziplin unterscheiden sich die Werkzeugkästen je nach Studiengang, Semester, Universität und Arbeitserfahrung. Wir bieten deshalb spezielle übergreifende Einführungskurse, die sich genau damit befassen.
Gibt es spezielle didaktische Ansätze oder Lehrmaterialien, die sich als besonders effektiv erwiesen haben, um BWL-Studierenden bzw. -Forschenden aus den Wirtschafts- und Sozialwissenschaften das Verständnis für Datenverarbeitung und -management zu vermitteln?
MH: Einige Datenmanagementkonzepte scheinen anfangs vielleicht recht abstrakt und Forschende sehen vielleicht nicht sofort den Nutzen, verglichen mit konkreten Analysemethoden, aber sie haben meistens direkte Auswirkungen in der echten Welt. Deshalb ist es wichtig, dass man nicht nur die theoretischen Konzepte z.B. von FAIR Data zeigt, sondern auch, was das in der Praxis bedeutet. Man muss ihnen nicht nur zeigen, was man theoretisch tun sollte, sondern was sie genau tun können, und wie das ihre Arbeit schließlich verbessert. Zum Glück wird das Thema immer breiter bekannt, dank der wertvollen Arbeit der Open-Science-Initiativen, der Anstrengungen der Nationalen Forschungsdateninfrastruktur NFDI und anderer Fachgruppen.
Welche Kursinhalte / Themen sind bei den Teilnehmer:innen am beliebtesten?
MH: Die höchste Resonanz bekommen wir für alles, was mit Big Data und Machine Learning zu tun hat. Das hat vermutlich mit der rasanten Entwicklung in diesen Bereichen zu tun, die in den Universitätslehrplänen nicht vorkommen und ständige Weiterbildung erfordern.
Gibt es spezielle Voraussetzungen oder technische Anforderungen für die Teilnahme an den Kursen der BERD Academy, insbesondere für Online-Sessions?
MH: Das hängt sehr vom jeweiligen Kurs ab. Technisch gesehen ist jedes Gerät, mit dem man Videokonferenzen führen kann, ausreichend für einen Onlinekurs. Es gibt Kurse, in denen Programmieren geübt wird, dafür brauchen Teilnehmende außerdem einen Rechner, auf dem die (Open Source) Software installiert ist, normalerweise R. Wir bieten selbstgesteuerte Einführungskurse für R und Python an, für die sich Forschende jederzeit anmelden können.
Wie werden die Kurse zur Datenverarbeitung und Datenanalyse an der BERD Academy durchgeführt, insbesondere im Hinblick auf Big Data und unstrukturierte Daten?
MH: In unterschiedlichen Formaten. Wir haben zum Beispiel einen ganztägigen Präsenz-Workshop für Netzwerkanalyse. Die Teilnehmer:innen bekommen eine Einführung in die theoretischen Ansätze and beenden den Tag mit einer praktischen Laborübung, wo sie mit echten Netzwerkdaten arbeiten. Ein anderer Kurs für Mikrosimulation und Machine Learning findet in einem Flipped-Classroom-Format statt: Die Teilnehmer:innen arbeiten jede Woche das Kursmaterial (Videos, Lektüre, Hausaufgaben in R) in ihrem eigenen Tempo durch und treffen sich dann mit den Dozent:innen und anderen Teilnehmer:innen, um etwaige Fragen zu besprechen.
Welche Erfahrungen und Fachkenntnisse bringen die Dozent:innen der BERD Academy in den Bereich der Data Science und Datenmanagement ein?
MH: Unsere Dozent:innen sind Fachleute aus internationalen Universitäten, Forschungsinstituten oder Statistikämtern. Sie alle bringen aktuelle Themen mit, ihre Methoden sind auf dem neusten Stand, und sie bringen wertvolle praktische Erfahrung mit, mit der die Teilnehmer:innen als aktive Forscher:innen etwas anfangen können. Es kann sehr wertvoll sein, nicht nur theoretisches Wissen zu vermitteln, sondern auch die Herausforderungen der realen Welt einzuarbeiten und einen verantwortlichen Umgang mit Daten zu betonen.
Wie sind die Erfahrungen mit Forschenden aus Wirtschafts- und Sozialwissenschaften, die sich jetzt in eine neue Domäne einarbeiten müssen?
MH: Sie sind meistens sehr motiviert, und so kommen sie auf unsere Kurse. Wie schon gesagt ist die höchste Hürde die, dass man wissen muss, was man lernen muss. Sobald sie diesen Schritt getan haben und sehen, wie sehr diese „neuen“ Inhalte schon zu dem passen, was sie in ihrer Arbeit bereits nutzen, ist es sehr viel einfacher, weitere künftige Fortschritte zu machen.
Gibt es Möglichkeiten für selbstgesteuertes Lernen an der BERD Academy, und wie werden diese Kurse organisiert?
MH: Ja, wir bieten Einführungskurse für die Programmiersprachen R und Python in einem selbstgesteuerten Format. Die Anmeldung für unsere Kurse ist ständig geöffnet. Interessierte Forscher:innen können sich einfach anmelden und bekommen sofort die Zugangsinformation. Wir veröffentlichen auch die selbstgesteuerten Abschnitte unserer Flipped-Classroom-Kurse in verschiedenen Formaten, z.B. Folien, Videos und/oder Broschüren.
Wie kann man die Motivation und das Interesse von BWL-Studierenden bzw. -Forschenden aus den Wirtschafts- und Sozialwissenschaften an Data Science und -management aufrechterhalten, insbesondere wenn es um komplexe technische Konzepte geht?
MH: Der erste Schritt ist, dass die Angebote vernünftig formuliert sind und Alle die richtige Stufe für eine Grund- oder Weiterbildung finden. Berufstätige bringen meist genügend intrinsische Motivation mit, wenn sie den Nutzen dessen sehen, was sie lernen möchten. Auch hier würde ich sagen, dass eine praktische Anwendung, also nützliche Fallstudien darüber, wie man das Leben mit Daten einfacher machen kann, ein hochmotivierender Ansatz sein kann. In den Kursen treffen sie andere Teilnehmer:innen, die vergleichbare Themen haben und vor ähnlichen Herausforderungen stehen. Ein gewisser Peer-Effekt und der Austausch mit Anderen, der auch nach dem Ende des Kurses anhält, kann auch sehr von Vorteil sein.
Welche Empfehlungen würden Sie geben, um die Integration von Datenkompetenz in Studiengänge der Wirtschafts- und Sozialwissenschaften oder in die Doktorand:innenausbildung zu fördern und sicherzustellen, dass die Absolvent:innen über die notwendigen Fähigkeiten für die moderne datengetriebene Wirtschaft verfügen?
MH: Universitätslehrpläne ändern sich bereits und holen auf. In diesem sich schnell wandelnden Bereich sind ständige Weiterbildung und lebenslanges Lernen unerlässlich, aber es ist auch eine erforderliche Voraussetzung für neue Forschungsergebnisse, wie in allen anderen Disziplinen auch. Das Fachwissen ist da, um Fortschritte an den Universitäten zu machen, dank all der exzellenten Forscher:innen in den entsprechenden Forschungsprojekten. Manche Programme schaffen Raum dafür, indem sie Kurse zu „aktuellen Trends in [Daten-] Wissenschaft“ in die Lehrpläne integrieren, in denen Professor:innen und Praktiker:innen direkt über neue spannende Themen berichten und Neugier auf neue Forschungsmöglichkeiten wecken. Dazu würde ich gern den Statistiker Chris Wild zitieren, der auf einer Konferenz letztes Jahr gesagt hat: „Was ist das Allerbeste, das wir für unsere Studierenden tun können? Ihre Vorstellungskraft mit Möglichkeiten zu füllen.“ Reale Projekte zu nutzen, den tatsächlichen Nutzen neuer Methodologien zu zeigen ohne die Fallstricke zu ignorieren, das könnte eine guter Ausgangspunkt sein für zukünftige Datenwissenschaftler:innen in BWL, VWL und Sozialwissenschaften.
Das Interview wurde geführt von Dr. Doreen Siegfried.
Über Markus Herklotz:
Markus Herklotz ist Bildungsforscher und arbeitet an dem Projekt BERD im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI), wo er Schulungsprogramme und Bildungsmaterialien für Forscher:innen entwickelt, die mit unstrukturierten BWL-, VWL- und verwandten Daten arbeiten. Seine Arbeit konzentriert sich darauf, Forschenden dabei zu helfen, effektiver mit diesen komplexen Datensätzen umzugehen.
In seiner Forschung beschäftigt sich Markus Herklotz mit der Beschreibung und Analyse von Kompetenzen im Bereich der Data Science sowie mit der Umsetzung und Bewertung verschiedener (e-)Lernformate. Seine akademische Laufbahn begann im Jahr 2015 mit dem Abschluss in Diplom-Soziologie an der Technischen Universität Dresden.