Datensätze anonymisieren
Worksheet 13
Wussten Sie? Studien, die Daten in einem öffentlichen Repository zur Verfügung stellten, erhielten mehr Zitate als ähnliche Studien, für die die Daten nicht zur Verfügung gestellt wurden. Dies fanden Heather Piwowar und Todd Vision hier heraus. Wenn Sie also Ihre Rohdaten als auch die Datensätze, auf deren Basis die finalen Analysen durchgeführt wurden, in einem sicheren Repositorium hochladen und öffentlich verfügbar machen (über einen Link im Manuskript), dann werden Sie für Ihre Fachkolleg*innen sichtbarer. Ein wichtiger Schritt zur Vorbereitung ist die Anonymisierung der Daten. Das heißt, Sie entfernen die Informationen, die es anderen ermöglichen würden, einzelne Personen zu identifizieren.
Dauer 45 – 60 min
Prüfen Sie, ob auch wirklich niemand durch die Kombination verschiedener seltener Merkmale (z.B. Geburtsort, Geschlecht, Semesterzahl, Alter) eine Person identifizieren kann. Beispielsweise, weil es in ganz Leipzig nur eine BWL-Studentin gibt, die 33 Jahre alt ist o.ä.
Im Zweifelsfall löschen Sie die kritischen Merkmale aus dem zu veröffentlichenden Datensatz oder Sie fassen Merkmale zu Kategorien zusammen. Dann haben Sie z.B. mehrere BWL-Studentinnen zwischen 30 und 40 aus dem Bundesland Sachsen.
Daten, die Sie nicht anonymisieren können, wie beispielsweise Videos, Bilder, Tonaufnahmen können Sie als verarbeitete Variante, beispielsweise als Transkript, veröffentlichen.
Fertigen Sie ein Anonymisierungsprotokoll an, damit die Daten im Nachhinein auch wieder de-anonymisiert werden können.
Lassen Sie sich auch gern von Ihrem Datenzentrum beraten.
Linktipps:
„Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten“ (2005)
„Hinweise zur Anonymisierung von quantitativen Daten“ vom DIPF (2015)
„Hinweise zur Anonymisierung von qualitativen Daten“ vom DIPF (2014)
„Handreichung Datenschutz“ vom RatSWD (2020)
Checkliste:
- Einverständniserklärung (siehe Muster) im Vorwege eingeholt und archiviert
- Mit Datenschutz vertraut gemacht
- Vom Datenzentrum beraten lassen
- Daten anonymisiert
- Daten hochgeladen
- DOI veröffentlicht
Herzlichen Glückwunsch!
Stand: September 2020
Fragen, Kommentare und Hinweise gern an open-science@zbw.eu