Forschungsdaten dokumentieren
Bei der Dokumentation von Forschungsdaten geht es darum, Daten und Forschungsergebnisse, die auf diesen Daten beruhen, nachvollziehbar zu machen. Dies ist sowohl für die eigene Arbeit – jetzt und in Zukunft, die Arbeit im Team, als auch für Dritte notwendig, die die Forschungsdaten nachnutzen wollen.
Hier finden Sie Informationen zu der Dokumentation von Forschungsdaten:
Weiterführende Informationen zur Dokumentation:
Warum dokumentieren?
Um die Passung der Forschungsdaten für (Sekundär-)Analysen beurteilen bzw. die Daten richtig interpretieren und auswerten zu können, sind Dokumentationen und Zusatzinformationen – wie etwa die Notizen der Primärforschenden – notwendig.
Generell gilt, je weiter weg Personen von den Primärerhebung, desto mehr Informationen werden benötigt // Je länger Zeiträume, je komplexer, je mehr personen, je weiter weg von der Primärerhebung
Definition der Dokumentation
Die Dokumentation ist eine Beschreibung der Daten, die als eine Art Bedienungsanleitung für diese fungiert. Zur Dokumentation von Forschungsdaten gehört die gezielte Benennung der Dateien selbst sowie die Ergänzung der Daten um zusätzliche, die Studie und den Erhebungsprozess beschreibende Informationen, sogenannte Metadaten. Begleitmaterialien zur Studie sind ebenfalls Teil der Dokumentation.
Ziele der Dokumentation
- Erhalt der Interpretierbarkeit und Nachvollziehbarkeit der Daten
- zeit- und personenunabhängige Nutzung der Daten
- Sichtbarkeit und Wiederauffindbarkeit der Daten, etwa in Datenbestandskatalogen
Dokumentationen dienen der Nachvollziehbarkeit und Rekonstruierbarkeit von Entscheidungen im Projekt. Daher ist sie auch für die Nutzung der Forschungsdaten durch Projektmitarbeitende selbst erforderlich und insbesondere relevant in Projekten mit mehreren Mitarbeitenden, gerade wenn Personen ausscheiden. Zudem erlaubt eine gute Dokumentation es Dritten, das Analysepotenzial der Forschungsdaten beurteilen zu können.
Was dokumentieren?
Gegenstand der Dokumentation
Zu beschreiben/dokumentieren sind Informationen zum Forschungsdesign (was sollte wie erhoben werden, um welche FF zu untersuchen?), zur Datenerhebung (was wurde wie erhoben/gemessen?), zur Datenaufbereitung (von den Rohdaten zu den aufbereiteten/zu analysierenden Daten) und zur Datenanalyse (wie ist der Forschungsbefund entstanden?). (Datenlebenszyklus entlang)
Leitfragen der Dokumentation
- Welche Informationen benötigen nicht am Projekt beteiligte Dritte, um eine Sekundärnutzung der Forschungsdaten durchführen zu können? (Nachnutzung)
- Welche Informationen benötigen nicht am Projekt beteiligte Dritte, um in unbestimmter Zukunft die durchgeführten Analysen replizieren zu können? (Replizierbarkeit)
- Welche Informationen benötigen Projektmitarbeitende, die nicht an der Datenerhebung beteiligt waren? (Forschung im Team)
- Welche Informationen benötigen Projektmitarbeitende, die nicht an der Datenaufbereitung und/oder den Datenanalysen mitgearbeitet haben? (Forschung im Team)
Forschungsdaten sind sämtliche Daten, die Forschende zu wissenschaftlichen Zwecken nutzen.
Das sind Daten, die im Rahmen wissenschaftlicher Studien entstehen, etwa durch Erhebungen, Experimente, Befragungen oder Beobachtungen. Forschungsdaten können auch in anderen Kontexten entstehen, wie prozessproduzierte Daten oder amtliche Statistiken, die zu wissenschaftlichen Zwecken ausgewertet und bearbeitet werden.
Zu unterscheiden sind Rohdaten und aufbereitete/bereinigte Daten, die vorliegen als:
- Audio- und Videodateien sowie deren Transkriptionen
- Bildmaterial, wie Fotos, Abbildungen, Netzwerkkarten
- Postskripta und Protokolle
- QDA-Dateien
- Interviewschemata/-übersichten
- Tabellen
- Daten in SPSS, STATA, SAS, R
Zu Design und Datenerhebung
Methodenbericht, Forschungsinstrumente
Informationen über den Hintergrund der Datenerhebung:
- Methoden-/Feldberichte/Technical Reports
- Zwischen- und Abschlussberichte
- Publikationen der Forschungsergebnisse, etwa in wissenschaftlichen Fachzeitschriften
- Webseiten
Die Forschungsinstrumente, die zur Erhebung eingesetzt wurden:
- Fragebogen
- Listen- und Kartensätze
- Testinstrumente
- Ratingbögen
- Leitfäden
- Beobachtungsprotokolle
Informationen über den Prozess der Datenerhebung:
- Anweisungen für Interviewende
- Kontaktprotokolle
- Notizen zum Kontext und/oder Setting (wo und wie fand die Messung statt, wer war anwesend, Sitzpläne...)
Datenaufbereitung
- Transkriptionsregeln
- Codebücher/Skalenhandbücher/Datenhandbücher/Codierbücher
- Codierungen, Gewichtungsvariablen, imputierte Werte, sonstige generierte Variablen
- Angaben zu durchgeführten Plausibilitäts-, Konsistenz- und Fehlerkontrollen
Informationen zu Datenschutz und Anonymisierung
- Einverständniserklärungen oder Informationsblätter zum Datenschutz
- Vorgehen bei der Pseudonymisierung und/oder Anonymisierung, Anonymisierungsprotokolle, Auflistung der Pseudonyme
- Einschätzung des Reidentifikationsrisikos, Nennung sensibler Informationen in den Daten
Datenanalyse:
- QDA-Dateien
Syntax
Hilfestellungen
Hinweise Methoden-/Feldberichten:
Hinweise zur Erstellung eines Methoden-/Feldbericht (fdbinfo, Nr. 3)
Jedinger, Watteler, Förster (2018): Improving the Quality of Survey Data Documentation
Erstellung von Methodenberichten für die Archivierung von Forschungsdaten
GESISQuali: Kienbaum et al; Heuer et al.
Beispiele für Methoden- und Feldberichte qualitativer Forschung:
Projekt KuBin
Projekt PRAEP
Beispiele für Dokumentationen quantitativer Surveys:
DEPS-Studie 2020 (Daten- und Methodenübersicht)
BIBB-Übergangsstudie 2011 (Methodenhandbuch)
iFQ Wissenschaftler-Befragung 2010 (Vollversion)
Weitere Dokumentationen zu Datensätzen sind in der Regel auf den Seiten der Forschungsdatenzentren frei zugänglich.
Wozu Metadaten?
Metadaten dienen der standardisierten Beschreibung eines Datenbestands. Durch gute Metadaten werden Datenbestände auffindbar und suchbar in entsprechenden Portalen und Suchmaschinen. Damit dies funktioniert, müssen Metadaten standardisiert sein!
Wie entstehen standardisierte Metadaten?
Im Prozess der Übergabe von Forschungsdaten an ein Forschungsdatenzentrum (FDZ) oder Repositorium sind von den Datengebenden über ein Online-Formular oder Online-Fragebogen Angaben zu den Forschungsdaten zu machen. Diese Angaben werden durch das FDZ oder Repositorium in standardisierte Metadaten und sog. kontrollierte Vokabulare überführt. So entstehen Metadaten, die maschinenlesbar sind und zwischen verschiedenen Datenbanken und Suchportalen ausgetauscht werden können.
- Über Metadaten werden Forschungsdaten in Datenbanken und Datenbestandskatalogen sichtbar und wiederauffindbar.
- Metadaten dienen der Herstellung und dem Erhalt der Interpretierbarkeit von Forschungsdaten.
Arten von Metadaten
- Inhaltliche Metadaten: Titel, Schlagwörter, Thema
- Methodische Metadaten: Untersuchungsdesign, Grundgesamtheit, Stichprobenziehung/Fallauswahl, Erhebungsmethode, Analyseeinheit
- Formale Metadaten: Dateityp, Dateiformat, Dateigröße, bei Audio-/Videomaterial: Dauer der Aufzeichnung, Kameraperspektive, Sprache
- Administrativ-technische Metadaten: Bereitstellungsdatum, Bearbeitungsdatum, Bearbeiter*in, Freischaltung, Systemanforderungen
- Relationale Metadaten: Verweise auf dazugehörige Materialien , Literatur
- Identifizierende Metadaten: DOI
- Rechtliche Metadaten: Anonymisierungsgrad, Zugangskonditionen
Lesetipp: Gregory, A., Heus, P., & Ryssevik, J. (2009). Metadata. RatSWD Working Paper, 57. https://www.konsortswd.de/wp-content/uploads/RatSWD_WP_57.pdf
Standards bei Metadaten
VerbundFDB:
fdbinfo Nr. 8, Metadatenset des VerbundFDB
fdbinfo Nr. 7, Kernset und da|ra-Harvesting im VerbundFDB
Weitere Standards: