Skip to main contentSkip to page footer

Dateien organisieren

Regeln für die Organisation digitaler Forschungsdaten festzulegen, ist für die eigene Arbeit und die Arbeit im Team hilfreich. Denn durch die systematische Dateiorganisation werden Dateien schneller gefunden und der Überblick über verschiedene Versionen von Dateien erleichtert. Auch reduziert sich das Risiko, dass Dateien versehentlich gelöscht oder überschrieben werden.

Die Organisation von Dateien umfasst eine nachvollziehbare und konsistente Struktur, Versionierung und Benennung. 

Im Folgenden finden Sie Hinweise zu:

Ordnerstruktur

Versionierung

Dateibenennung

Weiterführende Hinweise und Quellen

Ordnerstruktur

Die aufzubauende Ordnerstruktur ist abhängig von den spezifischen Rahmenbedingungen eines Projektes. Diese geben eventuell bereits einen bestimmten Ablageort oder eine bestimmte Sortierung vor. Von Bedeutung sind die Art und Anzahl unterschiedlicher Datentypen, das erwartete Dateivolumen, die datenschutzrechtliche und ethische Sensibilität der Daten sowie Urheberrechte und Lizenzen.

Richtlinien

  • Die Ordnerstruktur ist idealerweise hierarchisch gegliedert, umfasst maximal drei Ebenen und baut inhaltlich klar und konsistent aufeinander auf. 
  • Es empfiehlt sich, eine Readme-Datei anzulegen, in der alle Regeln zur Ordnerstruktur aufgeführt sind. In größeren Projektteams sollten zudem Verantwortlichkeiten festgelegt werden, das heißt, welche Personen neue Ordner erstellen und den Zugriff regeln.

Folgende Kategorien kommen in Betracht, um die Ordner zu sortieren:

  • Teilprojekte, Arbeitspakete oder Funktionseinheiten innerhalb eines Projekts
  • Personen
  • Datum oder Zeitraum, wie Monate oder Quartale
  • Inhalte der Ordner oder Ordnertypen, wie Forschungsdaten oder Datentypen, Publikationen und Berichte, Datenanalysen, Konferenzen, Literatur, Projektkoordination
  • Art der Dateien, Formate

Beispiele für Ordner im Rahmen eines Ordnersystems (vgl. Long 2009):

  • „to clean“: Ein Ordner für Dateien, die man noch „aufräumen“ – das heißt an den richtigen Ablageort verschieben muss.
  • „hold then delete“: Ein Ordner für Dateien, die nicht mehr gebraucht werden, die man aber noch nicht löschen möchte, weil: „Vielleicht kann ich sie irgendwann einmal wieder gebrauchen…“
  • „posted“: Ein Ordner für Dateien, die an Dritte herausgegangen sind. Manchmal werden Versionen von Dateien verschickt, die noch in Bearbeitung sind. Es kann für die spätere Nachvollziehbarkeit wichtig sein, genau diese Version der Datei aufzubewahren.
  • „mailbox“: Ein Ordner für wichtige E-Mails, die aufbewahrt werden sollen. Das eigene E-Mail-Postfach ist schnell überfüllt und unübersichtlich, daher kann die Einrichtung eines solchen Ordners hilfreich sein.

Versionierung

Um verschiedene Stadien der Bearbeitung von Dateien nachvollziehen und unterscheiden zu können, sollte eine konsequente Versionierung vorgenommen werden. Versionierungen können im Dateinamen, in der Datei selbst oder in einem gesonderten Dokument vorgenommen werden.

Richtlinien

  • Jede Änderung sollte vermerkt werden. 
  • Veraltete Versionen sind getrennt zu speichern, zu verwerfen oder zu löschen. 
  • Die originale Kopie sollte stets erhalten bleiben. 
  • Die Regeln der Versionierung sind so zu beschreiben, dass sie für andere nachvollziehbar sind. 

     

Versionierung in der Datei oder in einem gesonderten Dokument

Parameter

Version2.0
Datum der letzten Änderung19.06.2022
Geändert durchMax Mustermann
öffentlich / vertraulichÖffentlich

 

VersionÄnderung
1.0 (01.03.2022)Freigbae
1.1 (01.07.2022)Verbesserung Rechtschreibfehler
1.2 (07.12.2022)Änderung im Layout
2.0 (19.06.2023)Neues Kapitel (3.1.) hinzugefügt

Versionierung im Dateinamen

Die Versionierung kann anhand natürlicher Zahlen erfolgen und zwischen größeren und kleineren Änderungen unterscheiden:

  • größere Änderungen: Dateiname_v1.0 -> Dateiname_v2.0
  • kleinere Änderungen: Dateiname_v1.1 -> Dateiname_v1.2

Verwirrende Zusatzbezeichnungen sollten vermieden und der Dateiname konstant beibehalten werden:

  • Negativbeispiele: „Beispieldatei_Original1“, „Beispieldatei_Bearbeitung“, „Beispieldatei_Bearbeitung2“, „Beispieldatei_final“, „Beispieldatei_final2“
  • Positivbeispiele: „Beispieldatei_v1.0“, „Beispieldatei_v1.1“, „Beispieldatei_v1.2“, „Beispieldatei_v2.0“, „Beispieldatei_v2.1“

Tipp: Eine Auto-Back-up-Software kann das Speichern oder Archivieren mehrerer Versionen ersetzen, eine Kontrollsoftware kann die Versionierung überprüfen. Oder Sie nutzen Software mit automatischer Bearbeitungshistory.

Dateibenennung

Die Art und Weise der Benennung von Dateien ist ein wichtiger Baustein der Dateiorganisation. Eine klare Dateibenennung hilft dabei, Dateien innerhalb eines Ordners eindeutig unterscheiden zu können und verhindert Probleme, insbesondere wenn mehrere Personen gemeinsam an Dateien arbeiten. Dateinamen dienen der Übersichtlichkeit, wenn Dateien logisch sortiert angezeigt werden.

Tipp: Es gibt Software, die die automatische Umbenennung von Dateien ermöglicht. 

 

Richtlinien

  • Möglichst kurze Benennungen: Die Namen sollten so kurz wie möglich und so lang wie nötig sein. Ein grober Richtwert für die maximale Länge eines Dateinamens sind 32 Zeichen. Lange Namen und zu viele Ebenen sollten vermieden werden, damit nicht die zulässige Pfadlänge von Windows (255 Zeichen) überschritten wird.
  • Einheitliche und konsistente Benennung: Im Dateinamen immer dieselben Elemente in einer festgelegten Reihenfolge nutzen. Beispiel: Datum, Inhalt, Namenskürzel, Version > YYYYMMDD_stichprobeX_ag _v1
  • Maschinenlesbare Benennung: Leerzeichen, Sonderzeichen ($, @, %, #, &, *, ., (), !, /, ?) sowie Umlaute gilt es zu vermeiden. Für Ordner- und Dateinamen sind die Buchstaben a bis z, die Zahlen 0 bis 9 und Unterstriche zu verwenden. Großbuchstaben und Bindestriche können verwendet werden, wenn die verwendete Software diese unterscheiden kann.
  • Sinnvolle Sortierung erzeugen: 

Die Dateinamen sollten so gewählt werden, dass sie automatisch eine sinnvolle Sortierung der Dateien in Ordner erzeugen. Merkmale, nach denen sortiert werden soll, sollten daher vorne im Dateinamen platziert werden. Beispiel: Sortierung nach Datum > YYYYMMDD<

  • Einen den Inhalt beschreibenden Namen wählen: Je besser der gewählte Name die Datei- oder Ordnerinhalte abbildet, umso leichter wird er von den Nutzenden verstanden. Verwenden Sie eindeutige Namen, keine generischen Namen wie „Daten“ und „Text“, um Verwechslungen zu vermeiden.
  • Eine Readme-Datei zur Dokumentation der Regeln anlegen: Alle Beteiligten sollten Zugang zu den Regelungen haben, um sie konsistent anwenden zu können.

 

Mögliche Bestandteile von Dateinamen 

  • Inhaltsstichwort oder Kurztitel (kurz, relevant sowie ausreichend, um Inhalt zuordnen zu können; ca. 25 Zeichen), [2010-08-11_bioassay_toxicity_V1.sps] 
  • Name oder eindeutiges Kürzel der entsprechenden Bearbeiter*innen /Ersteller*innen/Verantwortlichen
  • Name des Forschungsteams/Abteilung
  • Datum der Erstellung/ Änderung/ Publikation (Format Jahr-Monat-Tag: JJJJ-MM-TT oder JJJJ-MM oder JJJJ-JJJJ oder JJMMTT, (2006-03-24_Dateibeschreibung).
  • Bearbeitungsstadium (z.B. Original, Entwurf, korrigiert, Ausschnitt, gefiltert, usw.)
  • Versionsnummer
  • Projektnummer  

 

Beispiel für Dateinamen von Forschungsdaten und Begleitmaterialien

[ID oder Studiennummer]_[Kürzel für Daten- bzw. Materialtyp]_[laufende Nummer]_[ggf. Version]_[ggf. Seriennummer]

  • ID oder Studiennummer: zur Zuordnung zur Studie
  • Kürzel für Daten- bzw. Materialtyp: Interview, Video, Fragebogen etc.
  • Laufende Nummer von Datentypen: 001 ff.
  • Versionsnummer: falls Änderungen durchgeführt werden und dokumentiert werden sollen, etwa durch Anonymisierung
  • Seriennummer: verschiedene Dateien je Datentyp, etwa bei mehreren Dateien pro Video a, b, c ff.

 

Dateinamen von Qualitativen Interviews "int"

[ID oder Studiennummer]_[Kürzel für Interview]_[laufende Nummer]_[Version]

Beispiel Dateibenennung für das erste geführte Interview

  • RTF Transkript: s01_int01_v01 (rtf-Datei, gespeichert als s01_int_001_v01.rtf)
  • MP3 Audiodatei: s01_int01_v01 (mp3-Datei, gespeichert als s01_int_001_v01.mp3)
  • WAV Audiodatei: s01_int01_v01 (wav-Datei, gespeichert als s01_int_001_v01.wav)

Beispiel Mehrere Audiodateien je Interview

[ID oder Studiennummer]_[Kürzel für Interview]_[laufende Nummer]_[Version]_[Kennzeichner für Serie]

  • Interview 1. Teil, Audiodatei 1: S01_int01_v01_a 
  • Interview 2. Teil, Audiodatei 2: S01_int01_v01_b
  • Interview 3. Teil, Audiodatei 3: S01_int01_v01_c

 

Benennung von Fokusgruppen "fg"

Beispiel Dateibenennung für das erste Transkript der Fokusgruppe:

[ID oder Studiennummer]_[Kürzel für Fokusgruppe]_[laufende Nummer]_[Version]

s01_fg01_v001 (rtf-Datei, gespeichert als s01_fg_001_v01.rtf)

 

Benennung von Bild- und Videodateien "pic", "vid"

Beispiel: Erste Bild- und Videodatei

[ID oder Studiennummer]_[Kürzel für Bild oder Video]_[laufende Nummer]_[Version]

  • Erste Bilddatei aus Studie s01: s01_pic001_v01
  • Erste Videodatei aus Studie s01: s01_vid001_v01

Beispiel: Ein Bild steht im Zusammenhang mit einem speziellen Ereignis oder einer bestimmten Veranstaltung, etwa Bild einer Fokusgruppe oder einer bestimmten Person

[ID oder Studiennummer]_[Bild oder Video]_[laufende Nummer]_[Version]_[Kennzeichner für Serie]

  • fünftes Bild aus einer Reihe von 10 Bildern, zugehörig zu Interview Nr. 8, aus Studie s01: s01_pic008_v01eIn diesem Fall steht das ‘e’ als fünfter Buchstabe des Alphabets für das fünfte Bild.

Beispiel: Das Bild gehört zu einem Interview, die Benennung erfolgt entsprechend der Benennung des zugehörigen Interviews mit Bilddateiendung (.tiff)

  • Dateibenennung für das erste geführte Interview in Studie s01, dazugehöriges Transkript und Bilddatei:
    • RTF Transkript: S01_int001_v01.rtf
    • Audiodatei: S01_int001_v01.mp3
    • Bilddatei: S01_int001_v01.tiff

 

Benennung von Beobachtungen "obs", Feldnotizen "notes"

Beispiel: Schriftliche Aufzeichnungen während einer Gedichtinterpretation im Unterricht

[ID oder Studiennummer]_[Art des Unterrichtsmaterials]_[laufende Nummer]

  • Gedicht: s01_gedicht01
  • Notizen/Transkript der Beobachtungen: s01_obs01
  • Feldnotizen: s01_notes01

 

Benennung von Quantitativen Daten "ds", "syn", "op"

[ID oder Studiennummer]_[Kennzeichner für Datensatz]_[Version]z. B. s5600_ds01_v01

[ID oder Studiennummer]_[Kennzeichner für Syntax]_[Version]z. B. s5600_syn01_v01

[ID oder Studiennummer]_[Kennzeichner für Output]_[Version]z. B. s5600_op01

 

Benennung von Begleitmaterialien

[ID oder Studiennummer]_[Dateityp]_[Version]

Beispiele:

  • Methodenbericht: s01_mb_v01
  • Fragebogen: s01_fb_v01
  • Codeplan: s01_cp_v01