Phase 4: Datenanalyse
Während dieser entscheidenden Phase im Forschungsprozess ist es besonders wichtig, den Datensatz gut organisiert und auf dem aktuellen Letztstand zu halten, denn Teammitglieder arbeiten mit den Daten, verändern den Datensatz, fügen Ergänzungen hinzu oder löschen Teile des Datensatzes. Es ist daher sinnvoll, einen Datensatz zu erstellen, bei dem nur eingeschränkt Änderungen erlaubt sind. Jede Änderung dieser Version sollte sorgfältig geprüft und kontrolliert, benannt und dokumentiert werden. Die letzte Version dieses Datensatzes ist die Basis der aus der Forschung resultierenden Publikation und ist auch jene, die an das Archiv abgegeben wird. Versionskontrollen, Archivierung, Dateistruktur, Back-ups, Sicherheit, Formatkonvertierungen und bevorzugte Formate sollten in dieser Phase des Datenlebenszyklus in die Überlegungen einbezogen werden.
Versionskontrolle
Es ist anzuraten, verschiedene Versionen des Datenfiles separat (mit individuellen Versionsnummern) zu speichern. Wichtig ist auch, dass sichergestellt wird, dass die einzelnen Kopien einer Datei, Materialien in verschiedenen Formaten und Querverweise zwischen verschiedenen Dateien Gegenstand einer Versionskontrolle werden. Derartige Überprüfungsverfahren sollen gewährleisten, dass die Informationen, die in einer Datei geändert werden, auch in den korrespondierenden Dateien korrigiert werden. Des Weiteren sollte beachtet werden:
- Eindeutige Identifizierung von Dateien, bevorzugter Weise mittels eindeutiger Ressourcennamen (Unique Ressource Name – URN)
- Aufzeichnungsversion und Status, bspw. Endbericht_Entwurf, Endbericht_Vorläufig, Endbericht_Endversion, Endbericht_für internen Gebrauch.
- Beibehaltung von Masterfiles in geeigneten Formaten, um etwaige Probleme im Zusammenhang mit parallel entstehenden unterschiedlichen Arbeitsversionen lösen zu können.
- Aufzeichnung von Beziehungen zwischen Elementen des Datensatzes: In vielen Fällen werden Informationen in einem Dokument durch Informationen in anderen Dokumenten ergänzt, bspw. zwischen Kodebuch und Datenfile oder zwischen Datenfile und der zugehörigen Dokumentation bzw. den Metadaten.
- Nachverfolgen der Standorte der gesamten Dateien, wenn diese an unterschiedlichen Orten gespeichert wurden.
Sicherheit
Da digitale Daten leicht kopiert, verändert oder gelöscht werden können, ist es wichtig die Authentizität der Daten nachzuweisen und unautorisierten Zugang zu Daten aus ethischen, rechtlichen und qualitätsbezogenen Gründen zu verhindern. Die Führung eines Masterfiles - eine formalisierte und geprüfte Version der Daten (und zugehöriger Informationen) - hat höchste Relevanz. Außerdem können Kopien während verschiedener Phasen des Forschungsprozesses erstellt werden, die sich von vorübergehenden Arbeitsversionen der Daten unterscheiden.
- Zuweisung von Verantwortlichkeiten an einzelne Projekt- und Teammitglieder
- Beschränkung der Veränderungsrechte der Masterversionen auf bestimmte Projekt- und Teammitglieder
- Schaffung formaler Vorgaben für die Zerstörung des Masterfiles
- Dokumentation von Veränderungen des Masterfiles
- Aufbewahrung der alten Masterfiles (im Falle dass neuere Versionen Fehler enthalten)
Datenspeicherung
Das passende Abspeichern der Daten als Rohdatenfiles oder statistische Systemfiles sollte geplant werden. Die Digital Preservation Coalition (DPC) stellt Informationen und Best-practice Beispiele zur Verfügung.
Dateistruktur
Entscheidungen über die Ordner- und Dateistruktur (flach oder hierarchisch) und dazugehörige Dokumentation.
Back-ups
Gute Sicherungsverfahren sollen vor Missgeschicken wie dem unbeabsichtigten Löschen oder Verändern von Daten, dem Verlust der Daten aufgrund von Medien- oder Softwarefehlern, Viren, Hackversuchen oder Unglücken wie Feuer- oder Wasserschäden schützen. Punkten, denen besondere Aufmerksamkeit zugedacht werden sollte sind:
- Häufigkeit von Back-ups: Back-ups in angemessenen Zeitintervallen
- Erstellen neuer Back-up Kopien: Alte Back-ups nicht einfach überschreiben
- Externe Back-up Kopien: Zumindest eine Back-up Kopie sollte außerhäuslich aufbewahrt werden
- Institutionelle Back-up Richtlinien: Entscheidende Daten separat abspeichern
- Validierung der Back-up Kopien durch Prüfsummenverfahren und Speicherung der Prüfsummenergebnisse
- Wahl passender, robuster und verlässlicher Back-up Medien; typischer Weise Band oder DVD, etc.
- Austausch von Back-up Medien: Regelmäßiges Ersetzen alter Medien
- Lagerbedingungen für physikalische Medien: Befolgung der Herstelleranweisungen
Weiter zu Phase 5: Aufbereitung der Daten für die Datenweitergabe