Aufbewahrungsrichtlinien

Inhalt dieser Seite

Dieses Dokument gibt eine Übersicht über die Aufbewahrungsrichtlinien des Repositoriums. Wenn Sie Fragen haben, senden Sie uns eine E-Mail an clarin@saw-leipzig.de.

Datenspeicherung

Die Daten werden auf einem RAID-System gespeichert und alle Inhalte werden regelmäßig auf separate Hardware kopiert. Der Zustand der Speichermedien wird kontinuierlich über Icinga-Tests (z.B. durch S.M.A.R.T. – Self-Monitoring, Analysis and Reporting Technology – Daten) überwacht. Der Zugriff auf das Archivsystem ist auf einen kleinen Personenkreis beschränkt. Der Schreibzugriff auf Datenspeichersysteme ist auf die Maschine selbst und eingewiesenes Personal beschränkt.

Datenaufbewahrung

Depositors werden ermutigt, standardisierte Formate (UTF-8-Encoding, dokumentierte XML-Formate, ...) zu verwenden, wenn sie ihre Daten zur Hinterlegung übermitteln. Falls benutzerdefinierte / proprietäre Formate verwendet werden, muss eine vollständige Dokumentation bereitgestellt werden. Das Repository überprüft zweimal jährlich:
  • ob die gespeicherten Daten unverändert sind (über Prüfsummen)
  • ob eine Aktualisierung der hinterlegten Daten aufgrund der Überalterung des verwendeten Formats erforderlich ist
  • ob eine Aktualisierung der verfügbaren Metadaten notwendig ist
Falls eine Aktualisierung erforderlich ist, wird der Depositor kontaktiert und gebeten, eine aktualisierte Version bereitzustellen. In einigen Fällen kann das Repositorium auch beschließen, die Aktualisierung selbst durchzuführen. In diesem Fall wird der ursprüngliche Einreicher informiert (falls die Person/Institution noch verfügbar ist).

Backup

Es werden zwei unabhängige Backup-Strategien verwendet um eine hohe Redundanz zu erreichen und separate Wege der Wiederherstellung zu ermöglichen:
  1. Über dedizierte Mechanismen unserer Virtualisierungslösung werden jede Woche Backups der relevanten virtuellen Maschinen erstellt; es werden immer die jeweils fünf neuesten Backups aufbewahrt.
  2. Jeden Monat wird ein Backup des zugrunde liegenden OCFL-Repositories aufbewahrt; es werden immer die drei neuesten Versionen aufbewahrt. Auch aus den Inhalten dieses OCFL-Repositories kann das gesamte Repository neu aufgesetzt werden.
Zusätzlich zu den kontinuierlich erneuerten Backup-Versionen werden für beide Strategien zudem halbjährlich Backups zur Langzeitspeicherung angelegt, um notfalls auch die Wiederherstellung ältere Zustände zu ermöglichen.
Backups werden auf Hardware gespeichert, die sich an vom Live-System getrennten Standorten befindet. Diese werden ebenfalls kontinuierlich durch automatische Tests überwacht.

Erhaltung des Software-Stacks

Das Zentrum verwendet weit verbreitete Open-Source-Software (Linux, Fedora Repository, Apache Tomcat, MariaDB) um alle Repositoriums-Dienste (Datenspeicherung, OAI-PMH, ...) zu ermöglichen. Dies maximiert die Wahrscheinlichkeit eines langfristigen Supports (Updates, Sicherheitsfixes) für die verwendeten Tools und verbessert die Fähigkeit, Installationen dieser Software-Stacks unabhängig von der zugrunde liegenden Hardware und/oder dem Betriebssystem auszuführen.
Der Update-Status installierter Software wird automatisch überwacht; verfügbare Updates werden von spezialisiertem Personal installiert.

Das Repositorium prüft mindestens zweimal jährlich:
  • ob größere Updates von Softwarekomponenten verfügbar und notwendig sind
  • ob Softwarekomponenten noch aktualisiert bzw. aktiv weiterentwickelt werden oder ein Wechsel zu Alternativen in Betracht gezogen werden sollte
  • ob der Zugriff auf die im Repositorium gespeicherten Daten/Metadaten über zusätzliche Schnittstellen (oder aktualisierte Versionen bestehender Schnittstellen) bereitgestellt werden sollte