Langzeitbewahrung und Verarbeitung von geisteswissenschaftlichen Forschungsdaten

ARCHE: A Resource Centre for the HumanitiEs

In der sich rasch entwickelnden Landschaft der digitalen Geisteswissenschaften sind die langfristige Archivierung und Verarbeitung von Forschungsdaten wichtige Komponenten, um die Nachhaltigkeit und Bedeutung wissenschaftlicher Arbeit zu gewährleisten. Die Bewahrung von Forschungsdaten ist in der geisteswissenschaftlichen Forschung besonders wichtig, da es sich bei den Daten oft um einzigartige kulturelle Artefakte, historische Aufzeichnungen oder literarische Werke handelt, die bei Verlust unersetzlich wären.

Bewahrung digitaler Daten

Digitale Daten sind grundsätzlich fragil; sie können leicht verloren gehen oder durch technologische Entwicklungen, Software-Inkompatibilitäten, Ausfälle der Hardware oder falsches Datenmanagement beschädigt werden. Da viele bedeutende Fördereinrichtungen inzwischen einen Datenmanagementplan als Teil des Förderverfahrens verlangen, müssen die Forscherinnen und Forscher entscheiden, wie sie mit den Daten während ihrer Erstellung umgehen und wo diese nach Abschluss des Forschungsprojekts aufbewahrt werden sollen.

Die Bedeutung der digitalen Archivierung und des Datenmanagements geht jedoch über die bloße Datenspeicherung hinaus und schließt die umfassenderen Ziele der Bewahrung des kulturellen Erbes und der Wiederverwendung der Daten ein, indem sie für die Validierung der Forschung, die Suche nach neuen Erkenntnissen und die Entwicklung neuer Methoden sowie für die Bildung und die Vermittlung des kulturellen Erbes zugänglich gemacht werden.

ARCHE (A Resource Centre for the HumanitiEs)

Das digitale Archiv, das vom Austrian Centre for Digital Humanities and Cultural Heritage (ACDH-CH) an der Österreichischen Akademie der Wissenschaften (ÖAW) betrieben wird, gewährleistet die Nachhaltigkeit digitaler Aufzeichnungen durch die Anwendung von Erhaltungsstandards und -Praktiken wie die Nutzung stabiler Dateiformate, regelmäßige Datensicherungen und die Migration auf neue Speichermedien.

Als Verfechter von Open Science verfolgt ARCHE auch das Ziel, die Integrität und Nutzbarkeit der Daten für die Zukunft zu gewährleisten. Dies beinhaltet besondere Aufmerksamkeit für die Datenstruktur und Dateibenennung sowie die Bereitstellung von Kontext zu den Daten in Form von beschreibenden Metadaten. Das für die Beschreibung der in ARCHE bewahrten Sammlungen verwendete Metadatenschema basiert auf einigen gut etablierten Standards wie DataCite, Dublin Core und den Richtlinien von CLARIN.

ARCHE richtet sich zwar hauptsächlich an die Forschungsgemeinschaft der ÖAW, steht jedoch auch für die Archivierung aller Daten offen, die im Rahmen von Projekten innerhalb der Geisteswissenschaften erzeugt werden.

Datenarchivierung und Veröffentlichung

Ein weiterer wichtiger Bestandteil der Datenarchivierung ist die Verbreitung der archivierten Daten. Als vertrauenswürdiges (mit dem Core Trust Seal zertifiziertes) Repository verpflichtet sich ARCHE den FAIR-Prinzipien (Auffindbarkeit, Zugänglichkeit, Interoperabilität, Wiederverwendbarkeit). Ziel ist es, die Daten unter offenen Lizenzen zu veröffentlichen und diese – in Absprache mit den Datengebern – so weit wie rechtlich möglich zugänglich zu machen.

Zu diesem Zweck teilt ARCHE die Metadaten aller Sammlungen mit dem europäischen Aggregator für Forschungsdaten OpenAIRE. ARCHE arbeitet auch mit weiteren fachspezifischen Aggregatoren zusammen, um Sammlungen, die für bestimmte wissenschaftliche Gemeinschaften von Interesse sind, sichtbarer zu machen. Die sprachwissenschaftlichen Sammlungen der Akademie werden von CLARIN VLO erfasst, archäologische Projekte sind im ARIADNE-Portal zu finden, und Sammlungen, die das Kulturerbe repräsentieren, werden vom Kulturpool (und Europeana) erfasst.

Daten für die Geisteswissenschaften

ARCHE konzentriert sich auch auf die Verbesserung des Suchens, Browsens und der Nutzung von Daten auf der ARCHE-Plattform. Im Herbst 2024 wurde eine neue grafische Benutzeroberfläche (GUI) eingeführt, die auf einer umfassenden Nutzerforschung basiert. ARCHE hat auch eine Reihe von Verbreitungsdiensten implementiert, die es den Nutzer:innen ermöglichen, Daten und Metadaten in bestimmten Formaten zu betrachten, ohne dass sie die Datei herunterladen und in externen Viewern oder Anwendungen anzeigen müssen.

Die robuste API bietet Partnern und Datenlieferanten die Möglichkeit, die in ARCHE gespeicherten Daten in anderen, für spezifische Projekte erstellten Websites zu nutzen. Die Hoffnung ist, dass ARCHE die Forschung innerhalb der ÖAW und der größeren geisteswissenschaftlichen Gemeinschaft im Allgemeinen besser unterstützen kann, indem die Daten einfacher und programmatisch durchsuchbar und durchsuchbar gemacht werden.