Download doi:10.20375/0000-000B-D558-2  
Descriptive Metadata   Administrative Metadata   Technical Metadata

Der Kreislauf des (Daten-)Lebens. Zugangspunkte in die DARIAH-DE Datenföderationsarchitektur


Creator   Claudio Leone
Creator   Hanna-Lena Meiners
Creator   Lisa Klaffki
Creation Date   2019-02-14T15:15:00.129
Rights   CC-BY 4.0
Type   text/vnd.dariah.dhrep.collection+turtle

Description

Der Research Data Lifecycle oder Forschungsdatenzyklus ist ein bekanntes Konzept aus der Informationswissenschaft. Es wird in vielen Forschungsinfrastrukturen genutzt, um die verschiedenen Schritte aufzuzeigen, die Daten im Forschungsprozess durchlaufen und um zu verdeutlichen, welche Anforderungen an die Daten und die Werkzeuge oder Dienste gestellt werden. Dabei werden in den jeweiligen Fachbereichen unter Berücksichtigung ihrer heterogenen wissenschaftlichen Praxis und (Daten-)Standards verschiedene Modelle entworfen und diskutiert. Es gibt daher kein verbindliches, einheitliches Modell, die einzelnen Schemata sind aber letztlich Varianten des geisteswissenschaftlichen Forschungsprozesses und akzentuieren durch unterschiedliche Gewichtung einzelne Aufgaben. Sie repräsentieren also grundlegende Prozesse, die in allen Modellen enthalten sind. Die basalen Prozesse eines Forschungsdatenzyklus bilden daher auch das intellektuelle Konzept hinter der Infrastruktur von DARIAH-DE, dem deutschen Beitrag zu DARIAH-EU, einem digitalen Forschungsinfrastrukturprojekt für die Geistes- und Kulturwissenschaften. Dabei macht der dort vorgeschlagene generische Workflow die Komplexität des Forschungsprozesses deutlich und insbesondere die Iteration der verschiedenen Schritte. Auf der praktischen Ebene wurde innerhalb von DARIAH-DE eine Data Federation Architecture (DFA) entwickelt. Unter diesem Begriff sind mehrere modulare Komponenten gebündelt, die für sich alleine oder im Zusammenspiel genutzt werden können: das DARIAH-DE Repository, die Collection Registry, das Data Modelling Environment und die Generic Search sowie einen EPIC-PID-Service. Für viele der in den verschiedenen Schritten eines Forschungsdatenzyklus anfallenden Aufgaben können Komponenten der Data Federation Architecture zum Einsatz kommen. Hierunter fallen die Indizierung und Anzeige von Forschungsdaten, die Bereitstellung von Beschreibungsschemata für Sammlungsbeschreibungen und deren langfristige Speicherung, sowie eine umfassende Suchfunktionalität für heterogene strukturierte Datensammlungen und Archive. Zudem bietet die DFA spezifische hinterlegte Metadatenstandards und Crosswalks zwischen Metadaten-Schemata, um Hilfestellung beim Mapping von Forschungsdaten unterschiedlicher Herkunft und Beschaffenheit zu ermöglichen. Die DFA deckt nicht alle Schritte eines Forschungsprozesses und damit letztlich auch des Forschungsdatenzykluses ab. So bleibt der Abschnitt der Analyse (je nach Einteilung / Benennung der Etappen im Datenzyklus auch der der Visualisierung) offen. Dies stellt aber kein Problem dar, denn es gibt in den digitalen Geisteswissenschaften hinreichend andere Tools, die diese Lücke zielgerichtet füllen können. Das Poster möchte den Zusammenhang dieser beiden Konzepte, Forschungsdatenzyklus und Datenföderationsarchitektur deutlich machen bzw. die Einstiegsstellen in den Forschungsdatenzyklus mit Hilfe der DFA-Module aufzeigen. Dabei lassen sich diese Modelle nicht Eins zu Eins aufeinander beziehen, sie sind vielmehr durch “one-to-many”-Beziehungen miteinander verbunden. Auch wurde der Forschungsdatenzyklus für die visuelle Darstellung auf einem Poster vereinfacht, da der oben genannte generische Workflow relativ komplex ist, und stellt daher ein vereinfachtes Modell und nicht die Realität dar. Es wurden folgende Bereiche abgegrenzt: Erstellung, Verarbeitung, Analyse, Archivierung, Zugang und Nachnutzung. Die modulare Struktur der DFA erlaubt eine ständige Weiterentwicklung und Anpassung an sich verändernde Nutzungsszenarien und neue Entwicklungen im Forschungsdatenmanagement. Sie befindet sich zurzeit noch in einem “work in progress”- Stadium, das Poster wird daher den aktuellen Stand der Entwicklung vorstellen.

Citation

Claudio Leone, Hanna-Lena Meiners, Lisa Klaffki (2019). Der Kreislauf des (Daten-)Lebens. Zugangspunkte in die DARIAH-DE Datenföderationsarchitektur. DARIAH-DE. https://doi.org/10.20375/0000-000b-d558-2  

Content

  1. hdl:21.11113/0000-000B-D559-1
  2. hdl:21.11113/0000-000B-D55A-0