ScaDS Logo

COMPETENCE CENTER
FOR SCALABLE DATA SERVICES
AND SOLUTIONS

Themenbereich 5: Data Life Cycle Management und Workflows

Überblick:

Wachsende Datenvolumina, zunehmende Datenheterogenität sowie Echtzeitanforderungen bei der Anfrageverarbeitung erfordern gänzlich neue Ansätze zur Datenverarbeitung und -analyse. Die klassische schrittweise Verarbeitung von Daten entlang eines fest definierten Prozessmodells und die damit verbundene Einführung von Redundanz erweist sich für die agile Exploration und Zusammenführung unterschiedlichster Daten als zu schwergewichtig und statisch. Stattdessen sind flexible Workflows und adaptive Prozesse zur Aufnahme, Speicherung, Extraktion, Transformation, Analyse und Interpretation der Daten notwendig. Zu jedem Zeitpunkt innerhalb dieser Workflows ist ein strenges Data Lifecycle Management (DLCM) erforderlich. Dies umfasst die kontinuierliche Bewertung aller erfassten Daten und der daraus abgeleiteten Zwischenergebnisse, um jeweils die optimale Verwaltung der Daten zu gewährleisten. Die Verdichtung riesiger, zum großen Teil unstrukturierter Datenmengen auf wenige abgeleitete Kennzahlen und Modelle bedarf darüber hinaus Techniken der Data Provenance, um die Herkunft eines Ergebnisses und den Prozess seiner Entstehung nachzuvollzie-hen und hinsichtlich seiner Qualität bewerten zu können. Datenzentrische Dienste für spezielle Anwendungsfälle sollen den Wissenschaftlern über ein Science Gateway zur Verfügung gestellt werden.

Schwerpunkte:

  • Workflows
  • Data Lifecycle Management
  • Data Provenance

Forschungspartner:

  • Professur Datenbanken, TU Dresden: Prof. W. Lehner
  • Lehrstuhl Betriebliche Informationssysteme, Universität Leipzig: Prof. K.-P. Fähnrich
  • Zentrum für Informationsdienste und Hochleistungsrechnen, TU Dresden: Prof. W. E. Nagel

 

Research Cluster Management