ScaDS Logo

CENTER FOR
SCALABLE DATA ANALYTICS
AND ARTIFICIAL INTELLIGENCE

Projektüberblick ScaDS.AI

Das seit 2014 bestehende nationale Kompetenzzentrum für Big Data, ScaDS Dresden/Leipzig, wird zu einem der deutschen Zentren für Künstliche Intelligenz (KI) ausgebaut, das im Rahmen der KI-Strategie der Bundesregierung gefördert wird. Dieses erweiterte Zentrum trägt den Namen ScaDS.AI (Center for Scalable Data Analytics and Artificial Intelligence) Dresden/Leipzig. Das Vorhaben wird durch das Bundesministerium für Bildung und Forschung gefördert und soll durch den Freistaat Sachsen mit der Einrichtung mehrerer neuer KI-Professuren an beiden Standorten weiter verstärkt werden. In der Grundlagenforschung zu KI-Methoden strebt das Zentrum an, die Lücke zwischen der effizienten Nutzung von Massendaten, fortschrittlichen KI-Methoden und der Verwaltung von Wissen zu schließen. Neben neuen Methoden des Maschinellen Lernens und der Künstlichen Intelligenz stehen darüber hinaus auch Forschungsthemen zu Vertrauen, Schutz der Privatsphäre, Transparenz, Minderheitenschutz und Rückverfolgbarkeit von KI-getriebenen Entscheidungen im Mittelpunkt.

Projektüberblick ScaDS2

Motivation

Heutzutage durchdringt die Digitalisierung alle Lebensbereiche und produziert Unmengen von Daten. Wissenschaft und Forschung tragen in zunehmendem Maße zu dieser Datenflut bei, indem datenintensive Experimente, komplexe Simulationen sowie miteinander verbundene Sensornetzwerke große Mengen an Daten produzieren und diese in digitalen Archiven gespeichert werden. Darüber hinaus bestimmt die Digitalisierung als Treiber der Datengenerierung zunehmend Geschäftsprozesse und beeinflusst viele Aspekte im Privatleben von Einzelpersonen. Viele alltägliche Geräte und Gegenstände sind mittlerweile im sogenannten Internet of Things vernetzt und intelligente Assistenten sind unsere ständigen Begleiter im Smartphone oder im Wohnzimmer.

Effizienter und intelligenter Umgang mit sehr großen, oft verteilt vorliegenden und vielfach heterogenen Datenbeständen bestimmt zunehmend die wirtschaftliche und wissenschaftliche Konkurrenzfähigkeit. Große Datenbestände aus sozialen Netzwerken, Multimedia-Sammlungen, Sensor-Netzwerken oder wissenschaftlichen Experimenten und deren Analyse mit innovativen Methoden (z.B. mit Maschinellen Lernverfahren) eröffnen vielfältige neue Optionen der Verwertung. In vielen Fällen stehen Wissenschaft und Industrie vor beispiellosen Herausforderungen die allgemein als Big Data bezeichnet werden.

Der entstehende Ressourcen-Bedarf übersteigt oftmals die Möglichkeiten bisher verwendeter Verfahren zur Datenakquisition, -integration, -analyse und -visualisierung. Nur wenn Daten effizient und mit intelligenten Methoden verarbeitet werden, können Daten die treibende Kraft sein, um Wissen durch Analyse zu gewinnen.

Big Data Kompetenzzentrum ScaDS Dresden/Leipzig

Um den datengetriebenen Herausforderungen zu begegnen, die sich oftmals zwischen den Anwendungen unterscheiden, ist ein intensiver und kollaborativer Austausch zwischen Domänenwissenschaftlern und Datenanalyseexperten unerlässlich. Nur im Team können Erkenntnisse und Lösungen für eine bestimmte Herausforderung gefunden werden. Diese Erkenntnis war der Ausgangspunkt für die Errichtung eines Kompetenzzentrums für Big Data. Seit Oktober 2014 bearbeiten die Projektpartner gemeinsam vielfältige Big Data Forschungs- und Anwendungsentwicklungthemen in einem deutschlandweiten Kompetenzzentrum, finanziert durch das Bundesministerium für Bildung und Forschung (BMBF), FKZ. 01IS14014B. Nach erfolgreichen 4 Jahren der ersten Phase wurde ScaDS Dresden/Leipzigim Oktober 2018 für eine zweite Phase von 3 Jahren verlängert (BMBF FKZ. 01IS18026B) mit dem Ziel des weiteren Ausbaus und der langfristigen Verstetigung.

An den beiden Universitätsstandorten Dresden und Leipzig untersucht das nationale Kompetenzzentrum viele unterschiedliche Aspekte der Verarbeitung großer Datensätze in Wissenschaft und Industrie. Neue Methoden und Lösungen wurden/und werden entwickelt, um große und komplexe Datensätze aus verschiedenen Anwendungsbereichen zu untersuchen. Innerhalb des Kompetenzzentrums sind fünf Anwendungs-Bereiche integriert. Sie bringen ihre domänenspezifischen Anforderungen für die Verarbeitung großer Datenmengen mit ein, treiben aber auch die Informatikforschung zu Methoden für datenintensive Anwendungen voran (siehe Abbildung). Diese Anwendungen kommen aus den Biowissenschaften, Medizin, den Material- und Ingenieurwissenschaften, den Digital Humanities , Umwelt und Geowissenschaften, Chemie, Physik sowie aus Wirtschaft und Industrie. Unsere Forschung basiert auf der Beobachtung, dass Big-Data-Lösungen nur durch Anpassung des gesamten Datenlebenszyklus und durch Zugang zu modernen Datenverarbeitungs- und Datenverarbeitungsarchitekturen entwickelt werden können. Zunächst müssen Daten aus verschiedenen Quellen mit hoher Qualität integriert werden. Daten müssen durch Anreicherung erweitert werden und um neue Erkenntnisse zu gewinnen, kann weiteres Wissen extrahiert werden. Schließlich müssen dem Benutzer Daten über Methoden der visuellen Analyse präsentiert werden, um den Domänenwissenschaftler in den Analyseprozess einzubinden.

Ein wesentlicher Erfolgsfaktor von ScaDS Dresden / Leipzig ist neben der Domänen- und Informatikmethode die Gründung eines Service Centers, das interdisziplinäre Forschungsaktivitäten bündelt. Das Service Center bietet eine zentrale Anlaufstelle für Forschung und Industrie und koordiniert methodische Forschung und Anwendungsforschung an beiden Hochschulstandorten. In den letzten Jahren konnten zahlreiche Kooperationen mit einer Vielzahl anderer wissenschaftlicher Institutionen und Unternehmen aufgebaut werden. Das Servicezentrum unterstützt eine breite Palette von Anwendungsdomänen und vermittelt dabei auch nötige Big Data Kompetenzen im Rahmen von Trainings oder der universitären Ausbildung. Häufig können vorhandene und bewährte Lösungen, wie der effiziente Einsatz von Datenintegrationstechniken oder die Anwendung von Hochleistungsrechnern für große rechenintensive Szenarien, zwischen Anwendungsbereichen übertragen werden. Um die entwickelten Methoden zu verbreiten und Best Practices im Umgang mit Big Data zu erschließen, organisiert das Service Center auch Schulungen und Workshops und beteiligt sich aktiv an der Ausbildung an beiden Universitäten. Wir konnten eine international besuchte Sommerschulreihe sowie eine Industrie-Workshopreihe namens Big Data in Business (BIDIB), etablieren und wir sind auf nationalen und regionale Veranstaltungen vertreten um die Forschungsergebnisse und Expertise des Kompetenzzentrums zu teilen.