ScaDS Logo

COMPETENCE CENTER
FOR SCALABLE DATA SERVICES
AND SOLUTIONS

Anwendungsbereich: Digital Humanities

Die Digital Humanities stellen im Kompetenzzentrum einen wichtigen Anwendungsbereich dar, der im Projektverbund vor allem am Standort Leipzig bearbeitet wird. Für die textorientierten Geisteswissenschaften sind interaktive Textanalyse- und Annotationsverfahren für typische eHumanities Anwendungen (u.a. Verlinkung von mehrsprachigen und multimodalen Ressourcen, Netzwerkanalysen mit Named Entities und deren Visualisierung, Identifikation von Themen und Sentiments über Raum und Zeit, Zitationsanalysen) von besonderer Bedeutung. Damit wird eine raum-zeitliche Kontextualisierung sowie eine sprachevolutionäre Einordnung von Werken ermöglicht, welche der Interpretation von Einzelwerken eine vollkommen neue Dimension hinzufügt.

Anwendungen in diesem Bereich unterscheiden sich von klassischen, im Wesentlichen auf Volume und Velocity hin ausgerichteten, Big Data Anwendungen vor allem durch die folgenden Besonderheiten:

  • Primärdaten bestehen meist nur aus verhältnismäßig kleinen Datenmengen aus verschiedenen Medien (Text, Bilder, Musik, Videos, usw.);
  • aus den Primärdaten entstehen durch umfangreiche Annotationen, die mehrfach iteriert sein können, auch im Sinne von Big Data Volume oft sehr große Datenkollektionen (Sekundärdaten), die meist auch räumlich verteilt sind;
  • die Verarbeitung dieser mehrfach annotierten Datenkollektionen ist im Hinblick auf ihre Komplexität meist aufwändig und erfordert neben performanzoptimierten Algorithmen insbesondere auch Umgebungen für High-Performance Computing;
  • in Ermangelung passender Forschungsinfrastrukturen stellen jedoch diese Anwendungen aus Primär- und Sekundärdaten nebst aufgabenspezifischen Auswertungsverfahren meist gekapselte stand-alone Anwendungen mit eigenen Daten und Softwarewerkzeugen dar (Variety).