ScaDS Logo

COMPETENCE CENTER
FOR SCALABLE DATA SERVICES
AND SOLUTIONS

Titel: Analyse von Chromatin durch den K-median und das Consensus Clustering

Student: Daniel Abitz

Für die Auswertung großer Datenmengen werden häufig sogenannte Clusterverfahren genutzt. Ziel dieser ist es, die gegebenen Daten in möglichst homogene Gruppen zu unterteilen. Dabei ist es sehr oft schwierig, für ein Problem das optimale Verfahren zu bestimmen. Aber auch die Wahl der einzustellenden Parameter kann große Auswirkungen auf das Ergebnis haben. In dem Vortrag werden die Ergebnisse der Arbeit über die Analyse des K-median und des Consensus Clustering vorgestellt. Sie wurden verwendet, um einen Datensatz mit ca. 815.000 Elementen zu clustern, welcher die Methylierungen an den Histonen verschiedener Mäusezellen beschreibt. In vorherigen Arbeiten ist dafür bereits der K-means++ verwendet worden. Das Ziel ist die Untersuchung der Kompaktheit des K-median und der Wahl der initialen Startzentren anhand des Consensus Clusterings.

Kontakt: Daniel Gerighausen / Dirk Zeckzer