ScaDS Logo

CENTER FOR
SCALABLE DATA ANALYTICS
AND ARTIFICIAL INTELLIGENCE

Graph Mining für fortgeschrittene Datenanalysen - Entwicklungsstand

Beitragsseiten

Entwicklungsstand

Die aktuelle Version 0.2 von Gradoop ist ein Forschungsprototyp, der bereits zeigt, wie sich verschiedene Operatoren und Algorithmen zur Beantwortung komplexer analytischer Fragen kombinieren und horizontal skalierbar ausführen lassen. Derzeitiger Forschungsschwerpunkt ist die effiziente Abbildung komplexer Graphalgorithmen auf das Programmiermodell von Big Data-Plattformen, insbesondere das von Apache Flink. Dabei sind vor allem solche Algorithmen interessant, die das NP-vollständige Teilgraph Isomorphie-Problem beinhalten, zum Beispiel Anfragen durch Mustergraphen (Pattern Matching) und das bereits erwähnte Frequent Subgraph Mining. Hier beinhaltet die aktuelle Version funktionsfähige Implementierungen, welche fortlaufend mit den Ergebnissen der Forschungsaktivität optimiert werden. Zudem ist geplant, den Funktionsumfang um spezielle Operatoren zur graph-basierten Datenintegration zu erweitern.

Weiterführende Links

Aktuelle Präsentation von der Data2Day 2016

Ausführlicher Artikel aus der JavaSPEKTRUM 05/2016

Liste der wissenschaftlichen Publikationen

Gradoop auf GitHub