ScaDS Logo

COMPETENCE CENTER
FOR SCALABLE DATA SERVICES
AND SOLUTIONS

Automatisierte Siedlungserkennung in topographischen Karten

Einleitung

Die Analyse von Siedlungsstrukturen, Bausubstanz und Gebäudenutzung, gehört zu den Kernaufgaben der Raum- und Landschaftsplanung. Relevante Anwendungsgebiete sind z.B. städtebauliche Maßnahmen, Planung von Verkehrswegen und Infrastruktur, Naturschutzplanung oder die Erstellung von Gefahrenkarten bei Naturkatastrophen. Die größte zentralisierte und zumindest europaweit flächendeckend verfügbare Datengrundlage für solche Untersuchungen, stellen topographische Karten dar. Dabei spielen sowohl aktuelle als auch historische Karten eine Rolle. Letztere dienen zur Analyse von historischen Entwicklungen sowie zu langfristigem Monitoring von Siedlungsstrukturen und Landnutzung. Ein entscheidender Schritt bei der Analyse von Katenmaterial ist die Erkennung von Siedlungen, das heißt die Aufteilung der untersuchten Region in Siedlungs- und Nicht-Siedlungsgebiete (automatische Segmentierung topographischer Karten).

Zielsetzung

Ziel der von Daniel Schemala im März 2016 abgeschlossenen Diplomarbeit „Semantische Segmentierung historischer topographischer Karten“ war es, ein Softwarewerkzeug zu entwickeln, das es erlaubt, in eingescannten Karten Siedlungsgebiete zu erkennen.
 

Methodik

Die dabei verwendeten Methoden stammen aus dem Bereich des Maschinellen Lernens. Dabei wird – qualitativ gesprochen – ein Computerprogramm mit Hilfe von Karten mit bekannter Siedlungsverteilung angelernt, um nach diesem Lernschritt auch neue Karten unbekannter Siedlungsverteilung segmentieren zu können. Zunächst werden – ausgehend von den Farbwerten der einzelnen Pixel – mit Hilfe eines auf Entscheidungsbäumen beruhenden Algorithmus („decision forest“) die Wahrscheinlichkeiten berechnet, ob jeder der Pixel einer Siedlung angehört, oder nicht. Grundsätzlich könnte diese Methode allein bereits zur Segmentierung verwendet werden, sie liefert aber im Fall von topographischen Karten im Allgemeinen keine brauchbaren Ergebnisse, da das Vorwissen, dass Siedlungen größere zusammenhängende Gebiete bilden, außer Acht gelassen wurde. Um diese Information zu berücksichtigen und somit zusammenhängende Siedlungsflächen (wie sie in der Realität anzutreffen sind) zu erhalten, wurde als zweiter Schritt ein „Conditional Random Field“ angewendet. Details zu den Methoden sowie weiterführende Literaturangaben finden sich in Daniel Schemalas Diplomarbeit, die unter folgendem Link erhältlich ist:
https://github.com/EinfachToll/Lakaseg/blob/master/Semantische%20Segmentierung%20historischer%20Karten.pdf

Ergebnisse

Die Software „Lakaseg“, die im Rahmen der Diplomarbeit entwickelt wurde, ist an historischem Kartenmaterial („Messtischblätter“ von ca. 1890) getestet und liefert zufriedenstellende Ergebnisse. Die Modellparameter müssen vom Nutzer geeignet gewählt werden, um optimale Ergebnisse zu erzielen. Die Software ist ebenfalls frei erhältlich und kann – zusammen mit einer Anleitung zur Installation und Verwendung des Programms – unter folgendem Link heruntergeladen werden: https://github.com/EinfachToll/Lakaseg

 

Abbildung 1 (links) zeigt das Siedlungsgebiet (in grün) für einen eher einfachen Fall (eine einzelne, klar zusammenhängende Siedlung). Abbildung 2 (rechts) zeigt die Segmentierung für einen schwierigeren Fall, eine Karte die mehrere kleine, verstreute Siedlungsgebiete enthält. In beiden Fällen liefert Lakaseg zufriedenstellende Ergebnisse.

 

 

Ausblick

Aktuell wird im Rahmen des Projekts die Software am Hochleistungsrechner „Taurus“ getestet. Zunächst soll ein Laufzeitvergleich zwischen Taurus und einem üblichen PC durchgeführt werden. Als nächster Schritt ist eine deutschlandweite, flächendeckende Segmentierung der Messtischblätter von 1870-1945 geplant. Dies erfordert eine Rechenleistung und Speicherkapazität, die nur auf einer Großrechnerarchitektur zur Verfügung steht. Das Kartenmaterial wird von der sächsischen Landes- und Universitätsbibliothek (SLUB) verwaltet. Aktuell laufen Gespräche bezüglich einer Kooperation zur Auswertung der Karten.

 

Ansprechpartner

Daniel Schemala

Dmitri Schlesinger (Institut für Künstliche Intelligenz, TU Dresden)

Hendrik Herold (IÖR – Leibnitz-Institut für Ökologische Raumentwicklung, Dresden)

Peter Winkler (ZIH - Zentrum für Informationsdienste und Hochleistungsrechnen, TU Dresden)