ScaDS Logo

CENTER FOR
SCALABLE DATA ANALYTICS
AND ARTIFICIAL INTELLIGENCE

Webcrawling gebäuderelevanter Informationen

Für die Planung von Städten, Infrastruktur oder Energieversorgung  werden kleinräumige  Informationen  bis auf Gebäudeebene benötigt. Eine besondere Rolle spielen Referenzinformationen zur Gebäudeform, Nutzung, Baualter, Zustand oder der Geschossigkeit des Gebäudes, auf deren Basis mit Hilfe räumlicher Modellierungsansätze Verteilungsmuster von Wohnungen, Einwohnern, Arbeitsstätten  und  Infrastrukturen kartiert oder energetische Bedarfe abgeschätzt werden können. Die Erhebung dieser Referenzdaten ist allerding nur durch Ortsbegehung möglich und damit sehr aufwändig. Eine weitere Möglichkeit zur Sammlung dieser Informationen bietet die automatisierte Auswertung nutzergenerierter Inhalte und Bilder (z.B. OpenStreetMap, Mapillary, WikiMapia). Im Kontext von Gebäuden spielt hier WikiMapia eine besondere Rolle, da diese Platform neben Daten zur Gebäudenutzung auch georeferenzierte Street View Daten hinterlegt werden können. Über eine API lässt sich der Inhalt strukturiert auslesen.
Ziel war darum die Entwicklung eines WebCrawlers zum strukturierten Auslesen von gebäudebezogenen Inhalten. Dabei liegt das Hauptaugenemerk auf Eigenschaften wie Name, Art, Alter, etc. und natürlich auch auf den georeferenzierten Bildern, die für einen Teil der Gebäude vorliegen. Mit Hilfe des Programms wird zunächst selbständig eine Verbindung zum Wikimapia Tool aufgebaut. Über eine Abfrage kann vom Nutzer räumlich über Koordinaten oder auch semantisch durch Auswahl bestimmter Inhalten (z.B. mit Fokus auf bestimmte Gebäudetypen) die Inhalte ausgelesen und in einer Ausgabedatei gespeichert werden. Die Umsetzung des Programms erfolgte in der Programmiersprache Java unter Nutzung der Bibliotheken von Java.io und Java.net in der Entwicklungsumgebung Eclipse-Luna. Dem Anwender steht eine ausführbare .jar Datei zur Verfügung, die kommandozeilenbasiert mit dem Befehl java -jar wikimapia.jar ausführbar ist. Des Weiteren kann der Nutzer Parameter mitgeben, mit der die Abfrage räumlich und semantisch gesteuert wird. Das Programm läuft sowohl unter Linux als auch unter Windows (getestet unter Windows 7).

 

Kontakt:

Moritz Haferburg: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!

Robert Hecht: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!