ScaDS Logo

COMPETENCE CENTER
FOR SCALABLE DATA SERVICES
AND SOLUTIONS

Titel: Adaptives Importance Sampling

Student: Jakob Matthes

Inhalt:

Die Berechnung von Erwartungswerten ist ein wichtiges Problem in der Datenanalyse, sei es direkt bei der Bestimmung von Mittelwerten oder Varianzen oder aber bei der Bewertung von datenerklärenden Modellen. Dabei kommt es immer wieder vor,  dass eine analytische Berechnung der Erwartungswerte bei ansteigender Dimensionalität der betrachteten Größen nicht mehr praktikabel ist. Dies lässt sich, vereinfacht gesprochen, darauf zurückführen, dass die für eine analytische Erwartungswertbestimmung nötige Integration ein Problem ist, dessen Kosten exponentiell mit der Dimensonalität der betrachteten Daten anwächst, ein Phänomen, welches auch als Fluch der Dimensonalität bezeichnet wird. Eine Antwort auf dieses Problem liefern Monte-Carlo-Verfahren, welche sich den Erwartungswerten durch simulationsbasierte Approximation annähern.

Der Inhalt dieser Arbeit besteht aus einer Vorstellung und Erklärung einiger Varianten solcher Monte-Carlo-Verfahren, insbesondere dem von mir neu entwickelten Adaptive-Importance-Sampling-Algorithmus, welchen ich am Ende der Arbeit anhand von synthetischen Daten evaluiere und mit mehreren der zuvor vorgestellten anderen Algorithmen vergleiche. Dabei liegt ein besonderes Augenmerk auf dem Aufbau eines soliden wahrscheinlichkeitstheoretischen Fundaments um dem Umstand Rechnung zu tragen, dass die vielen probabilistischen oder statistischen Anwendungen zugrunde liegenden mathematischen Überlegungen insbesondere für Einsteiger nur schwer zu überblicken und einzuordnen sind.


Kontakt: Prof. Gerhard Heyer