ScaDS Logo

COMPETENCE CENTER
FOR SCALABLE DATA SERVICES
AND SOLUTIONS

Masterarbeit (Leipzig): Verwaltung und Verarbeitung von Massenspektrometerdaten

(english Version below)

Am Helmholtz Zentrum für Umweltforschung (UFZ) werden Wechselwirkungen zwischen Mensch und Natur erforscht. Ein Schwerpunkt ist dabei der Verbleib von Chemikalien in der Umwelt und deren Einfluss auf Mensch und Ökosystem. Ein chemischer Stoff tritt jedoch nie isoliert in der Umwelt auf, sondern mischt sich mit einem Hintergrund aus natürlich vorkommenden chemischen Substanzen. Dieses natürliche organische Material stellt eine der komplexesten Mischungen von chemischen Substanzen dar, und ist praktisch überall auf der Erde zu finden.

Am UFZ werden Spitzentechnologien angewandt, um die natürlich vorkommenden Substanzen mit größtmöglicher Genauigkeit zu untersuchen, unter anderem mit sogenannter ultrahochauflösender Massenspektrometrie. Zehntausende Moleküle können so in jeder Probe detektiert und chemische Summenformeln aus der Kenntnis von exakten Atommassen und gemessener Masse berechnet werden. Die so anfallenden Datensätze sind sehr groß, haben eine komplexe Struktur und sind durch chemische Regeln und Probenherkunft mit- und untereinander verknüpft.

In einem Gemeinschaftsprojekt von ScaDS und UFZ wollen wir eine Datenmanagement- und Datenevaluationsplattform entwickeln, die den hohen Anforderungen an die großen und komplexen Datensätze gerecht wird. Wir bieten dazu verschiedene Themen für Masterarbeiten zur Entwicklung einer Datenmangementmentarchitektur basierend auf Big Data Technologien (Hadoop, Spark, Flink) zur Datenvisualisierung und zur Entwicklung von Auswertungsalgorithmen.

 

Wir suchen Interessierte Studenten mit

  • Motivation zur Arbeit in einem interdisziplinären Projekt

  • Erfahrungen im Datenmanagement

  • Gute Programmierfähigkeiten (Java or Scala or Python)

  • Erfahrung mit Apache Hadoop/Spark/Flink wäre willkommen, aber keine Voraussetzung

  • Tiefes Wissen in der Chemie ist keine Voraussetzung 

 

Kontakt: 

  • Oliver Lechtenfeld (Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!)

  • Anika Groß (Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!)

 

---english---

The Helmholtz Centre for Environmental Research (UFZ) investigates the interaction between environment and humans. One focus is the fate of chemicals that are released to the environment with unknown effects for humans and the ecosystem. However, chemical substances outside the laboratory never occur isolated but mix with a background of naturally occurring molecules. This natural organic matter is one of the most complex mixture of chemical substances and found almost anywhere on the planet.

Here at the UFZ state-of-the art analytical tools (e.g. ultra-high resolution mass spectrometry) are used to characterize naturally occurring molecules with high accuracy and precision. Tens of thousands molecules can be detected in each sample and molecular formulas be calculated from precise mass measurements and known masses of atoms. Therefore, data sets produced by these instruments are large, structurally complex, and intrinsically connected by chemical rules and measurement parameters.

In a joint project of ScaDS and the department analytical chemistry we aim to devise a data management and evaluation pipeline facilitating the handling of these expansive data sets.

We offer multiple topics for master theses to built the underlying database architecture most likely based on Big Data Technologies (Apache Hadoop, Spark, Flink..), to implement data evaluation algorithms as well as for building novel visualizations of mass spectrumetry data.

 

We are looking for Students with

  • motivation to work in an interdisciplinary context

  • good knowledge in data management

  • good programming skills in (Java or Scala or Python)

  • experience with Apache Hadoop/Spark/Flink is welcome, but not a requirement

  • background in chemistry is not a requirement

 

Contacts:

  • Oliver Lechtenfeld (Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!)

  • Anika Groß (Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!)