Direkt zum Inhalt

Studien- und Diplomarbeiten

Studien- Bachelor-, Master- und Diplomarbeiten

Der Lehrstuhl ist ständig an Arbeiten im Bereich seiner Forschungsthemen interessiert. Wenn Sie ein Student sind mit einem spannenden Vorhaben oder Interesse an unseren Themen, sprechen Sie uns an.

Wir sind ausdrücklich offen für gemeinsame Arbeiten mit Firmen, Forschungsinstituten oder anderen Institutionen.

Offene Themen

Automatische Erkennung von Musikveranstaltungen auf Webseiten

  • Hooolp ist ein Start-Up Unternehmen, das ein webbasiertes System zur geografischen Suche nach (internationalen) Musikereignissen erstellt und vermarktet.
  • In einer Studienarbeit soll untersucht werden, in weit die dem zugrundeliegenden Musikereignisse automatisch oder semi-automatisch auf Webseiten erkannt werden können.
  • Dazu soll ein System zum automatischen Taggen von Veranstaltungsorten, Bandnamen und Zeitpunkten in Webseiten erstellt werden. Das System soll zunaechst mit Listen trainiert werden, später aber auf Machine Learning Techniken basieren (z.B. Maximum Entropy Tagging).
  • Die Arbeit wird gemeinsam vom Lehrstuhl und Hr. Pokrandt, Geschäftsführer von Hooolp, betreut.
  • Voraussetzung: Grundkenntnisse im Bereich Text Analytics und Maschinelles Lernen, Spass an Musik.
  • Möglich als Studienarbeit für Studierende der Informatik; eine anschliessende Diplomarbeit ist sehr gut möglich.

Machinelles Lernen zur Schadensvorhersage bei Naturkatastrophen

  • Nach Hochwasserereignissen in den Jahren 2002, 2005 und 2006 wurden am GeoForschungsZentrum in Potsdam (GFZ) umfangreiche Daten über Hochwasserschäden und potentielle Einflussgrößen mit Hilfe von Telefonbefragungen erhoben.
  • In der Arbeit soll untersucht werden, ob eine Analyse dieser Daten mit Methoden des Maschinellen Lernens sinnvolle Ergebnisse bringt. Speziell soll der Frage nachgegangen werden, ob man die Höhe eines verursachten Schadens aus den im Fragebogen erhobenen Daten (z.B. zur Hochwassereinwirkung, Wasserstand, Fließgeschwindigkeit, Vorsorgeverhalten Betroffener etc.) vorhersagen kann.
  • In einem weiteren Schritt soll geprüft werden, ob die Methoden prognostisch eingesetzt werden können.
  • Die Arbeit erfolgt in Kooperation mit dem GFZ, Sektion Ingenieurhydrologie und Sektion Erdsystemmodellierung. Sie ist in laufende Projekte am GFZ eingebunden und verlangt (und bietet) enge Zusammenarbeit in einem interdisziplinären Team.
  • Voraussetzung: Grundkenntnisse im Bereich Data Mining oder Maschinelles Lernen, Spass am interdisziplinären Arbeiten.
  • Möglich als Studien- oder Diplomarbeit für Studierende der Informatik.

Moderne Verfahren zur Klassifikation von Genexpressionsdaten

  • Durch moderne Microarray-Verfahren kann man heute das Expressionsniveau aller menschlichen Gene zu einem gegebenen Zeitpunkt in einer gegebenen Zelle gleichzeitig messen. Es sind international vielfältige Bestrebungen im Gange, diese Daten zur frühen Diagnose von Krankheiten zu benutzen.
  • In der Forschungsgruppe von Dr. Kemmner am MDC werden u.A. Genexpressionsdaten kolorektaler Tumore gesammelt. Es existiert ein umfassender Datensatz, der vielversprechende Charakteristika zeigt.
  • In Kooperation mit Dr. Kemmner und der Firma MicroDiscovery sollen moderne Methoden der Klassifikation auf diesem Datensatz erprobt und evaluiert werden. Von besonderer Bedeutung wird eine sorgfältige Feature-Selection sein.
  • Voraussetzung: Gute Kenntnisse in und Interesse an Statistik bzw. Verfahren des Machine Learning / Data Mining. Grundkenntnisse in der Bioinformatik sind wünschenswert
  • Diplom- oder Masterarbeit für Studenten der Informatik oder der Bioinformatik.
  • Kooperation mit dem MDC (Dr. Kemmner) und der Firma MicroDiscovery.

Sprachphylogenie mit Maximum Parsimony Methoden

  • Maximum Parsymony ist eine komplexe Methode zur Rekonstruktion von Stammbäumen. In der Arbeit soll diese Methode für Sprachdaten implementiert und evaluiert werden.
  • Mit Sprachdaten meinen wir dabei Zeichenketten, die einer natürlichen (eventuell historischen) Sprache entsprechen. Dies können sowohl phonetische Umschreibungen als auch schriftsprach-orientierte Darstellungen sein.
  • Die Arbeit kann auf einer existierenden, aber auf kleine Alphabete beschränkte Implementierung aufbauen und muss diese erweitern. Ausserdem sollen verschiedene Heuristiken zur Beschleunigung der sehr komplexen Methode implementiert und anhand der Qualität der Ergebnisse verglichen werden.
  • Studien- oder Diplomarbeit für Studierende der Informatik oder dre Computerlinguistik.
  • Kooperation mit dem Institut für Deutsche Sprache und Linguistik.

Modellierung und semantische Suche mit Softwareagenten

  • In Kooperation mit der Eitco GmbH, Berlin.
  • Es sind verschiedene Themen möglich, die je nach persönlichen Vorlieben zugeschnitten werden können.
  • Möglich als Studien- oder Diplomarbeit für Studierende der Informatik.

Workflowlösungen zur Integration von Genomannotationen

  • In Kooperation mit dem DKFZ, Heidelberg. Die Arbeit wird in Heidelberg ausgeführt. Eine finanzielle Unterstützung als Aufwandserstattung ist möglich.
  • Informationen über Abschnitte in einem Genom (wie z.B. Gene, konservierte Bereiche, regulatorische Regionen etc.) bezeichnet man als Annotation. Viele öffentliche Datenbanken verwalten Annotationen, die sich teilweise ergänzen, teilweise widersprechen. In der Arbeit sollen workflowbasierte Verfahren für die Integration von Annotationen aus verschiedenen Datenquellen untersucht werden. Wichtig ist auch die Anbindung an das DKFZ-eigene System iCHIP zur Verwaltung von Genexpressionsdaten.
  • Möglich als Master- oder Diplomarbeit für Studierende der Informatik oder der Bioinformatik.

Zugriff auf Genexpressionsdatenbanken aus Statistikpaketen

  • In Kooperation mit dem DKFZ, Heidelberg. Die Arbeit wird in Heidelberg ausgeführt. Eine finanzielle Unterstützung als Aufwandserstattung ist möglich.
  • Daten aus Genexpressionsexperimenten werden vornehmlich in relationalen Datenbanken verwaltet. Ihre Analyse erfolgt aber meist innerhalb von statistischen Programmpaketen wie R oder SAS. In der Arbeit soll eine Schnittstelle zwischen einem Statistikpaket und der Genexpressionsdatenbank iCHIP entwickelt und implementiert werden. Die Schnittstelle muss auf Web-Services basieren und auf hohen Durchsatz ausgelegt sein.
  • Möglich als Master- oder Diplomarbeit für Studierende der Informatik oder der Bioinformatik.
zuletzt geändert: 30.05.08 UL
Document Actions
Persönliche Werkzeuge