Das Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB ist eines der größten Institute für angewandte Forschung auf dem Gebiet der Bildgewinnung und Bildauswertung in Europa. Die Abteilung Videoauswertesysteme (VID) beschäftigt sich mit der automatischen Auswertung von Signalen bewegter bildgebender Sensorik in komplexen, ggf. nichtkooperativen Szenarien. Diese Sensorik wird beispielsweise im Aufklärungs- und Überwachungsbereich als integrierte Komponente in fliegenden, weltraumgestützten oder mobilen landgestützten Plattformen verwendet. VID entwickelt und integriert hierfür Bildauswertealgorithmen für autonome oder interaktive Systeme.
Beschreibung
Heutzutage ist das Videomaterial von Überwachungskameras ein wichtiges Instrument zur Untersuchung von Verbrechen und zur Identifizierung von Verdächtigen. Die Analyse der riesigen Datenmengen, die von zahlreichen Kameras gewonnen werden, stellt die polizeilichen Ermittlungsbehörden vor enorme Herausforderungen. Deshalb werden Systeme benötigt, die das Personal dabei unterstützen Übergriffe in Echzeit zu erkennen. Ein erster Schritt zur Erkennung gewaltsamer Aktivitäten ist die 3D-Posenschätzungen von Menschen innerhalb von Menschenmengen.
Aufgabenstellung
Im Rahmen der Bachelorarbeit soll die Literatur zur Echtzeit Multi-Person 3D-Posenschätzung erarbeitet werden. Weiterhin soll auf Basis der Ergebnisse der Recherche, sowie den nachfolgenden Quellen, ein Verfahren erweitert werden, welches eine Multi-Person 3D-Posenschätzung auf FullHD Videodaten in Echtzeit ermöglicht.
Voraussetzungen
- Studienfach: Informatik, Mathematik, Angewandte Physik oder vergleichbar
- Gutes Verständnis für die (theoretischen) Grundlage von Deep Learning
- Gute Programmierkenntnisse (idealerweise Python)
- Erfahrung mit dem Deep Learning Framework Pytorch vorteilhaft.
- Fähigkeit zum selbstständigen Arbeiten
- Bereitschaft, sich in neue Themengebiete einzuarbeiten und Freude am Einbringen eigener Ideen
Bei Interesse senden Sie uns bitte ihre Bewerbungsunterlagen (kurzes Anschreiben, tabellarischer Lebenslauf, Notenauszug) in elektronischer Form.
Literatur
[1] Mehta, Dushyant, et al. "Xnect: Real-time multi-person 3d human pose estimation with a single rgb camera." arXiv preprint arXiv:1907.00837 (2019). https://arxiv.org/pdf/1907.00837.pdf
[2] Zhao, Long, et al. "Semantic graph convolutional networks for 3D human pose regression." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019. https://arxiv.org/pdf/1904.03345.pdf