Projektbeschreibung
Problemstellung
Die stetig wachsende Menge an verfügbaren Bild- und Videodaten öffentlicher Räume bietet neue Möglichkeiten in den Bereichen der öffentlichen Sicherheit und der Strafverfolgung. Eine manuelle Sichtung gestaltet sich dabei aufgrund der großen Menge an anfallenden Daten schwierig.
Eine automatisierte Personenwiedererkennung kann die Auswertung und Navigation im Datenmaterial stark beschleunigen und erleichtern. Typischerweise versuchen Verfahren der Wiedererkennung anhand von zwei Personenbildern zu entscheiden, ob es sich um dieselbe oder um unterschiedliche Personen handelt. Hierdurch kann nicht nur eine Suche nach Personen in großen Datenmengen realisiert werden, sondern beispielsweise auch die schritthaltende Verfolgung von Personen innerhalb eines Kameranetzwerks.
Personen und beispielhafte semantische Attributbeschreibungen. Bildquelle: Wang, X. et al.: Pedestrian Attribute Recognition: A Survey, 2019
Allerdings sind solche Verfahren nur einsatzfähig, wenn entsprechendes Bildmaterial der gesuchten Person vorliegt. In der Praxis stehen hingegen häufig nur Zeugenbeschreibungen einer Person zur Verfügung. Aus diesem Grund beschäftigt sich die attributbasierte Personenwiedererkennung mit der Personensuche anhand von semantischen Beschreibungen der Personenattribute, wie z. B. der Kleidung oder des Geschlechts.
Ziele
Es werden Deep Learning-Verfahren entwickelt, die nur basierend auf einer semantischen Beschreibung von Personen in der Lage sind, diese in einer großen Menge an Videoüberwachungsdaten wiederzuerkennen. Schwierigkeiten, die dabei behandelt werden, sind unter anderem die unterschiedlichen Modalitäten von Anfrage und Bilddaten sowie unterschiedliche Ausprägungen desselben Attributs.
Anfrage anhand einer Attributbeschreibung und die resultierende Ergebnisliste. Bildquelle: Zheng, L. et al.: “Scalable Person Re-Identification: A Benchmark“. In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2015