Plötz, Tobias (2014)
Estimating Appearance Models for Multi-Person Tracking by Energy Minimization.
Technische Universität Darmstadt
Masterarbeit, Bibliographie
Kurzbeschreibung (Abstract)
In multi-target tracking, estimated tracks often erroneously fail to follow only a single target, hence causing identity switches. As a remedy, appearance cues are frequently exploited in order to make correct associations after a target has been temporally occluded or was not detected over several frames. In this thesis, we analyze multiple approaches of how appearance information can be integrated into the discrete-continuous energy minimization framework. To this end, we explicitly estimate appearance models for each trajectory and propose a generative as well as a discriminative energy to couple these appearance models with appearances of associated detections and trajectory frames. We show that both energies can be efficiently optimized with respect to the trajectory appearance model. Additionally, we analyze smoothness terms between appearances of consecutive trajectory frames and between labels of detections that exhibit a similar appearance. We conduct experiments under three aspects. First, we measure the general ability of the appearance energies to detect identity switches. Second, we qualitatively assess how the energy terms affect the overall tracking performance and third, we compare the full tracking system to state-of-the-art approaches on a variety of tracking scenarios. In order to lessen the influence of the optimization on the number of identity switches, we propose - and show its effectiveness - a novel recombination move that approximately minimizes the energy over the set of possible recombinations of short trajectory segments. Our analysis reveals that the benefit of the proposed energies mainly depends on how reliably appearance of a target can be measured. We see good results on scenes with clearly visible targets but observe a decline of performance for densely crowded scenes in which our system fails to estimate representative appearance models. Beim Verfolgen (Tracken) mehrerer Ziele passiert es oft, dass Trajektorien nicht ein einziges Ziel verfolgen und Identitätswechsel verursachen. Das Aussehen wird oft als Hinweis genutzt, um korrekte Zuordnungen machen zu können, nachdem ein Ziel kurzzeitig verdeckt war oder in einigen Bildern nicht detektiert wurde. In dieser Arbeit analysieren wir mehrere Ansätze, wie Informationen über das Aussehen bei der Minimierung einer diskret-kontinuierlichen Energie genutzt werden können. Für jede Trajektorie schätzen wir explizit Aussehensmodelle, die wir über eine generative bzw. diskriminative Energie mit dem Aussehen von zugeordneten Detektionen und Trajektorienbildern verknüpfen. Wir zeigen, dass beide Energien effizient in Bezug auf die Aussehensmodelle minimiert werden können. Eine weitere Energie bestraft ein sich änderndes Aussehen in aufeinanderfolgenden Bildern einer Trajektorie, während es eine vierte Formulierung bevorzugt, wenn Detektionen mit ähnlichem Aussehen demselben Ziel zugeordnet werden. Unsere Experimente untersuchen drei Gesichtspunkte. Erstens messen wir, wie gut mit den Energien Identitätswechsel erkannt werden können. Zweitens evaluieren wir die qualitativen Auswirkungen der Energien auf die Gesamtleistung des Tracking Systems, welches schließlich mit aktuellen Tracking Methoden verglichen wird. Um den Einfluss der Optimierung auf die Anzahl der Identitätswechsel zu reduzieren, schlagen wir einen neuen, effektiven Rekombinationsschritt vor, der annäherungsweise die Energie über der Menge der Kombinationen von kurzen Trajektoriensegmenten minimiert. Unsere Analyse zeigt, dass der Nutzen der vorgeschlagenen Energien wesentlich davon abhängt, wie zuverlässig das Aussehen eines Ziels beschrieben werden kann. Wir erzielen gute Resultate, wenn die Ziele gut sichtbar sind. Jedoch nimmt die Leistung des Tracking Systems in Szenarien mit vielen Menschen ab, da unser System dort nicht in der Lage ist, repräsentative Aussehensmodelle zu schätzen.
Typ des Eintrags: | Masterarbeit |
---|---|
Erschienen: | 2014 |
Autor(en): | Plötz, Tobias |
Art des Eintrags: | Bibliographie |
Titel: | Estimating Appearance Models for Multi-Person Tracking by Energy Minimization |
Sprache: | Englisch |
Publikationsjahr: | 2014 |
Kurzbeschreibung (Abstract): | In multi-target tracking, estimated tracks often erroneously fail to follow only a single target, hence causing identity switches. As a remedy, appearance cues are frequently exploited in order to make correct associations after a target has been temporally occluded or was not detected over several frames. In this thesis, we analyze multiple approaches of how appearance information can be integrated into the discrete-continuous energy minimization framework. To this end, we explicitly estimate appearance models for each trajectory and propose a generative as well as a discriminative energy to couple these appearance models with appearances of associated detections and trajectory frames. We show that both energies can be efficiently optimized with respect to the trajectory appearance model. Additionally, we analyze smoothness terms between appearances of consecutive trajectory frames and between labels of detections that exhibit a similar appearance. We conduct experiments under three aspects. First, we measure the general ability of the appearance energies to detect identity switches. Second, we qualitatively assess how the energy terms affect the overall tracking performance and third, we compare the full tracking system to state-of-the-art approaches on a variety of tracking scenarios. In order to lessen the influence of the optimization on the number of identity switches, we propose - and show its effectiveness - a novel recombination move that approximately minimizes the energy over the set of possible recombinations of short trajectory segments. Our analysis reveals that the benefit of the proposed energies mainly depends on how reliably appearance of a target can be measured. We see good results on scenes with clearly visible targets but observe a decline of performance for densely crowded scenes in which our system fails to estimate representative appearance models. Beim Verfolgen (Tracken) mehrerer Ziele passiert es oft, dass Trajektorien nicht ein einziges Ziel verfolgen und Identitätswechsel verursachen. Das Aussehen wird oft als Hinweis genutzt, um korrekte Zuordnungen machen zu können, nachdem ein Ziel kurzzeitig verdeckt war oder in einigen Bildern nicht detektiert wurde. In dieser Arbeit analysieren wir mehrere Ansätze, wie Informationen über das Aussehen bei der Minimierung einer diskret-kontinuierlichen Energie genutzt werden können. Für jede Trajektorie schätzen wir explizit Aussehensmodelle, die wir über eine generative bzw. diskriminative Energie mit dem Aussehen von zugeordneten Detektionen und Trajektorienbildern verknüpfen. Wir zeigen, dass beide Energien effizient in Bezug auf die Aussehensmodelle minimiert werden können. Eine weitere Energie bestraft ein sich änderndes Aussehen in aufeinanderfolgenden Bildern einer Trajektorie, während es eine vierte Formulierung bevorzugt, wenn Detektionen mit ähnlichem Aussehen demselben Ziel zugeordnet werden. Unsere Experimente untersuchen drei Gesichtspunkte. Erstens messen wir, wie gut mit den Energien Identitätswechsel erkannt werden können. Zweitens evaluieren wir die qualitativen Auswirkungen der Energien auf die Gesamtleistung des Tracking Systems, welches schließlich mit aktuellen Tracking Methoden verglichen wird. Um den Einfluss der Optimierung auf die Anzahl der Identitätswechsel zu reduzieren, schlagen wir einen neuen, effektiven Rekombinationsschritt vor, der annäherungsweise die Energie über der Menge der Kombinationen von kurzen Trajektoriensegmenten minimiert. Unsere Analyse zeigt, dass der Nutzen der vorgeschlagenen Energien wesentlich davon abhängt, wie zuverlässig das Aussehen eines Ziels beschrieben werden kann. Wir erzielen gute Resultate, wenn die Ziele gut sichtbar sind. Jedoch nimmt die Leistung des Tracking Systems in Szenarien mit vielen Menschen ab, da unser System dort nicht in der Lage ist, repräsentative Aussehensmodelle zu schätzen. |
Freie Schlagworte: | Multi-target tracking, People tracking, Appearance estimation, Discrete optimization |
Zusätzliche Informationen: | 81 p. |
Fachbereich(e)/-gebiet(e): | 20 Fachbereich Informatik 20 Fachbereich Informatik > Graphisch-Interaktive Systeme |
Hinterlegungsdatum: | 12 Nov 2018 11:16 |
Letzte Änderung: | 12 Nov 2018 11:16 |
PPN: | |
Export: | |
Suche nach Titel in: | TUfind oder in Google |
Frage zum Eintrag |
Optionen (nur für Redakteure)
Redaktionelle Details anzeigen |