TU Darmstadt / ULB / TUbiblio

Computer Vision for Distant Vehicle Detection: How to Find Region Proposals for Low-Resolution Objects?

Fattal, Ann-Katrin (2020)
Computer Vision for Distant Vehicle Detection: How to Find Region Proposals for Low-Resolution Objects?
Technische Universität Darmstadt
doi: 10.25534/tuprints-00011310
Dissertation, Erstveröffentlichung

Kurzbeschreibung (Abstract)

Safety is crucial to the development and acceptance of assisted and highly automated driving functions. In 2017, 69.3% of German fatal accidents happened on roads where the speed limit was not enforced or higher than 100km/h. At this speed, to perform safe driving maneuvers, the environment perception is a key element. Detecting objects in distances up to 200m is instrumental in anticipating potential obstacles. Due to hardware limitations, an automotive camera maps cars in e.g. 200m distance to an image of only 8px width. Hence, the absence of local details degrades the state-of-the-art detection methods designed for detecting bigger sized objects. The scope of this thesis is to develop, extend and evaluate object region localizers to improve the detection range of cameras. A saliency inspired voting map is proposed that highlights anomalies in automotive scenes. The environment is modeled with few homogeneous regions representing the background within the image. Such global features allow detecting small object regions. Inspired by the concept of learning features, this thesis presents machine learning methods detecting small objects. Existing labeled data sets such as the KITTI data set only have object regions which sizes are larger than 25px height. The presented methods in this thesis are performed against a newly created data set with 67% of object regions having a width of 8-30px, a range that has rarely been subject to research yet. Convolutional Neural Network based localizers have been evaluated and extended. To maintain a low computational power, only small networks can be used. However, such networks are limited to the usage of local features. An incorporation of global generic priors to local networks is proposed, which increases the recall especially for small object regions. The parameters to adjust Region Proposal Networks (RPNs) for the special case of small objects are further optimized and the main parameters are identified. A novel relevance based net-surgery is introduced, allowing to select the most relevant features while maintaining the recall of the RPN. It is then possible to reduce the network size to these few features.

Typ des Eintrags: Dissertation
Erschienen: 2020
Autor(en): Fattal, Ann-Katrin
Art des Eintrags: Erstveröffentlichung
Titel: Computer Vision for Distant Vehicle Detection: How to Find Region Proposals for Low-Resolution Objects?
Sprache: Englisch
Referenten: Adamy, Prof. Dr. Jürgen ; Hohmann, Prof. Dr. Sören
Publikationsjahr: 6 Januar 2020
Ort: Darmstadt
Datum der mündlichen Prüfung: 30 Oktober 2019
DOI: 10.25534/tuprints-00011310
URL / URN: https://tuprints.ulb.tu-darmstadt.de/11310
Kurzbeschreibung (Abstract):

Safety is crucial to the development and acceptance of assisted and highly automated driving functions. In 2017, 69.3% of German fatal accidents happened on roads where the speed limit was not enforced or higher than 100km/h. At this speed, to perform safe driving maneuvers, the environment perception is a key element. Detecting objects in distances up to 200m is instrumental in anticipating potential obstacles. Due to hardware limitations, an automotive camera maps cars in e.g. 200m distance to an image of only 8px width. Hence, the absence of local details degrades the state-of-the-art detection methods designed for detecting bigger sized objects. The scope of this thesis is to develop, extend and evaluate object region localizers to improve the detection range of cameras. A saliency inspired voting map is proposed that highlights anomalies in automotive scenes. The environment is modeled with few homogeneous regions representing the background within the image. Such global features allow detecting small object regions. Inspired by the concept of learning features, this thesis presents machine learning methods detecting small objects. Existing labeled data sets such as the KITTI data set only have object regions which sizes are larger than 25px height. The presented methods in this thesis are performed against a newly created data set with 67% of object regions having a width of 8-30px, a range that has rarely been subject to research yet. Convolutional Neural Network based localizers have been evaluated and extended. To maintain a low computational power, only small networks can be used. However, such networks are limited to the usage of local features. An incorporation of global generic priors to local networks is proposed, which increases the recall especially for small object regions. The parameters to adjust Region Proposal Networks (RPNs) for the special case of small objects are further optimized and the main parameters are identified. A novel relevance based net-surgery is introduced, allowing to select the most relevant features while maintaining the recall of the RPN. It is then possible to reduce the network size to these few features.

Alternatives oder übersetztes Abstract:
Alternatives AbstractSprache

Sicherheit ist ein wichtiger Aspekt in der Entwicklung und Akzeptanz von assistierten und hoch automatisierten Fahrfunktionen. Im Jahr 2017 geschahen 69.3% aller tödlichen Unfälle in Deutschland auf Landstraßen oder Autobahnen mit hohen Geschwindigkeiten über 100Km/h. Bei solchen Geschwindigkeiten ist eine robuste Umfelderfassung zu sicheren Fahrmanövern notwendig. Um in solchen Situationen sicher zu fahren, muss eine robuste Objekt Detektion bis 200m Entfernung gewährleistet sein. Aufgrund von limitierter Hardware kann eine automotive Kamera ein Auto in z.B. 200m Entfernung nur auf ca. 8 px abbilden. Dadurch sind lokale Details nicht abgebildet und aktuelle Objekt Detektionen verlieren stark an Performanz, da sie für größere Objekte ausgelegt sind. In dieser Thesis werden Methoden zur Objektregionen Lokalisierung in Bildern entwickelt, erweitert und ausgewertet um die Detektionsrate in der Entfernung zu erhöhen. Dazu wird ein von Aufmerksamkeitskarten inspirierter Ansatz entwickelt, der Besonderheiten in automotiven Szenen hervorhebt. Der Hintergrund im Bild wird dabei durch wenige homogene Bereiche modelliert. Solche globalen Ansätze erlauben die Detektion für kleine Objekte. Aktuelle Datensätze, wie bspw. der KITTI Datensatz, beinhalten minimal Objekte der Höhe 25px. Zur Evaluation der hier entwickelten Methoden wurde ein anspruchsvoller Datensatz generiert, in dem 67% der Objekte 8-30px breit sind. Dies zeigt, dass dieser Bereich von kleinen Objekten noch nicht Gegenstand aktueller Forschung ist. Faltende Netzwerke, welche die Merkmal Extraktion durch Parameteroptimierung lernen, eignen sich ebenfalls zur Lokalisierung von Objektregionen in Bildern (RPNs). Um jedoch den Rechenaufwand für automotive Anwendungen gering zu halten, eigenen sich vergleichbar kleine und dadurch lokal beschränkte Netzwerke. Daher wird die Einarbeitung von ausgewählten globalen Priors vorgeschlagen und Untersuchungen zeigen eine Verbesserung des Recalls für RPNs. In einer Parameteranalyse für faltende Lokalisierungsmethoden wird der Recall weiter optimiert und die wichtigsten Parameter identifiziert. Zur weiteren Optimierung von Merkmalen innerhalb des Netzwerks, wird eine neuartige Relevanz basierte Netzwerk-Operations-Methode entwickelt, die es ermöglicht, die markantesten Merkmale des Netzwerks zu identifizieren und das Netzwerk auf diese Merkmale zu verkleinern bei nahezu gleichbleibendem Recall.

Deutsch
URN: urn:nbn:de:tuda-tuprints-113100
Sachgruppe der Dewey Dezimalklassifikatin (DDC): 000 Allgemeines, Informatik, Informationswissenschaft > 000 Allgemeines, Wissenschaft
600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften und Maschinenbau
Fachbereich(e)/-gebiet(e): 18 Fachbereich Elektrotechnik und Informationstechnik
18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Automatisierungstechnik und Mechatronik
18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Automatisierungstechnik und Mechatronik > Regelungsmethoden und Robotik (ab 01.08.2022 umbenannt in Regelungsmethoden und Intelligente Systeme)
Hinterlegungsdatum: 26 Jan 2020 20:55
Letzte Änderung: 26 Jan 2020 20:56
PPN:
Referenten: Adamy, Prof. Dr. Jürgen ; Hohmann, Prof. Dr. Sören
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: 30 Oktober 2019
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen