Luu, Thu Huong (2016)
Adaptives und hybrides SLAM für handgeführte RGBD-Kameras.
Technische Universität Darmstadt
Masterarbeit, Bibliographie
Kurzbeschreibung (Abstract)
Mit der steigenden Beliebtheit von RGBD-Sensoren wurde viel Forschung im Bereich der Aufnahme und Rekonstruktion von dreidimensionalen Umgebungen mit Hilfe von solchen Sensoren betrieben. Für die Konstruktion muss das sogenannte Simultaneous Localization and Mapping (SLAM)-Problem gelöst werden. Die meisten RGBD-SLAM-Systeme verwenden hierbei den punktbasierten Iterative Closest Point (ICP)-Algorithmus. Auch wenn ICP ein gut untersuchter Algorithmus ist, so stößt er bei verrauschten Daten und besonders bei texturarmen Bereichen mit wenigen geometrischen Merkmalen, wie z.B. großen leeren Flächen, auf Probleme. Eine Option, diese Limitierung anzugehen, ist das zusätzliche Ausnutzen von Ebenen in der Szene, besonders da sie die häufigste Form in von Menschen erbauten Innenräumen und Außenanlagen sind. Taguchi et al. TJRF13 veröffentlichte 2013 die erste globale Registrierungsmethode, in welcher Punkt-zu-Punkt- und Ebene-zu-Ebene-Korrespondenzen zu einem echtzeitfähigen SLAM-System vereint werden. Kurz darauf folgte die Publikation von Ataer-Cansizoglu et al. ACTRG13, welche zusätzlich ein Bewegungsvorhersage-Modell ausnutzt, um Korrespondenzen zu bestimmen. Ein Nachteil dieser Verfahren ist die hohe Verarbeitungszeit eines Registrierungsschrittes. Dieser bewirkt, dass die Verfahren nicht in der Lage sind, interaktive Rekonstruktionen durchzuführen. Das Ziel dieser Arbeit ist die Implementierung eines SLAM-Algorithmus für handgeführte RGBDKameras, der sowohl Punkte, als auch Flächen zur Registrierung nutzt. Im Gegensatz zu bestehenden Verfahren wird in dieser Arbeit ein lokaler Registrierungsalgorithmus umgesetzt. Flächenmerkmale werden bevorzugt verwendet, da ihre Anzahl in Szenen signifikant geringer ist als die von Punkten. Das ermöglicht eine schnellere Korrespondenzsuche und Registrierung. Dem zugrundeliegenden RANSACbasierten Algorithmus reicht bereits eine minimale Anzahl an Korrespondenzen aus, um die Sensorpose zu bestimmen. Somit ist der Algorithmus in der Lage, die Registrierung auch in texturarmen Bereichen mit wenigen geometrischen Merkmalen durchzuführen, in denen Techniken, welche nur Punkte benutzen, scheitern. Des Weiteren ermöglicht der lokale Registrierungsansatz eine interaktive Nutzung, um dem Nutzer in Echtzeit Rückmeldung über den Registrierungsprozess zu geben. Zusätzlich implementierte Erweiterungen, welche die detektierten Flächeninformationen zur Geometriekorrektur ausnutzen, unterstützen den Registrierungsvorgang. Durchgeführte Experimente demonstrieren eine interaktive Rekonstruktion von Innenräumen mit einer handgeführten RGBD-Kamera, einer Kinect. Zudem weist das System im Gegensatz zu vergleichbaren hybriden Systemen eine sechsfach höhere Rekonstruktionsrate auf. Bei der Gegenüberstellung anhand eines Benchmark-Datensatzes für RGBD-Sensoren konnte des Weiteren in texturarmen Umgebungen eine Überlegenheit gegenüber punktbasierten Verfahren nachgewiesen werden. A rising popularity of RGBD sensors caused an increase of research in recording and reconstruction of three-dimensional scenes with such sensors. For reconstruction the so called Simultaneous Localization and Mapping (SLAM) problem needs to be solved. Most RGBD SLAM systems use the point-based Iterative Closest Point (ICP) algorithm. Although the algorithm is well-studied it has problems with noisy data and low-texture areas with few geometric variations, e.g. large and empty surfaces. To address this limitation one option is to additionally exploit planes from surroundings, especially since planar geometry is the most common shape in man-made indoor and outdoor scenes. Taguchi et al. TJRF13 published the first global registration method combining point-to-point and plane-to-plane correspondences in a real-time SLAM system in 2013. Shortly afterwards Ataer et al. ACTRG13 extended their approach including a motion prediction model to detect correspondences. A major disadvantage of these methods is the high processing time for a registration step. Thus, the methods are not capable to perform interactive reconstructions. The objective of this thesis is to implement a SLAM algorithm for a hand-held RGBD camera that uses points and planes for registration. In contrast to existing hybrid approaches this thesis pursues the idea of an local registration algorithm. As the number of plane features is significantly smaller than the number of point features in 3D scenes, the algorithm prefers a higher number of planes in calculations. This enables faster correspondence search and registration. A minimal set of correspondences suffices to estimate the sensor pose with the underlying RANSAC based algorithm. This enables the SLAM-algorithm to register featureless regions and environments with few geometric variations where ICP-based approaches would fail. Furthermore the local registration approach enables an interactive use of the system to provide real-time feedback to the user. The registration process is supported by implemented extensions using the detected plane segments to correct geometry. Experiments demonstrate interactive reconstruction of indoor scenes in real-time using a hand-held Kinect. Registration is six times faster than comparable hybrid systems. In addition an improvement over point-based algorithms in textureless regions could be proven using a benchmark for RGBD cameras.
Typ des Eintrags: | Masterarbeit |
---|---|
Erschienen: | 2016 |
Autor(en): | Luu, Thu Huong |
Art des Eintrags: | Bibliographie |
Titel: | Adaptives und hybrides SLAM für handgeführte RGBD-Kameras |
Sprache: | Deutsch |
Publikationsjahr: | 2016 |
Kurzbeschreibung (Abstract): | Mit der steigenden Beliebtheit von RGBD-Sensoren wurde viel Forschung im Bereich der Aufnahme und Rekonstruktion von dreidimensionalen Umgebungen mit Hilfe von solchen Sensoren betrieben. Für die Konstruktion muss das sogenannte Simultaneous Localization and Mapping (SLAM)-Problem gelöst werden. Die meisten RGBD-SLAM-Systeme verwenden hierbei den punktbasierten Iterative Closest Point (ICP)-Algorithmus. Auch wenn ICP ein gut untersuchter Algorithmus ist, so stößt er bei verrauschten Daten und besonders bei texturarmen Bereichen mit wenigen geometrischen Merkmalen, wie z.B. großen leeren Flächen, auf Probleme. Eine Option, diese Limitierung anzugehen, ist das zusätzliche Ausnutzen von Ebenen in der Szene, besonders da sie die häufigste Form in von Menschen erbauten Innenräumen und Außenanlagen sind. Taguchi et al. TJRF13 veröffentlichte 2013 die erste globale Registrierungsmethode, in welcher Punkt-zu-Punkt- und Ebene-zu-Ebene-Korrespondenzen zu einem echtzeitfähigen SLAM-System vereint werden. Kurz darauf folgte die Publikation von Ataer-Cansizoglu et al. ACTRG13, welche zusätzlich ein Bewegungsvorhersage-Modell ausnutzt, um Korrespondenzen zu bestimmen. Ein Nachteil dieser Verfahren ist die hohe Verarbeitungszeit eines Registrierungsschrittes. Dieser bewirkt, dass die Verfahren nicht in der Lage sind, interaktive Rekonstruktionen durchzuführen. Das Ziel dieser Arbeit ist die Implementierung eines SLAM-Algorithmus für handgeführte RGBDKameras, der sowohl Punkte, als auch Flächen zur Registrierung nutzt. Im Gegensatz zu bestehenden Verfahren wird in dieser Arbeit ein lokaler Registrierungsalgorithmus umgesetzt. Flächenmerkmale werden bevorzugt verwendet, da ihre Anzahl in Szenen signifikant geringer ist als die von Punkten. Das ermöglicht eine schnellere Korrespondenzsuche und Registrierung. Dem zugrundeliegenden RANSACbasierten Algorithmus reicht bereits eine minimale Anzahl an Korrespondenzen aus, um die Sensorpose zu bestimmen. Somit ist der Algorithmus in der Lage, die Registrierung auch in texturarmen Bereichen mit wenigen geometrischen Merkmalen durchzuführen, in denen Techniken, welche nur Punkte benutzen, scheitern. Des Weiteren ermöglicht der lokale Registrierungsansatz eine interaktive Nutzung, um dem Nutzer in Echtzeit Rückmeldung über den Registrierungsprozess zu geben. Zusätzlich implementierte Erweiterungen, welche die detektierten Flächeninformationen zur Geometriekorrektur ausnutzen, unterstützen den Registrierungsvorgang. Durchgeführte Experimente demonstrieren eine interaktive Rekonstruktion von Innenräumen mit einer handgeführten RGBD-Kamera, einer Kinect. Zudem weist das System im Gegensatz zu vergleichbaren hybriden Systemen eine sechsfach höhere Rekonstruktionsrate auf. Bei der Gegenüberstellung anhand eines Benchmark-Datensatzes für RGBD-Sensoren konnte des Weiteren in texturarmen Umgebungen eine Überlegenheit gegenüber punktbasierten Verfahren nachgewiesen werden. A rising popularity of RGBD sensors caused an increase of research in recording and reconstruction of three-dimensional scenes with such sensors. For reconstruction the so called Simultaneous Localization and Mapping (SLAM) problem needs to be solved. Most RGBD SLAM systems use the point-based Iterative Closest Point (ICP) algorithm. Although the algorithm is well-studied it has problems with noisy data and low-texture areas with few geometric variations, e.g. large and empty surfaces. To address this limitation one option is to additionally exploit planes from surroundings, especially since planar geometry is the most common shape in man-made indoor and outdoor scenes. Taguchi et al. TJRF13 published the first global registration method combining point-to-point and plane-to-plane correspondences in a real-time SLAM system in 2013. Shortly afterwards Ataer et al. ACTRG13 extended their approach including a motion prediction model to detect correspondences. A major disadvantage of these methods is the high processing time for a registration step. Thus, the methods are not capable to perform interactive reconstructions. The objective of this thesis is to implement a SLAM algorithm for a hand-held RGBD camera that uses points and planes for registration. In contrast to existing hybrid approaches this thesis pursues the idea of an local registration algorithm. As the number of plane features is significantly smaller than the number of point features in 3D scenes, the algorithm prefers a higher number of planes in calculations. This enables faster correspondence search and registration. A minimal set of correspondences suffices to estimate the sensor pose with the underlying RANSAC based algorithm. This enables the SLAM-algorithm to register featureless regions and environments with few geometric variations where ICP-based approaches would fail. Furthermore the local registration approach enables an interactive use of the system to provide real-time feedback to the user. The registration process is supported by implemented extensions using the detected plane segments to correct geometry. Experiments demonstrate interactive reconstruction of indoor scenes in real-time using a hand-held Kinect. Registration is six times faster than comparable hybrid systems. In addition an improvement over point-based algorithms in textureless regions could be proven using a benchmark for RGBD cameras. |
Freie Schlagworte: | Guiding Theme: Digitized Work, Guiding Theme: Visual Computing as a Service, Research Area: Computer vision (CV), Research Area: Human computer interaction (HCI), 3D cameras, 3D Reconstruction, Feature extraction, Hybrid tracking systems, Realtime interaction |
Zusätzliche Informationen: | 92 S. |
Fachbereich(e)/-gebiet(e): | 20 Fachbereich Informatik 20 Fachbereich Informatik > Mathematisches und angewandtes Visual Computing |
Hinterlegungsdatum: | 07 Mai 2019 13:23 |
Letzte Änderung: | 07 Mai 2019 13:23 |
PPN: | |
Export: | |
Suche nach Titel in: | TUfind oder in Google |
Frage zum Eintrag |
Optionen (nur für Redakteure)
Redaktionelle Details anzeigen |