Braun, Tim (2003)
Automatische Lokalisierung von Gesichtern in digitalen Videoströmen.
Technische Universität Darmstadt
Diplom- oder Magisterarbeit, Bibliographie
Kurzbeschreibung (Abstract)
In der vorliegenden Diplomarbeit wurde ein Verfahren entwickelt, das annähernd frontal abgebildete Gesichter in digital aufgezeichneten, farbigen Videodaten lokalisiert. Die gelieferten Informationen über die Position und Größe der vorkommenden Gesichter können zur Klassifikation der Aufzeichnung in verschiedene Genres verwendet werden oder als Grundlage für weitere Verarbeitungsschritte dienen, wie zum Beispiel dem Erkennen der gezeigten Personen mittels biometrischer Verfahren. Das als Eingabe verwendete Videomaterial unterliegt keinerlei Einschränkungen bezüglich Aufnahmebedingungen oder -umgebung. Daher wurde die Entwicklung eines besonders robusten Lokalisationsverfahrens angestrebt, das mit der zu erwartenden hohen Variabilität der Eingabedaten gut umgehen kann. Die anfallende große Datenmenge bei Videos führt zusätzlich zur Forderung einer möglichst kurzen Laufzeit des Verfahrens. Um beide Ziele zu erreichen, wird als Basis zum Erkennen von Gesichtsmustern das als sehr robust angesehene Mustererkennungsverfahren der Support Vector Machine (SVM) verwendet. Die inakzeptable Geschwindigkeit der normalen SVM bei der Bildanalyse wird durch Einsatz einer schnell auswertbaren angenäherten SVM und einer iterativen Verbesserungsstrategie der Näherung stark erhöht, ohne auffällige Auswirkungen auf die Genauigkeit der Gesichtslokalisation zu haben. Eine weitere Beschleunigung des Verfahrens wird durch Analyse der Farbinformation des Videos erzielt; die ebenfalls enthaltenen Bewegungsinformation wird zum Ausschluss von Fehldetektionen und damit zur Erhöhung der Erkennungsgenauigkeit verwendet. Durch die Kombination eines robusten Basisverfahrens mit Komponenten zur Geschwindigkeitssteigerung konnte ein Gesichtslokalisationsverfahren entwickelt werden, das Gesichter in einem weiten Bereich von unterschiedlichen (Frontal-)Posen, Beleuchtungen, Farbverfälschungen und Qualitätsschwankungen finden kann, und dabei dennoch eine Bearbeitungsgeschwindigkeit von mehreren Videoframes pro Sekunde aufweist.
Typ des Eintrags: | Diplom- oder Magisterarbeit |
---|---|
Erschienen: | 2003 |
Autor(en): | Braun, Tim |
Art des Eintrags: | Bibliographie |
Titel: | Automatische Lokalisierung von Gesichtern in digitalen Videoströmen |
Sprache: | Deutsch |
Publikationsjahr: | 2003 |
Kurzbeschreibung (Abstract): | In der vorliegenden Diplomarbeit wurde ein Verfahren entwickelt, das annähernd frontal abgebildete Gesichter in digital aufgezeichneten, farbigen Videodaten lokalisiert. Die gelieferten Informationen über die Position und Größe der vorkommenden Gesichter können zur Klassifikation der Aufzeichnung in verschiedene Genres verwendet werden oder als Grundlage für weitere Verarbeitungsschritte dienen, wie zum Beispiel dem Erkennen der gezeigten Personen mittels biometrischer Verfahren. Das als Eingabe verwendete Videomaterial unterliegt keinerlei Einschränkungen bezüglich Aufnahmebedingungen oder -umgebung. Daher wurde die Entwicklung eines besonders robusten Lokalisationsverfahrens angestrebt, das mit der zu erwartenden hohen Variabilität der Eingabedaten gut umgehen kann. Die anfallende große Datenmenge bei Videos führt zusätzlich zur Forderung einer möglichst kurzen Laufzeit des Verfahrens. Um beide Ziele zu erreichen, wird als Basis zum Erkennen von Gesichtsmustern das als sehr robust angesehene Mustererkennungsverfahren der Support Vector Machine (SVM) verwendet. Die inakzeptable Geschwindigkeit der normalen SVM bei der Bildanalyse wird durch Einsatz einer schnell auswertbaren angenäherten SVM und einer iterativen Verbesserungsstrategie der Näherung stark erhöht, ohne auffällige Auswirkungen auf die Genauigkeit der Gesichtslokalisation zu haben. Eine weitere Beschleunigung des Verfahrens wird durch Analyse der Farbinformation des Videos erzielt; die ebenfalls enthaltenen Bewegungsinformation wird zum Ausschluss von Fehldetektionen und damit zur Erhöhung der Erkennungsgenauigkeit verwendet. Durch die Kombination eines robusten Basisverfahrens mit Komponenten zur Geschwindigkeitssteigerung konnte ein Gesichtslokalisationsverfahren entwickelt werden, das Gesichter in einem weiten Bereich von unterschiedlichen (Frontal-)Posen, Beleuchtungen, Farbverfälschungen und Qualitätsschwankungen finden kann, und dabei dennoch eine Bearbeitungsgeschwindigkeit von mehreren Videoframes pro Sekunde aufweist. |
Freie Schlagworte: | Content based image retrieval, Face detection, Content based video retrieval |
Zusätzliche Informationen: | 105 S. |
Fachbereich(e)/-gebiet(e): | 20 Fachbereich Informatik 20 Fachbereich Informatik > Graphisch-Interaktive Systeme |
Hinterlegungsdatum: | 16 Apr 2018 09:04 |
Letzte Änderung: | 18 Dez 2019 08:16 |
PPN: | |
Export: | |
Suche nach Titel in: | TUfind oder in Google |
Frage zum Eintrag |
Optionen (nur für Redakteure)
Redaktionelle Details anzeigen |