TU Darmstadt / ULB / TUbiblio

Efficient Similarity Search in Large Video Databases

Steinbrecher, Tillmann (2005)
Efficient Similarity Search in Large Video Databases.
Technische Universität Darmstadt
Masterarbeit, Bibliographie

Kurzbeschreibung (Abstract)

Today, the main source of income for most TV stations are paid advertisements. In Germany alone, billions of Euros are spent each year on TV ads. Substantial commercial interest lies in the question how exactly this money is being spent - i.e., which ad clips played on which channel, at which time. TV stations do not disclose this data to the public; therefore it has to be gathered by content-based retrieval, from recorded TV broadcasts. In order to cope with the large amounts of data involved (a single TV station generates about 30GB of MPEG2 data per day), highly efficient methods for video similarity search must be available. In the context of this diploma thesis, a fast video detection system that relies on feature-based frame similarity calculations was developed. The system is robust to temporal/spatial modifications in the source video, as well as missing frames - to the extent that decoding only the I-frames of the analyzed stream will suffice for good detection results. Different image features were compared and evaluated. For speed and scalability improvement, an index-based search that relies on clusters in feature space was implemented. The video detector does not aim for perfect accuracy in the sense that the results are free of false positives. Instead, its purpose is to find candidates for detection as quickly as possible, in order to reduce the search domain for downstream processing stages, which use slower, but more accurate methods. Die Haupteinnahmequelle der meisten Fernsehkanäle sind heutzutage bezahlte Werbeclips. Allein in Deutschland werden jedes Jahr Milliarden Euro für Fernsehwerbung ausgegeben. Beachtliches kommerzielles Interesse liegt in der Frage, wie genau dieses Geld eingesetzt wurd - d.h., welche Werbeclips laufen auf welchen Kanälen, zu welcher Zeit? Die TV-Sender machen diese Daten jedoch nicht öffentlich zugänglich; daher können sie nur durch inhaltsbasierte Erkennung gewonnen werden. Um mit den dabei auftretenden enormen Datenmengen umzugehen (die Aufnahme eines einzelnen Fernsehsenders generiert etwa 30GB MPEG2-Daten pro Tag), müssen effiziente Methoden zur Video-Ähnlichkeitssuche verfügbar sein. Während dieser Diplomarbeit wurde ein schnelles Videosuchsystem entwickelt, das auf Feature-basierten Ähnlichkeitsvergleichen von Einzelbildern fußt. Das System ist robust gegenüber zeitlichen/räumlichen Änderungen im Quellvideo sowie fehlenden Frames - in dem Maße, daß es reicht, lediglich die I-Frames des zu analysierenden Videostroms zu decodieren. Verschiedene Bildfeatures wurden evaluiert und verglichen. Um Geschwindigkeit und Skalierbarkeit zu verbessern, wurde eine Index-basierte Suche, die Cluster im Feature-Raum verwendet, implementiert. Der Videodetektor zielt nicht auf perfekte Genauigkeit in dem Sinne, daß die Ergebnisse frei von falschen Positiven ist. Stattdessen ist das Ziel, möglichst schnell Kandidaten für Videoerkennungen zu finden, um den Suchraum für nachgeschaltete Verarbeitungsstufen - die genauer, aber langsamer sind - einzuschränken.

Typ des Eintrags: Masterarbeit
Erschienen: 2005
Autor(en): Steinbrecher, Tillmann
Art des Eintrags: Bibliographie
Titel: Efficient Similarity Search in Large Video Databases
Sprache: Deutsch
Publikationsjahr: 2005
Kurzbeschreibung (Abstract):

Today, the main source of income for most TV stations are paid advertisements. In Germany alone, billions of Euros are spent each year on TV ads. Substantial commercial interest lies in the question how exactly this money is being spent - i.e., which ad clips played on which channel, at which time. TV stations do not disclose this data to the public; therefore it has to be gathered by content-based retrieval, from recorded TV broadcasts. In order to cope with the large amounts of data involved (a single TV station generates about 30GB of MPEG2 data per day), highly efficient methods for video similarity search must be available. In the context of this diploma thesis, a fast video detection system that relies on feature-based frame similarity calculations was developed. The system is robust to temporal/spatial modifications in the source video, as well as missing frames - to the extent that decoding only the I-frames of the analyzed stream will suffice for good detection results. Different image features were compared and evaluated. For speed and scalability improvement, an index-based search that relies on clusters in feature space was implemented. The video detector does not aim for perfect accuracy in the sense that the results are free of false positives. Instead, its purpose is to find candidates for detection as quickly as possible, in order to reduce the search domain for downstream processing stages, which use slower, but more accurate methods. Die Haupteinnahmequelle der meisten Fernsehkanäle sind heutzutage bezahlte Werbeclips. Allein in Deutschland werden jedes Jahr Milliarden Euro für Fernsehwerbung ausgegeben. Beachtliches kommerzielles Interesse liegt in der Frage, wie genau dieses Geld eingesetzt wurd - d.h., welche Werbeclips laufen auf welchen Kanälen, zu welcher Zeit? Die TV-Sender machen diese Daten jedoch nicht öffentlich zugänglich; daher können sie nur durch inhaltsbasierte Erkennung gewonnen werden. Um mit den dabei auftretenden enormen Datenmengen umzugehen (die Aufnahme eines einzelnen Fernsehsenders generiert etwa 30GB MPEG2-Daten pro Tag), müssen effiziente Methoden zur Video-Ähnlichkeitssuche verfügbar sein. Während dieser Diplomarbeit wurde ein schnelles Videosuchsystem entwickelt, das auf Feature-basierten Ähnlichkeitsvergleichen von Einzelbildern fußt. Das System ist robust gegenüber zeitlichen/räumlichen Änderungen im Quellvideo sowie fehlenden Frames - in dem Maße, daß es reicht, lediglich die I-Frames des zu analysierenden Videostroms zu decodieren. Verschiedene Bildfeatures wurden evaluiert und verglichen. Um Geschwindigkeit und Skalierbarkeit zu verbessern, wurde eine Index-basierte Suche, die Cluster im Feature-Raum verwendet, implementiert. Der Videodetektor zielt nicht auf perfekte Genauigkeit in dem Sinne, daß die Ergebnisse frei von falschen Positiven ist. Stattdessen ist das Ziel, möglichst schnell Kandidaten für Videoerkennungen zu finden, um den Suchraum für nachgeschaltete Verarbeitungsstufen - die genauer, aber langsamer sind - einzuschränken.

Freie Schlagworte: Search process, Video analysis, Feature representation, Clustering
Zusätzliche Informationen:

64 p.

Fachbereich(e)/-gebiet(e): nicht bekannt
20 Fachbereich Informatik
20 Fachbereich Informatik > Graphisch-Interaktive Systeme
Hinterlegungsdatum: 16 Apr 2018 09:04
Letzte Änderung: 16 Apr 2018 09:04
PPN:
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen