TU Darmstadt / ULB / TUbiblio

Visuell-Interaktive Exploration von Text Clustering Ergebnissen

Staab, Michael Markus (2016):
Visuell-Interaktive Exploration von Text Clustering Ergebnissen.
Darmstadt, TU, Master Thesis, 2016, [Master Thesis]

Abstract

Digital vorliegende Texte gewinnen immer mehr an Bedeutung und sind gleichzeitig in ihrer Vielzahl und Komplexität für einen Leser nur schwer zu durchschauen. Clustering-Verfahren können hier hilfreich sein: Sie unterstützen den Anwender dabei, Text auf Basis des enthaltenen Inhalts zu gruppieren. Allerdings bestehen dabei viele Abhängigkeiten, die zu potenziell sehr diversen Ergebnissen führen, wobei es immer vom konkreten Einzelfall abhängt, welches Ergebnis als "das beste" anzusehen ist. Deswegen ist es sowohl sinnvoll, mehrere Clusterings mit unterschiedlichen Parametern durchzuführen und zu vergleichen, als auch, den Benutzer aktiv in den Analyseprozess miteinzubeziehen. Ziel dieser Arbeit war es, ein Textclustering-System zu entwickeln, das in der Lage ist, Clusterings mit direkter Interaktion des Benutzers zu erstellen, zu analysieren und zu vergleichen. Hierfür wurde sowohl eine neuartige Version der Featureselektion implementiert als auch sehr viel Wert auf die Visualisierung der einzelnen Prozessabläufe gelegt. Eine anschließende Auswertung kam zu dem Ergebnis, dass die Featureselektion gut funktioniert und die Nützlichkeit des Systems gegeben ist. Für die Zukunft bietet es sich an, die Verfahren im System noch zu erweitern und dem Benutzer die Möglichkeit zu geben, selbst weitere Qualitätsmetriken und Verfahren einzupflegen.

Item Type: Master Thesis
Erschienen: 2016
Creators: Staab, Michael Markus
Title: Visuell-Interaktive Exploration von Text Clustering Ergebnissen
Language: German
Abstract:

Digital vorliegende Texte gewinnen immer mehr an Bedeutung und sind gleichzeitig in ihrer Vielzahl und Komplexität für einen Leser nur schwer zu durchschauen. Clustering-Verfahren können hier hilfreich sein: Sie unterstützen den Anwender dabei, Text auf Basis des enthaltenen Inhalts zu gruppieren. Allerdings bestehen dabei viele Abhängigkeiten, die zu potenziell sehr diversen Ergebnissen führen, wobei es immer vom konkreten Einzelfall abhängt, welches Ergebnis als "das beste" anzusehen ist. Deswegen ist es sowohl sinnvoll, mehrere Clusterings mit unterschiedlichen Parametern durchzuführen und zu vergleichen, als auch, den Benutzer aktiv in den Analyseprozess miteinzubeziehen. Ziel dieser Arbeit war es, ein Textclustering-System zu entwickeln, das in der Lage ist, Clusterings mit direkter Interaktion des Benutzers zu erstellen, zu analysieren und zu vergleichen. Hierfür wurde sowohl eine neuartige Version der Featureselektion implementiert als auch sehr viel Wert auf die Visualisierung der einzelnen Prozessabläufe gelegt. Eine anschließende Auswertung kam zu dem Ergebnis, dass die Featureselektion gut funktioniert und die Nützlichkeit des Systems gegeben ist. Für die Zukunft bietet es sich an, die Verfahren im System noch zu erweitern und dem Benutzer die Möglichkeit zu geben, selbst weitere Qualitätsmetriken und Verfahren einzupflegen.

Uncontrolled Keywords: Guiding Theme: Digitized Work, Guiding Theme: Smart City, Research Area: Human computer interaction (HCI), Visual analytics, Information visualization, Cluster analysis, Text analysis, Text mining
Divisions: 20 Department of Computer Science
20 Department of Computer Science > Mathematical and Applied Visual Computing
Date Deposited: 07 May 2019 12:57
Additional Information:

62 S.

Export:
Suche nach Titel in: TUfind oder in Google

Optionen (nur für Redakteure)

View Item View Item