TU Darmstadt / ULB / TUbiblio

Guidance zur Exploration von Entitätsgraphen aus Textkollektionen für Datenjournalismus

Müller, Martin (2016):
Guidance zur Exploration von Entitätsgraphen aus Textkollektionen für Datenjournalismus.
TU Darmstadt, [Bachelor Thesis]

Abstract

An der TU Darmstadt wird new/s/leak entwickelt, ein Tool welches Journalisten bei der Recherche in großen Dokumentenmengen( wie z.B. den Panama Papers oder den Cablegate-Dokumenten) unterstützt. Beziehungen zwischen Personen, Organisationen, Orten und anderen Dingen die in der Dokumentenmenge erwähnt sind, werden in einem riesigen Graphen erfasst, der teilweise mehr als 100 Millionen Kanten enthält. Der Graph enthält für Journalisten interessante Informationen, die Suche nach diesen Informationen im Graph gleicht jedoch der sprichwörtlichen Suche nach der Nadel im Heuhaufen. Die Visualisierung eines solch riesigen Graphen ist zudem äußerst schwierig. Zur Lösung dieser Probleme eignet sich - wie in der Arbeit gezeigt wird - Guidance. Ein Graph-Guidance-System berechnet für einen gegeben Fokusknoten einen lokalen Teilgraph, der nur einen kleinen Teilausschnitt mit interessanten Verbindungen des kompletten Graphen zeigt. Dieser Teilgraph ist übersichtlich und gut erfassbar. Benutzer können innerhalb des Teilgraphen einen neuen Fokus setzten, was wiederum zu einem neuen, veränderten Teilgraph führt. So kann der große Graph exploriert werden. In dieser Arbeit wurde ein in new/s/leak integriertes Graph-Guidance-System entwickelt welches Journalisten bei der Recherche in großen Dokumentenmengen unterstützt. Zunächst wurden Anforderungen an die Graph-Guidance formuliert und bestehende Graph-Guidance-Systeme analysiert. Da keiner der bestehenden Ansätze ad-hoc die Anforderungen erfüllt, wurde ein neues Graph-Guidance-System entwickelt. Dieses baut vor allem auf den Arbeiten von van Ham und Perer 18 sowie von Kochtchi et al. 12 auf. Die entwickelte Guidance berücksichtigt die verschiedenen Typen, die Knoten besitzen können und ermöglicht Journalisten diese zu gewichten, zudem können Guidance-Schritte auch rückgängig gemacht werden und wiederholt werden. Dies erleichert Journalisten die Arbeit mit dem Graph. Die Journalisten werden des Weiteren bei ihrer Entscheidungsfindung durch Detailformationen zu Knoten unterstützt. Es gibt auch eine sinnvolle Verknüpfung der Netzwerkebene mit der Dokumentenebene. Journalisten können problemlos zu einzelnen Dokumenten gelangen, die mit einem Knoten bzw. einer Kante assoziiert sind. Die Guidance arbeitet mit anderen new/s/leak-Komponenten zusammen. Das Guidance-System ermöglicht Journalisten dank der integrierten Features eine flexible Recherche in der Dokumentenmenge, die Benutzeroberfläche ist dennoch intuitiv und überfordert den Benutzer nicht. Die entwickelte Guidance wurde mit Hilfe von Fallstudien und einer Hands-on Session mit Journalisten evaluiert.

Item Type: Bachelor Thesis
Erschienen: 2016
Creators: Müller, Martin
Title: Guidance zur Exploration von Entitätsgraphen aus Textkollektionen für Datenjournalismus
Language: German
Abstract:

An der TU Darmstadt wird new/s/leak entwickelt, ein Tool welches Journalisten bei der Recherche in großen Dokumentenmengen( wie z.B. den Panama Papers oder den Cablegate-Dokumenten) unterstützt. Beziehungen zwischen Personen, Organisationen, Orten und anderen Dingen die in der Dokumentenmenge erwähnt sind, werden in einem riesigen Graphen erfasst, der teilweise mehr als 100 Millionen Kanten enthält. Der Graph enthält für Journalisten interessante Informationen, die Suche nach diesen Informationen im Graph gleicht jedoch der sprichwörtlichen Suche nach der Nadel im Heuhaufen. Die Visualisierung eines solch riesigen Graphen ist zudem äußerst schwierig. Zur Lösung dieser Probleme eignet sich - wie in der Arbeit gezeigt wird - Guidance. Ein Graph-Guidance-System berechnet für einen gegeben Fokusknoten einen lokalen Teilgraph, der nur einen kleinen Teilausschnitt mit interessanten Verbindungen des kompletten Graphen zeigt. Dieser Teilgraph ist übersichtlich und gut erfassbar. Benutzer können innerhalb des Teilgraphen einen neuen Fokus setzten, was wiederum zu einem neuen, veränderten Teilgraph führt. So kann der große Graph exploriert werden. In dieser Arbeit wurde ein in new/s/leak integriertes Graph-Guidance-System entwickelt welches Journalisten bei der Recherche in großen Dokumentenmengen unterstützt. Zunächst wurden Anforderungen an die Graph-Guidance formuliert und bestehende Graph-Guidance-Systeme analysiert. Da keiner der bestehenden Ansätze ad-hoc die Anforderungen erfüllt, wurde ein neues Graph-Guidance-System entwickelt. Dieses baut vor allem auf den Arbeiten von van Ham und Perer 18 sowie von Kochtchi et al. 12 auf. Die entwickelte Guidance berücksichtigt die verschiedenen Typen, die Knoten besitzen können und ermöglicht Journalisten diese zu gewichten, zudem können Guidance-Schritte auch rückgängig gemacht werden und wiederholt werden. Dies erleichert Journalisten die Arbeit mit dem Graph. Die Journalisten werden des Weiteren bei ihrer Entscheidungsfindung durch Detailformationen zu Knoten unterstützt. Es gibt auch eine sinnvolle Verknüpfung der Netzwerkebene mit der Dokumentenebene. Journalisten können problemlos zu einzelnen Dokumenten gelangen, die mit einem Knoten bzw. einer Kante assoziiert sind. Die Guidance arbeitet mit anderen new/s/leak-Komponenten zusammen. Das Guidance-System ermöglicht Journalisten dank der integrierten Features eine flexible Recherche in der Dokumentenmenge, die Benutzeroberfläche ist dennoch intuitiv und überfordert den Benutzer nicht. Die entwickelte Guidance wurde mit Hilfe von Fallstudien und einer Hands-on Session mit Journalisten evaluiert.

Uncontrolled Keywords: Forschungsgruppe Visual Search and Analysis (VISA), Multidimensional data visualization, Data visualization, Text analysis, Text mining
Divisions: 20 Department of Computer Science
20 Department of Computer Science > Interactive Graphics Systems
20 Department of Computer Science > Mathematical and Applied Visual Computing
Date Deposited: 23 Apr 2019 05:33
Additional Information:

57 S.

Export:
Suche nach Titel in: TUfind oder in Google

Optionen (nur für Redakteure)

View Item View Item