TU Darmstadt / ULB / TUbiblio

Guidance zur Exploration von Entitätsgraphen aus Textkollektionen für Datenjournalismus

Müller, Martin (2016)
Guidance zur Exploration von Entitätsgraphen aus Textkollektionen für Datenjournalismus.
Technische Universität Darmstadt
Bachelorarbeit, Bibliographie

Kurzbeschreibung (Abstract)

An der TU Darmstadt wird new/s/leak entwickelt, ein Tool welches Journalisten bei der Recherche in großen Dokumentenmengen( wie z.B. den Panama Papers oder den Cablegate-Dokumenten) unterstützt. Beziehungen zwischen Personen, Organisationen, Orten und anderen Dingen die in der Dokumentenmenge erwähnt sind, werden in einem riesigen Graphen erfasst, der teilweise mehr als 100 Millionen Kanten enthält. Der Graph enthält für Journalisten interessante Informationen, die Suche nach diesen Informationen im Graph gleicht jedoch der sprichwörtlichen Suche nach der Nadel im Heuhaufen. Die Visualisierung eines solch riesigen Graphen ist zudem äußerst schwierig. Zur Lösung dieser Probleme eignet sich - wie in der Arbeit gezeigt wird - Guidance. Ein Graph-Guidance-System berechnet für einen gegeben Fokusknoten einen lokalen Teilgraph, der nur einen kleinen Teilausschnitt mit interessanten Verbindungen des kompletten Graphen zeigt. Dieser Teilgraph ist übersichtlich und gut erfassbar. Benutzer können innerhalb des Teilgraphen einen neuen Fokus setzten, was wiederum zu einem neuen, veränderten Teilgraph führt. So kann der große Graph exploriert werden. In dieser Arbeit wurde ein in new/s/leak integriertes Graph-Guidance-System entwickelt welches Journalisten bei der Recherche in großen Dokumentenmengen unterstützt. Zunächst wurden Anforderungen an die Graph-Guidance formuliert und bestehende Graph-Guidance-Systeme analysiert. Da keiner der bestehenden Ansätze ad-hoc die Anforderungen erfüllt, wurde ein neues Graph-Guidance-System entwickelt. Dieses baut vor allem auf den Arbeiten von van Ham und Perer 18 sowie von Kochtchi et al. 12 auf. Die entwickelte Guidance berücksichtigt die verschiedenen Typen, die Knoten besitzen können und ermöglicht Journalisten diese zu gewichten, zudem können Guidance-Schritte auch rückgängig gemacht werden und wiederholt werden. Dies erleichert Journalisten die Arbeit mit dem Graph. Die Journalisten werden des Weiteren bei ihrer Entscheidungsfindung durch Detailformationen zu Knoten unterstützt. Es gibt auch eine sinnvolle Verknüpfung der Netzwerkebene mit der Dokumentenebene. Journalisten können problemlos zu einzelnen Dokumenten gelangen, die mit einem Knoten bzw. einer Kante assoziiert sind. Die Guidance arbeitet mit anderen new/s/leak-Komponenten zusammen. Das Guidance-System ermöglicht Journalisten dank der integrierten Features eine flexible Recherche in der Dokumentenmenge, die Benutzeroberfläche ist dennoch intuitiv und überfordert den Benutzer nicht. Die entwickelte Guidance wurde mit Hilfe von Fallstudien und einer Hands-on Session mit Journalisten evaluiert.

Typ des Eintrags: Bachelorarbeit
Erschienen: 2016
Autor(en): Müller, Martin
Art des Eintrags: Bibliographie
Titel: Guidance zur Exploration von Entitätsgraphen aus Textkollektionen für Datenjournalismus
Sprache: Deutsch
Publikationsjahr: 2016
Kurzbeschreibung (Abstract):

An der TU Darmstadt wird new/s/leak entwickelt, ein Tool welches Journalisten bei der Recherche in großen Dokumentenmengen( wie z.B. den Panama Papers oder den Cablegate-Dokumenten) unterstützt. Beziehungen zwischen Personen, Organisationen, Orten und anderen Dingen die in der Dokumentenmenge erwähnt sind, werden in einem riesigen Graphen erfasst, der teilweise mehr als 100 Millionen Kanten enthält. Der Graph enthält für Journalisten interessante Informationen, die Suche nach diesen Informationen im Graph gleicht jedoch der sprichwörtlichen Suche nach der Nadel im Heuhaufen. Die Visualisierung eines solch riesigen Graphen ist zudem äußerst schwierig. Zur Lösung dieser Probleme eignet sich - wie in der Arbeit gezeigt wird - Guidance. Ein Graph-Guidance-System berechnet für einen gegeben Fokusknoten einen lokalen Teilgraph, der nur einen kleinen Teilausschnitt mit interessanten Verbindungen des kompletten Graphen zeigt. Dieser Teilgraph ist übersichtlich und gut erfassbar. Benutzer können innerhalb des Teilgraphen einen neuen Fokus setzten, was wiederum zu einem neuen, veränderten Teilgraph führt. So kann der große Graph exploriert werden. In dieser Arbeit wurde ein in new/s/leak integriertes Graph-Guidance-System entwickelt welches Journalisten bei der Recherche in großen Dokumentenmengen unterstützt. Zunächst wurden Anforderungen an die Graph-Guidance formuliert und bestehende Graph-Guidance-Systeme analysiert. Da keiner der bestehenden Ansätze ad-hoc die Anforderungen erfüllt, wurde ein neues Graph-Guidance-System entwickelt. Dieses baut vor allem auf den Arbeiten von van Ham und Perer 18 sowie von Kochtchi et al. 12 auf. Die entwickelte Guidance berücksichtigt die verschiedenen Typen, die Knoten besitzen können und ermöglicht Journalisten diese zu gewichten, zudem können Guidance-Schritte auch rückgängig gemacht werden und wiederholt werden. Dies erleichert Journalisten die Arbeit mit dem Graph. Die Journalisten werden des Weiteren bei ihrer Entscheidungsfindung durch Detailformationen zu Knoten unterstützt. Es gibt auch eine sinnvolle Verknüpfung der Netzwerkebene mit der Dokumentenebene. Journalisten können problemlos zu einzelnen Dokumenten gelangen, die mit einem Knoten bzw. einer Kante assoziiert sind. Die Guidance arbeitet mit anderen new/s/leak-Komponenten zusammen. Das Guidance-System ermöglicht Journalisten dank der integrierten Features eine flexible Recherche in der Dokumentenmenge, die Benutzeroberfläche ist dennoch intuitiv und überfordert den Benutzer nicht. Die entwickelte Guidance wurde mit Hilfe von Fallstudien und einer Hands-on Session mit Journalisten evaluiert.

Freie Schlagworte: Forschungsgruppe Visual Search and Analysis (VISA), Multidimensional data visualization, Data visualization, Text analysis, Text mining
Zusätzliche Informationen:

57 S.

Fachbereich(e)/-gebiet(e): 20 Fachbereich Informatik
20 Fachbereich Informatik > Graphisch-Interaktive Systeme
20 Fachbereich Informatik > Mathematisches und angewandtes Visual Computing
Hinterlegungsdatum: 23 Apr 2019 05:33
Letzte Änderung: 23 Apr 2019 05:33
PPN:
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen