TU Darmstadt / ULB / TUbiblio

Enriched Event Streams: A General Platform For Empirical Studies On In-IDE Activities Of Software Developers

Proksch, Sebastian (2017)
Enriched Event Streams: A General Platform For Empirical Studies On In-IDE Activities Of Software Developers.
Technische Universität Darmstadt
Dissertation, Erstveröffentlichung

Kurzbeschreibung (Abstract)

Current studies on software development either focus on the change history of source code from version-control systems or on an analysis of simplistic in-IDE events without context information. Each of these approaches contains valuable information that is unavailable in the other case. This work proposes enriched event streams, a solution that combines the best of both worlds and provides a holistic view on the in-IDE software development process. Enriched event streams not only capture developer activities in the IDE, but also specialized context information, such as source-code snapshots for change events. To enable the storage of such code snapshots in an analyzable format, we introduce a new intermediate representation called Simplified Syntax Trees (SSTs) and build CARET, a platform that offers reusable components to conveniently work with enriched event streams. We implement FeedBaG++, an instrumentation for Visual Studio that collects enriched event streams with code snapshots in the form of SSTs and share a dataset of enriched event streams captured in an ongoing field study from 81 users and representing 15K hours of active development. We complement this with a dataset of 69M lines of released source code extracted from 360 GitHub repositories. To demonstrate the usefulness of our platform, we use it to conduct studies on the in-IDE development process that are both concerned with source-code evolution and the analysis of developer interactions. In addition, we build recommendation systems for software engineering and analyze and improve current evaluation techniques.

Typ des Eintrags: Dissertation
Erschienen: 2017
Autor(en): Proksch, Sebastian
Art des Eintrags: Erstveröffentlichung
Titel: Enriched Event Streams: A General Platform For Empirical Studies On In-IDE Activities Of Software Developers
Sprache: Englisch
Referenten: Mira, Prof. Dr. Mezini ; Walid, Prof. Dr. Maalej
Publikationsjahr: 31 Mai 2017
Ort: Darmstadt
Datum der mündlichen Prüfung: 25 August 2017
URL / URN: http://tuprints.ulb.tu-darmstadt.de/6971
Kurzbeschreibung (Abstract):

Current studies on software development either focus on the change history of source code from version-control systems or on an analysis of simplistic in-IDE events without context information. Each of these approaches contains valuable information that is unavailable in the other case. This work proposes enriched event streams, a solution that combines the best of both worlds and provides a holistic view on the in-IDE software development process. Enriched event streams not only capture developer activities in the IDE, but also specialized context information, such as source-code snapshots for change events. To enable the storage of such code snapshots in an analyzable format, we introduce a new intermediate representation called Simplified Syntax Trees (SSTs) and build CARET, a platform that offers reusable components to conveniently work with enriched event streams. We implement FeedBaG++, an instrumentation for Visual Studio that collects enriched event streams with code snapshots in the form of SSTs and share a dataset of enriched event streams captured in an ongoing field study from 81 users and representing 15K hours of active development. We complement this with a dataset of 69M lines of released source code extracted from 360 GitHub repositories. To demonstrate the usefulness of our platform, we use it to conduct studies on the in-IDE development process that are both concerned with source-code evolution and the analysis of developer interactions. In addition, we build recommendation systems for software engineering and analyze and improve current evaluation techniques.

Alternatives oder übersetztes Abstract:
Alternatives AbstractSprache

Aktuelle Studien über Software Engineering konzentrieren sich entweder auf den Änderungsverlauf von Quelltext in Systemen zur Versionskontrolle oder auf eine Analyse von einfachen in-IDE Ereignissen ohne jegliche Kontextinformationen. Beide Ansätze nutzen wertvolle Informationen, die im anderen Fall nicht zu Verfügung stehen. Diese Arbeit stellt angereicherte Ereignisströme vor, eine Lösung, die das Beste beider Welten vereint und einen ganzheitlichen Blick auf den Prozess der Softwareentwicklung in der IDE ermöglicht. Angereicherte Ereignisströme erfassen nicht nur die in-IDE Aktivitäten eines Softwareentwicklers, sondern enthalten auch spezialisierte Kontextinformationen, beispielsweise Momentaufnahmen von Quelltext bei Änderungsereignissen. Um die Speicherung solcher Momentaufnahmen in einem analysierbaren Format zu ermöglichen, stellen wir eine neue Zwischendarstellung vor, Vereinfachte Syntax Bäume (SSTs), und erzeugen CARET, eine Plattform, die wiederverwendbare Kom-ponenten bereitstellt, um komfortabel mit angereicherten Ereignisströmen arbeiten zu können. Wir implementieren FeedBaG++, eine Instrumentierung für Visual Studio, die angereicherte Ereignisströme mit Momentaufnahmen von Quelltext in Form von SSTs sammelt. Wir teilen einen Datensatz von angereicherte Ereignisströme, den wir in einer andauernden Feldstudie von 81 Teilnehmern gesammelt haben und der 15T Stunden aktiver Entwicklungsarbeit enthält. Wir ergänzen ihn mit einem Datensatz von 69M Zeilen von veröffentlichtem Quelltext, den wir aus 360 GitHub Repositories extrahiert haben. Um den Nutzen unserer Plattform zu zeigen, führen wir Studien über den in-IDE Entwicklungsprozess sowie über die Entstehung von Quelltext mit ihr durch. Zusätzlichen erzeugen wir Empfehlungssysteme für Software Engineering und analysieren und verbessern aktuelle Techniken für deren Evaluation.

Deutsch
URN: urn:nbn:de:tuda-tuprints-69714
Sachgruppe der Dewey Dezimalklassifikatin (DDC): 000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
Fachbereich(e)/-gebiet(e): 20 Fachbereich Informatik
20 Fachbereich Informatik > Softwaretechnik
Hinterlegungsdatum: 03 Dez 2017 20:55
Letzte Änderung: 03 Dez 2017 20:55
PPN:
Referenten: Mira, Prof. Dr. Mezini ; Walid, Prof. Dr. Maalej
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: 25 August 2017
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen