TU Darmstadt / ULB / TUbiblio

Web Corpus Mining by Instance of Wikipedia

Gleim, Rüdiger ; Mehler, Alexander ; Dehmer, Matthias (2006)
Web Corpus Mining by Instance of Wikipedia.
Konferenzveröffentlichung, Bibliographie

Kurzbeschreibung (Abstract)

In this paper we present an approach on structure learning in the area of web documents. This is done in order to approach the goal of webgenre tagging in the area of web corpus linguistics. A central outcome of the paper is that purely structure oriented approaches to web document classification provide an information gain which may be utilized in combined approaches of web content and structure analysis.

Typ des Eintrags: Konferenzveröffentlichung
Erschienen: 2006
Autor(en): Gleim, Rüdiger ; Mehler, Alexander ; Dehmer, Matthias
Art des Eintrags: Bibliographie
Titel: Web Corpus Mining by Instance of Wikipedia
Sprache: Deutsch
Publikationsjahr: 2006
Buchtitel: Proceedings of the EACL 2006 Workshop on Web as Corpus, Trento, Italy
Kurzbeschreibung (Abstract):

In this paper we present an approach on structure learning in the area of web documents. This is done in order to approach the goal of webgenre tagging in the area of web corpus linguistics. A central outcome of the paper is that purely structure oriented approaches to web document classification provide an information gain which may be utilized in combined approaches of web content and structure analysis.

Fachbereich(e)/-gebiet(e): 20 Fachbereich Informatik > Telekooperation
20 Fachbereich Informatik
Hinterlegungsdatum: 31 Dez 2016 12:59
Letzte Änderung: 15 Mai 2018 12:01
PPN:
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen