TU Darmstadt / ULB / TUbiblio

Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge

Faatz, Andreas (2004)
Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge.
Technische Universität Darmstadt
Dissertation, Erstveröffentlichung

Kurzbeschreibung (Abstract)

Ontologien bestehen aus Fachbegriffen eines Wissensgebietes, die in Form von Ober- und Unterbegriffen gegliedert und durch weitere semantische fachgebietsspezifische Relationen verbunden sind. Die Dissertationsschrift stellt einen neuartigen Ansatz dar, eine automatische Unterstützung des Ontologieerstellungsprozesses zu liefern. Das Verfahren kann bestehende Ontologien erweitern und so einen Beitrag zur erleichterten Konstruktion und Wiederverwendung bestehender Wissensrepräsentationen liefern. Es wurde dazu eine ähnlichkeitsbasierte Methode definiert und erprobt. Die Wirkungsweise der Methode gleicht die Ähnlichkeiten zwischen Begriffspaaren aus der Ontologie und die Ähnlichkeiten, die sich aus der Verwendung von Fachbegriffen in einem Textkorpus bestimmen lassen, einander an. Die in der Arbeit dargelegten Messergebnisse zeigen, dass für ein beispielhaftes Szenario eine Definition des Verfahrens gefunden werden kann, die anderen Verfahren signifikant überlegen ist: die Kombination aus dem neu definierten vektorwertigen Ähnlichkeitsmaß, das auf dem Jaccardmaß beruht, und dem ontologischen Vegleichsmaß nach Resnik. Die Bewertung des Verfahrens im Beispielszenario beruht auf einem Datenbestand, wie er in einer realistischen Projektsituation (k-med) entsteht. Die in der Arbeit definierte Vorgehensweise der Messungen ist auf weitere konkrete Anwendungsfälle, in denen Ontologieanreicherungen vorgenommen werden sollen, übertragbar. Alle in dieser Arbeit neu definierten Kriterien der Bewertung, nämlich Fehlklassifikation, Anreicherungsneigung und Recalleigenschaften, stehen in unmittelbarem Zusammenhang mit verschiedenen Phasen des kooperativen Ontologieerstellungsprozesses nach Holsapple und Joshi, dessen iterative Phasen im Rahmen dieser Arbeit mit der Erstellung von Metadaten und noch allgemeiner mit der Verschlagwortung von Dokumenten integriert wurden. Das ähnlichkeitsbasierte Verfahren eröffnet in zweifacher Hinsicht Möglichkeiten der automatischen Unterstützung. Sind eine Ontologie und ein Textkorpus gegeben, so kann der Moderator des Ontologieerstellungsprozesses jedem Ersteller der Ontologie unabhängig von der Anwendung der Ontologie Begriffsvorschläge und ihren Bezug zur bereits vorhandenen Ontologie zukommen lassen. Dies kann im Erstellungsprozess bereits sehr früh und sehr spezifisch, das heißt mit kleinen fachbezogenen Ontologien, geschehen. Die vorliegende Arbeit geht in diesem Sinne über vorhandene Arbeiten der vollständig automatischen Generierung von Ontologien hinaus.

Typ des Eintrags: Dissertation
Erschienen: 2004
Autor(en): Faatz, Andreas
Art des Eintrags: Erstveröffentlichung
Titel: Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge
Sprache: Deutsch
Referenten: Steinmetz, Prof. Dr.- Ralf ; Fürnkranz, Prof. Dr. Johannes
Berater: Steinmetz, Prof. Dr.- Ralf
Publikationsjahr: 10 Dezember 2004
Ort: Darmstadt
Verlag: Technische Universität
Datum der mündlichen Prüfung: 25 November 2004
URL / URN: urn:nbn:de:tuda-tuprints-5054
Kurzbeschreibung (Abstract):

Ontologien bestehen aus Fachbegriffen eines Wissensgebietes, die in Form von Ober- und Unterbegriffen gegliedert und durch weitere semantische fachgebietsspezifische Relationen verbunden sind. Die Dissertationsschrift stellt einen neuartigen Ansatz dar, eine automatische Unterstützung des Ontologieerstellungsprozesses zu liefern. Das Verfahren kann bestehende Ontologien erweitern und so einen Beitrag zur erleichterten Konstruktion und Wiederverwendung bestehender Wissensrepräsentationen liefern. Es wurde dazu eine ähnlichkeitsbasierte Methode definiert und erprobt. Die Wirkungsweise der Methode gleicht die Ähnlichkeiten zwischen Begriffspaaren aus der Ontologie und die Ähnlichkeiten, die sich aus der Verwendung von Fachbegriffen in einem Textkorpus bestimmen lassen, einander an. Die in der Arbeit dargelegten Messergebnisse zeigen, dass für ein beispielhaftes Szenario eine Definition des Verfahrens gefunden werden kann, die anderen Verfahren signifikant überlegen ist: die Kombination aus dem neu definierten vektorwertigen Ähnlichkeitsmaß, das auf dem Jaccardmaß beruht, und dem ontologischen Vegleichsmaß nach Resnik. Die Bewertung des Verfahrens im Beispielszenario beruht auf einem Datenbestand, wie er in einer realistischen Projektsituation (k-med) entsteht. Die in der Arbeit definierte Vorgehensweise der Messungen ist auf weitere konkrete Anwendungsfälle, in denen Ontologieanreicherungen vorgenommen werden sollen, übertragbar. Alle in dieser Arbeit neu definierten Kriterien der Bewertung, nämlich Fehlklassifikation, Anreicherungsneigung und Recalleigenschaften, stehen in unmittelbarem Zusammenhang mit verschiedenen Phasen des kooperativen Ontologieerstellungsprozesses nach Holsapple und Joshi, dessen iterative Phasen im Rahmen dieser Arbeit mit der Erstellung von Metadaten und noch allgemeiner mit der Verschlagwortung von Dokumenten integriert wurden. Das ähnlichkeitsbasierte Verfahren eröffnet in zweifacher Hinsicht Möglichkeiten der automatischen Unterstützung. Sind eine Ontologie und ein Textkorpus gegeben, so kann der Moderator des Ontologieerstellungsprozesses jedem Ersteller der Ontologie unabhängig von der Anwendung der Ontologie Begriffsvorschläge und ihren Bezug zur bereits vorhandenen Ontologie zukommen lassen. Dies kann im Erstellungsprozess bereits sehr früh und sehr spezifisch, das heißt mit kleinen fachbezogenen Ontologien, geschehen. Die vorliegende Arbeit geht in diesem Sinne über vorhandene Arbeiten der vollständig automatischen Generierung von Ontologien hinaus.

Alternatives oder übersetztes Abstract:
Alternatives AbstractSprache

Ontologies are constructed from domain specific concepts by subconcept relations and further domain specific relations. This structure offers a semantic richness, which can be applied for a new generation of search, navigation and service facilities. The PhD thesis explores and proves a novel approach - so-called ontology enrichment - for an automated support of the ontology construction process. The approach is able to extend given ontologies and contributes to reuseability and rapid development of ontologies. In this PhD thesis, a consequent focus on the enrichment of existing ontologies improves the state of the art approaches, which tend to ignore existing manually built structures. The author of the PhD thesis developed and tested a similarity based method. It is based on fitting similarity values, which originate from the structure of a given ontology, to the similarity values, which are derived from collocation vectors in a given domain specific text corpus. Measurements show, that for a particular new combination of similarity heuristics (Jaccard measure and Resnik's measure) the approach succeeds in re-constructing a given ontology. The evaluation of the ontology enrichment approach was based on a realistic data set from the e-Learning project k-med ("knowledge based multimedia medical education"). Ontology enrichment can also be applied to other domains. The PhD thesis proposes the steps in need for such an application. All steps are embedded in a collaborative ontology construction approach due to Holsapple and Joshi. Especially for ontology applications, which refer to the ontology as a vocabulary of document keywords, the PhD thesis shows, how the automatic support by ontology enrichment and the application of the ontology positively interact.

Englisch
Freie Schlagworte: maschinelles Lernen, Ontologien
Schlagworte:
Einzelne SchlagworteSprache
machine learning, ontologiesEnglisch
Sachgruppe der Dewey Dezimalklassifikatin (DDC): 000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
Fachbereich(e)/-gebiet(e): 20 Fachbereich Informatik
Hinterlegungsdatum: 17 Okt 2008 09:21
Letzte Änderung: 26 Aug 2018 21:25
PPN:
Referenten: Steinmetz, Prof. Dr.- Ralf ; Fürnkranz, Prof. Dr. Johannes
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: 25 November 2004
Schlagworte:
Einzelne SchlagworteSprache
machine learning, ontologiesEnglisch
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen