Mit der steigenden Beliebtheit des online Shoppings bieten heutzutage die meisten Betreiber von e-Commerce Webseiten ihren Kunden die Möglichkeit, ein Feedback zu den erworbenen Waren zu hinterlassen. Diese Form der Kunden- oder Benutzerinteraktion ist auf Web 2.0 Seiten stark ausgeprägt. Auf Online-Datenbanken, z.B. für Filme, werden den Nutzern verschiedene Anreize mit dem Ziel geboten, bei der Erstellung der Webseiten-Inhalte mitzumachen. Dabei wird ihnen die Möglichkeit gegeben, Filme zu bewerten und Rezensionen zu schreiben. Es sind mittlerweile Webseiten entstanden, z.B. rateitall.com, die ihren Nutzern ermöglichen Bewertungen und Rezensionen zu den vielfältigsten Themen zu schreiben. Je mehr Inhalte auf derartigen Seiten erstellt werden, desto größer wird der Bedarf an automatischen Ansätzen, die in der Lage sind, strukturierte Informationen aus den meist unstrukturierten Texten zu extrahieren. Eine automatische Extraktion der Meinungen, die in tausenden dieser benutzergenerierten Texten geäußert werden, kann interessante Daten für andere Anwendungen liefern, z.B. Question Answering, Information Retrieval oder automatische Text-Zusammenfassung. All diese Anwendungen erfordern Systeme zur Meinungsextraktion, die in der Lage sind, einzelne Elemente der Meinungen auf Satzebene zu analysieren. Diese beinhalten beispielsweise die Begriffe, welche die Meinung bilden, ihre Polarität und den Betreff der Meinung. In dieser Dissertation untersuchen wir umfassend die automatische Meinungsextraktion mit einem Schwerpunkt auf der Extraktion von Meinungszielen, da diese ein essentieller Schritt ist, um andere Aufgaben, z.B. Information Retrieval oder Question Answering auf Meinungen durchführen zu können. Wir analysieren den Stand der Forschung im Bereich des Opinion Minings, indem wir die verwandten Arbeiten anhand dreier Teilaufgaben gruppieren. Eine davon ist die Extraktion von Meinungszielen. Wir führen eine vergleichende Studie zwischen zwei unüberwachten Algorithmen zur Extraktion von Meinungszielen durch, die wir auf Datensätzen von benutzergenerierten Rezensionen und Weblog-Postings evaluieren. Diese Datensätze beinhalten Dokumente aus vier verschiedenen Domänen: Digitalkameras, Autos, Filme und Web-Services. Wir analysieren, inwiefern die Identifikation der meinungsbildenden Begriffe die Leistung der Meinungsziel-Extraktion der einzelnen Algorithmen beeinflusst. Des Weiteren zeigen wir, dass eine einfache Heuristik, welche die Wort-Distanz innerhalb eines Satzes zur Identifikation der Meinungsziele verwendet, bessere Ergebnisse als die beiden anderen unüberwachten Algorithmen erzielt. Die Wort-Distanz-basierte Heuristik erreicht dabei ein F-Measure zwischen 0.372 und 0.491 auf den vier Datensätzen. Ferner evaluieren wir einen Algorithmus, welcher den Stand der Forschung im Bereich der überwachten Meinungsextraktion darstellt. Wir stellen einen neuen überwachten Ansatz zur Meinungsextraktion vor, der auf Conditional Random Fields (CRF) basiert. Der von uns entwickelte Ansatz erzielt auf allen vier Datensätzen eine signifikant bessere Leistung als der Algorithmus nach dem gegenwärtigen Stand der Forschung und erreicht dabei ein F-Measure zwischen 0.497 und 0.702 bei der Extraktion der Meinungsziele. Wir evaluieren weiterhin beide Algorithmen in einem domänenübergreifenden Trainings- / Test-Szenario, da überwachte Algorithmen typischerweise ein inhärentes Problem der Domänenabhängigkeit der gelernten Modelle haben. In diesem Szenario übertrifft unser CRF-basierter Ansatz die Leistung des Baseline-Systems ebenfalls auf allen vier Datensätzen. Weiterhin vergleichen wir den CRF-basierten Ansatz mit dem besten unüberwachten Algorithmus, der Wort-Distanz-Heuristik, da unüberwachte Ansätze nicht das Problem der Domänenabhängigkeit besitzen. Dabei erzielt der CRF-basierte Ansatz auf drei der vier Datensätze eine bessere Leistung als der unüberwachte Algorithmus. In diesem domänenübergreifenden Szenario erreicht der CRF-basierte Ansatz ein F-Measure zwischen 0.360 und 0.518 auf den vier Datensätzen. Die Extraktion von Meinungszielen, welche über Anaphern referenziert werden, ist eine Herausforderung, die häufig bei der Meinungsextraktion auf Phrasenebene angetroffen wird. Erstmalig integrieren wir Algorithmen zur Anaphernresolution in ein überwachtes System zur Meinungsextraktion. Wir führen eine Evaluation von zwei Algorithmen durch, bei der diese den korrekten Antezedenten eines anaphorischen Meinungsziels extrahieren müssen. Unsere Ergebnisse zeigen, dass einer der beiden Algorithmen, welcher zur Anaphernresolution mit hoher Präzision entworfen wurde, für eine Integration mit einem System zur Meinungsextraktion geeigneter ist. Indem wir diesen Algorithmus erweitern, der in seiner Standardkonfiguration die beste Leistung erzielt, erreichen wir signifikante Verbesserungen hinsichtlich der Ergebnisse der Extraktion der Meinungsziele auf drei der vier Datensätze. Abschließend zeigen wir, wie ein System zur Meinungsextraktion erfolgreich verwendet werden kann, um eine andere Anwendung zu verbessern. Empfehlungssysteme werden heutzutage vielfach auf Internet-Plattformen und in Desktop-Applikationen eingesetzt, um den Benutzern Produkte oder Kunstwerke vorzuschlagen, die den Benutzern bisher unbekannt sind, aber gefallen könnten. Die Empfehlungen für einen Benutzer B1 werden berechnet, indem zuerst sein Geschmack bezüglich der Produkte oder Kunstwerke und die Geschmäcker der anderen Benutzer erfasst werden. Der Algorithmus identifiziert dann andere Benutzer B2 ... Bn, die einen ähnlichen Geschmack wie der Benutzer B1 haben. Dem Benutzer B1 werden dann Entitäten empfohlen, die denjenigen Benutzern gefallen, welche einen ähnlichen Geschmack haben. Der Geschmack eines Benutzers wird typischerweise erfasst, indem man ihm die Möglichkeit gibt, Bewertungen zu den Entitäten abzugeben, die er konsumiert hat. Wie eingangs erwähnt, geht der Trend dahin, den Benutzern die Möglichkeit zu eröffnen, ihre Bewertungen nicht nur auf einer numerischen Skala, sondern auch mittels Freitext auszudrücken. Unsere Hypothese ist, dass diese Freitext-Bewertungen viele Informationen beinhalten, welche in Form von Meinungen ausgedrückt sind, die es uns erlauben, den Geschmack eines Benutzers mit einer sehr feinen Granularität zu modellieren. Wir zeigen, dass sich durch die Integration eines Systems zur Meinungsextraktion die Genauigkeit der Vorschläge eines Empfehlungssystems signifikant verbessern lässt. Dies wurde auf einem Datensatz von Film-Bewertungen und -Reviews evaluiert. | Deutsch |