Conference PaperPDF Available

Erfahrungsberichte aus zweiter Hand: Erkenntnisse über die Autorschaft von Arztbewertungen in Online-Portalen

Authors:
Erfahrungsberichte aus zweiter Hand:
Erkenntnisse über die Autorschaft von Arztbewertungen in Online-Portalen
Michaela Geierhos & Frederik S. Bäumer, Universität Paderborn
Für den Internetnutzer
1
entstehen immer mehr Möglichkeiten, Bewertungen über eine Vielzahl an
Produkten (z. B. Amazon Reviews), Leistungen (z. B. jameda) und Erlebnissen (z. B. TripAdvisor)
abzugeben. Diese suchen Bewertungsplattformen auf, um aktiv ihre Erfahrungen mit Dienstleistungen
wie z. B. im Versandhandel, mit Hotelurlauben oder von Arztbesuchen mit anderen zu teilen. Häufig
bestehen diese Bewertungskommentare aus Freitexten (sog. User Generated Content), die in Struktur
und inhaltlicher Fokussierung deutlich voneinander abweichen. Vor der wissenschaftlichen
Interpretation dieser Erfahrungsberichte steht jedoch der Prozess der Datenerhebung die Entscheidung
darüber, was die eigentlichen Daten für bestimmte Forschungszwecke sind. Was wir als
Computerlinguisten unter empirischen Daten verstehen, und wie wir und andere Disziplinen den Prozess
der Datenbeschaffung bezeichnen (z. B. Datenakquise vs. Datenkonstruktion), unterscheidet sich stark
davon, wie Daten z. B. in der Soziologie erhoben und wie dieser Prozess dort verstanden wird.
Daten Informationen Erkenntnisse
Daten sind für uns nur Angaben über Sachverhalte und Vorgänge, die in einer Datenbank gespeichert
werden. So liegen dieser Studie zufällig ausgewählte Datensätze der Portale jameda und DocInsider aus
den Jahren 2009 bis 2015 zugrunde. Das Korpus umfasst 860.000 individuelle Erfahrungsberichte, die
allesamt nach einem Arztbesuch in Deutschland verfasst und online gestellt wurden. Jede
Arztbewertung besteht dabei aus einer Überschrift, dem eigentlichen Text und bis zu 17 verschiedenen
numerischen Bewertungskategorien (u.a. Behandlung, Vertrauensverhältnis, Wartezeit,
Barrierefreiheit). Bei der computergestützten Datenakquise wurden diese authentischen, online-
verfügbaren Datensätze (sog. empirische Daten) originalgetreu zur weiteren Auswertung lokal
bereitgestellt.
Erst durch die kognitive Verarbeitung des Lesers können aus diesen Daten Informationen werden.
Hierfür setzt die Computerlinguistik Methoden zur Informationsextraktion ein, um sowohl
Informationen aus den Meta-Daten (z. B. Erstellungsdatum, Name und Alter der Autoren) als auch aus
dem Inhalt von Datenformaten (z. B. HTML) zu gewinnen. Anfangs wird definiert, welche Arten von
Informationen extrahiert werden sollen. Auf diese Weise ist es möglich, aus Online-Arztbewertungen
beispielsweise auszulesen, wer behandelt wurde, was die Symptome waren oder die
Krankheitsgeschichte ist, wie (un)zufrieden derjenige war (z. B. lange Wartezeit; kompetente
Behandlung), und ob er den Arzt weiterempfehlen würde. Hierzu müssen einerseits Zuordnungsregeln
formuliert werden, die darüber entscheiden, welche Daten welche Informationen repräsentieren, wie
beispielsweise Kassenpatient Gesetzliche Krankenversicherung. Andererseits ist zu beachten, dass
der quantitative Teil der Daten in Abhängigkeit der Ursprungsplattform (jameda oder DocInsider)
anders zu interpretieren ist. Während jameda mit Schulnoten arbeitet, setzt DocInsider Sterne zur
Bewertung der unterschiedlichen Aspekte beim Arztbesuch ein. Aufgrund dessen ist eine
portalspezifische Abbildungsfunktion von Zahlen auf Denotationen zu definieren, so dass sichergestellt
wird, dass eine 1,0 bei jameda der Bedeutung von „sehr gut“ entspricht, wohingegen derselbe
numerische Wert bei DocInsider ein „ungenügend“ repräsentiert.
Anschließend können die Bewertungstexte erst maschinell analysiert werden, um Erkenntnisse über
deren Inhalte zu gewinnen. Dies birgt zwar einige Herausforderungen hinsichtlich der Subjektivität
(Wiebe, 2004; Bruce & Wiebe, 1999), Polarität (Bakliwal et al., 2012; Kim & Hovy, 2006; Qin et al.,
1
Aus Gründen der leichteren Lesbarkeit wird auf eine geschlechtsspezifische Differenzierung verzichtet.
Entsprechende Begriffe gelten im Sinne der Gleichbehandlung für beide Geschlechter.
2008; Pang et al., 2002) und der Semantik (Hu & Liu, 2004b; Kim & Hovy, 2006; Turney, 2002) der
Aussage(n), führt aber nach Anwendung von automatischen Textanalyseverfahren zu qualitativ
hochwertigen, interdisziplinär verwertbaren Ergebnissen. Zwar untersucht die computerlinguistische
Forschung bereits automatisiert die Zufriedenheit von Konsumenten hinsichtlich bestimmter Produkte
oder Dienstleistungen (Gamon, 2004; Hu & Liu, 2004a), unterstützt aber bisher nicht die Identifikation
von thematischen Rollen in Bewertungstexten. Die Forschung im Bereich der Bewertungskultur im Web
2.0 deckt bereits eine Vielzahl unterschiedlicher Disziplinen (u.a. Soziologie, Marketing, Psychologie,
Linguistik, Informatik) und verschiedene Aspekte (u.a. Bewertungsgegenstand, demographische
Einflüsse, Emotionserkennung) ab. Selbst im Bereich des Textmining in Sozialen Medien werden
Bewertungen und Kommentare vorwiegend auf Polarität (He et al., 2011; Jiang et al., 2011) und/oder
Inhalt (Kushal et al., 2003) automatisch analysiert. Hierbei werden in der Regel die offensichtlichen
sprachlichen Indikatoren (z. B. Emoticons, positive und negative Wörter) zur Identifizierung der
Grundstimmung in den einzelnen Texten berücksichtigt (sog. Sentiment Analysis). Vereinzelt gibt es
jetzt auch Arbeiten, welche sich mit der Stilistik von Bewertungstexten (Ludwig et al., 2013)
auseinandersetzen. Während Autoreninformationen meist zur Erkennung von gefälschten Bewertungen
(Liu, 2012:127; O'Connor, 2010; Hu et al., 2011) eingesetzt werden, konzentrieren wir uns in diesem
Beitrag auf die Identifikation von Akteuren (sog. Rollen) im Online-Ärztebewertungsprozess.
Rezensenten Patienten Ärzte
Vermutlich sind es Patienten, die ihre Ärzte bewerten und die eigenen Erfahrungen nach dem
Arztbesuch weitergeben möchten. Allerdings finden sich auch einige Belege im Korpus, dass Kinder
über den Arztbesuch ihrer alternden Eltern berichten oder Eltern für ihre minderjährigen Kinder
Bewertungen vergeben. Damit wird nicht nur die Behandlung, sondern ebenfalls der Behandelte
Gegenstand des Erfahrungsberichtes, so dass Autor und Patient nicht mehr in persona auftreten.
Der damit einhergehende Perspektivwechsel spiegelt sich in den morpho-syntaktischen Strukturen der
Texte wider. So entwickelte Geierhos (2007) mit der Grammatik der Menschenbezeichner eine
Methode, um Prädikat-Argument-Strukturen mittels lokaler Grammatiken (Gross, 1997) zur
Identifikation von Personennennungen und ihrer Funktion (semantische Rolle) im unmittelbaren
Kontext zu modellieren. Als Menschenbezeichner sind diejenigen Lexeme oder Mehrwortlexeme zu
verstehen, welche auf Personen referieren. Hierbei handelt es sich aus syntaktischer Sicht um
Eigennamen (z. B. Dr. med. Dieter Rempe), Personalpronomen (z. B. er, ihm, sein) oder Nomen (sog.
„allgemeine Menschenbezeichnungen“ nach Geierhos, 2007:69), die u.a. Berufe, Nationalitäten oder
Verwandtschaftsverhältnisse denotieren (Geierhos, 2007:74).
In Erfahrungsberichten über Arztbesuche konnten wir folgende semantische Rollen identifizieren:
(1) Wenn der Rezensent selbst der Patient ist, so nehmen beide in persona die Rolle des
Experiencers (Wahrnehmenden) ein.
(2) Ist der Patient nicht der Rezensent, wird er zum Instrument der Handlung. Er ist damit der
Anlass bzw. das Mittel zum Zweck, um eine Arztbewertung zu verfassen. Der Rezensent nimmt
dabei die Rolle des Agens ein, der willentlich handelt, indem er die Rezension schreibt.
(3) Unabhängig davon, ob Rezensent und Patient in gleicher oder unterschiedlicher Person
auftreten, ist der Arzt und gegebenenfalls sein Praxisteam der Bewertungsgestand, der
sogenannte Patiens des Erfahrungsberichts.
(4) Zum Thema eines Erfahrungsberichts werden sämtliche Qualitätskriterien (u.a. Behandlung,
Freundlichkeit, Zufriedenheit und Weiterempfehlung, Aufklärung, Genommene Zeit,
Patientenumgang) bei der Benotung niedergelassener Ärzte durch den Rezensenten.
Insbesondere konnte mithilfe der automatischen Erkennung von Menschenbezeichnern im Korpus
identifiziert werden, wer Rezensent und Patient im Fall (2) sind. So handelt es sich in ungefähr 17.800
Bewertungen um ein Kind, das den Arztbesuch mit einem oder beiden Elternteilen schildert. Bei
weiterer Textanalyse konnte ebenfalls das Alter der Patienten aufgedeckt werden, die in der Regel weit
über 70 sind, wenn ihre Kinder für sie stellvertretend den Arztbesuch bewerten. Meist sind es
Angehörige, die in der Rolle der Rezensenten schlüpfen. Ähnliches gilt für Eltern, die für ihre Kinder
sprechen (29.990 Datensätze). In diesen Fällen sprechen wir von Fremdwahrnehmung, da die Erlebnisse
der Patienten der ursprünglichen Experiencer durch Dritte wiedergegeben werden und damit nicht
mehr sichergestellt wird, inwiefern diese Meinungsbilder nicht durch die Rezensenten beeinflusst
wurden.
Die Mutter ist nicht immer die Patientin
Ausgehend von der These, dass die Nennung von Verwandtschaftsverhältnissen ein Indiz für eine
fremde Autorschaft ist, kann vermutet werden, dass eine Grammatik zur Modellierung der Prädikat-
Argument-Beziehungen von Menschenbezeichnern überflüssig ist, um die semantischen Rollen zu
bestimmen. Das Korpus liefert jedoch Belege, die ihre Anwendung rechtfertigen:
(a) Meine Ärztin sollte nicht wie meine Mutter sein.
(b) […], da ich mittlerweile die gleiche Erkrankung wie meine Mutter habe.
(c) Ich bin seit Jahren, genau wie meine Mutter, bei Dr. Esser in Behandlung.
Stellvertretend für weitere allgemeine Menschenbezeichnungen (Geierhos, 2007) wird anhand der
„Mutter“-Beispiele in (a)-(c) deutlich, dass ihre syntaktische Einbettung im Kontext von bestimmten
prädikativen Ausdrücken ihnen andere semantische Rollen zuweist. Eine Muster-basierte Textsuche
nach „meine/unsere Mutter“ würde jegliches Vorkommen im Korpus unabhängig von seiner
semantischen Rolle im Erfahrungsbericht berücksichtigen und eine Differenzierung über den Gebrauch
im Satz wäre nicht mehr möglich.
Informiertes Einverständnis im Web 2.0?
Im Korpus sind zwar die Rezensenten anonym (ohne Namen), aber nicht die Ärzte. Die
Veröffentlichung dieser personenbezogenen Daten unterliegt damit der komplexen Abwägung zwischen
dem allgemeinen Persönlichkeitsrecht der Ärzte und dem Grundrecht auf Meinungs- und
Informationsfreiheit. Gerichtlich wurde für diesen Anwendungsfall entschieden, dass das Erheben,
Speichern, Verändern oder Nutzen im Sinne des Bundesdatenschutzgesetzes grundsätzlich zulässig ist.
Weiterhin werden im Fall (1), wenn Rezensent und Patient ein und dieselbe Person sind, keine
Persönlichkeitsrechte verletzt, da dieser seinen Erfahrungsbericht freiwillig veröffentlicht hat. Aber wie
verhält es sich nun im Fall (2) bei denjenigen Datensätzen, die wir bereits erhoben haben und nun neue
Erkenntnisse über deren Autorschaft gewonnen haben? Wissen die betroffenen Patienten überhaupt,
dass ihre Erfahrungen beim Arztbesuch online für jeden lesbar zugänglich sind? Kann man bei der
Datenakquise das informierte Einverständnis der Behandelten voraussetzen? Erheben wir Daten, sehen
wir nicht die Person(en) dahinter, sondern nur eine Fülle an Informationen, aus denen wir weitere
Schlussfolgerungen ziehen können. Doch werfen diese Erkenntnisse unter Umständen weitere
(interdisziplinäre) Fragestellungen auf, die Konsequenzen haben, ob und wie wir forschungsethische
Diskussionen führen.
Literatur
Bakliwal, A.; Arora, P.; Madhappan, S.; Kapre, N., Singh, M. & Varma. V. (2012): Mining sentiments
from tweets. In Proceedings of the 3rd WASSA-Workshop 2012, Jeju, Island, Republic of Korea.
Bruce, RF. & Wiebe, JM. (1999): Recognizing subjectivity: a case study in manual tagging. In Natural
Language Engineering, 1(1), pp. 187-205.
Gamon, M. (2004): Sentiment classification on customer feedback data: Noisy data, large feature
vectors, and the role of linguistic analysis. In Proceedings of the 20th International Conference on
Computational Linguistics, Geneva, Switzerland, 2327 August 2004, pp. 611-617.
Geierhos, M. (2007): Grammatik der Menschenbezeichner in biographischen Kontexten. Arbeiten zur
Informations- und Sprachverarbeitung. Band 2. Centrum für Informations- und Sprachverarbeitung.
LMU München.
Gross, M. (1997): The Construction of Local Grammars. In E. Roche und Y. Schabès (Hrsg.): Finite-
State Language Processing, pp. 329354. Language, Speech und Communication, Cambridge,
Mass.: MIT Press.
He, Y.; Lin, C. & Alani, H. (2011): Automatically extracting polarity-bearing topics for cross-domain
sentiment analysis. In Proceedings of the 49th Annual Meeting of the Association for Computational
Linguistics, Portland, Oreg., USA, 1924 June 2011, pp. 123-131.
Hu, M. & Liu, B. (2004a): Mining opinion features in customer reviews. In Proc. of the 19th National
Conference on Artificial Intelligence, San Jose, Kalifornien, 25.-29. Juli 2004, pp. 755-760.
Hu, M. & Liu, B. (2004b): Mining and summarizing customer reviews. In Proceedings of SIGKDD, pp.
168177.
Hu, N.; Bose, I.; Koh, NS. & Liu, L. (2012): Manipulation of online reviews: An analysis of ratings,
readability, and sentiments. In Decision Support Systems 52(3), pp. 674-684.
Jiang, L.; Yu, M.; Zhou, M.; Liu, X. & Zhao, T. (2011): Target-dependent Twitter sentiment
classification. In Proceedings of the 49th Annual Meeting of the Association for Computational
Linguistics, Portland, Oreg., USA, 19.-24. Juni 2011, pp. 151-160.
Kim, S.-M. & Hovy, E. (2006): Automatic identification of pro and con reasons in online reviews. In
Proceedings of the Poster Session at the 21st International Conference on Computational Linguistics
and 44th Annual Meeting of the Association for Computational Linguistics, Sydney, Australia, 17.-
21. Juli 2006, pp. 483490.
Kushal, D.; Lawrence, S. & Pennock, D. M. (2003): Mining the peanut gallery: Opinion extraction and
semantic classification of product reviews. In Proceedings of the 12th World Wide Web Conference,
Budapest, Hungary, 20.24. Mai 2003, pp. 519528.
Ludwig, S.; de Ruyter, K.; Friedman, M.; Brüggen, E. C.; Wetzels, M. & Pfann, G. (2013): More Than
Words: The Influence of Affective Content and Linguistic Style Matches in Online Reviews on
Conversion Rates. Journal of Marketing 77:1, pp. 87-103.
O'Connor, P. (2010): Managing a Hotel's Image on TripAdvisor. In Journal of Hospitality Marketing &
Management. 19(7), pp. 754-772.
Qin, B.; Zhao, Y.; Gao, L. & Liu, T. (2008): Recommended or not? Give advice on online products. In
Fifth International Conference on Fuzzy Systems and Knowledge Discovery, Jinan, Shandong,
China, 18.-20. Oktober 2008, pp. 208-212.
Turney, P. (2002): Thumbs up or thumbs down? Semantic orientation applied to unsupervised
classification of reviews. In Proceedings of the 40th Annual Meeting of the Association for
Computational Linguistics, Philadelphia, Penn., 7.-12. Juli 2002, pp. 417-424.
Wiebe, J., Wilson, T., Bruce, R., Bell, M., & Martin, M. (2004): Learning subjective language. In:
Computational linguistics, 30(3), pp. 277-308.
... Because of the aforementioned fact that reviewers are not necessarily identical with patients (Geierhos and Bäumer, 2015), they have to trust the patients' reports. As reviewers are the legally liable persons when publishing reviews, their trust relationship with the patient is important. ...
... However, some PRWs force the users to confirm to be the treated person, i.e. reviewer and patient should be the same person. In this regard, observations have shown that this is not always the case, especially when parents rate for their children (Geierhos and Bäumer, 2015). Nevertheless, PRWs trust their reviewers who are, next to HCPs, the ones providing valuable content that make it desirable for others to access the website. ...
Chapter
Physician review websites are known around the world. Patients review the subjectively experienced quality of medical services supplied to them and publish an overall rating on the Internet, where quantitative grades and qualitative texts come together. On the one hand, these new possibilities reduce the imbalance of power between health care providers and patients, but on the other hand, they can also damage the usually very intimate relationship between health care providers and patients. Review websites must meet these requirements with a high level of responsibility and service quality. In this paper, we look at the situation in Lithuania: Especially, we are interested in the available possibilities of evaluation and interaction, and the quality of a particular review website measured against the available data. We thereby identify quality weaknesses and lay the foundation for future research.
Conference Paper
Consulting a physician was long regarded as an intimate and private matter. The physician-patient relationship was perceived as sensitive and trustful. Nowadays, there is a change, as medical procedures and physicians consultations are reviewed like other services on the Internet. To allay user’s privacy doubts, physician review websites assure anonymity and the protection of private data. However, there are hundreds of reviews that reveal private information and hence enable physicians or the public to identify patients. Thus, we draw attention to the cases when de-anonymization is possible. We therefore introduce an approach that highlights private information in physician reviews for users to avoid an accidental disclosure. For this reason, we combine established natural-language-processing techniques such as named entity recognition as well as handcrafted patterns to achieve a high detection accuracy. That way, we can help websites to increase privacy protection by recognizing and uncovering apparently uncritical information in user-generated texts.
Article
Full-text available
This paper presents a simple unsupervised learning algorithm for classifying reviews as recommended (thumbs up) or not rec- ommended (thumbs down). The classifi- cation of a review is predicted by the average semantic orientation of the phrases in the review that contain adjec- tives or adverbs. A phrase has a positive semantic orientation when it has good as- sociations (e.g., "subtle nuances") and a negative semantic orientation when it has bad associations (e.g., "very cavalier"). In this paper, the semantic orientation of a phrase is calculated as the mutual infor- mation between the given phrase and the word "excellent" minus the mutual information between the given phrase and the word "poor". A review is classified as recommended if the average semantic ori- entation of its phrases is positive. The al- gorithm achieves an average accuracy of 74% when evaluated on 410 reviews from Epinions, sampled from four different domains (reviews of automobiles, banks, movies, and travel destinations). The ac- curacy ranges from 84% for automobile reviews to 66% for movie reviews.
Conference Paper
Full-text available
Merchants selling products on the Web often ask their customers to review the products that they have purchased and the associated services. As e-commerce is becoming more and more popular, the number of customer reviews that a product receives grows rapidly. For a popular product, the number of reviews can be in hundreds or even thousands. This makes it difficult for a potential customer to read them to make an informed decision on whether to purchase the product. It also makes it difficult for the manufacturer of the product to keep track and to manage customer opinions. For the manufacturer, there are additional difficulties because many merchant sites may sell the same product and the manufacturer normally produces many kinds of products. In this research, we aim to mine and to summarize all the customer reviews of a product. This summarization task is different from traditional text summarization because we only mine the features of the product on which the customers have expressed their opinions and whether the opinions are positive or negative. We do not summarize the reviews by selecting a subset or rewrite some of the original sentences from the reviews to capture the main points as in the classic text summarization. Our task is performed in three steps: (1) mining product features that have been commented on by customers; (2) identifying opinion sentences in each review and deciding whether each opinion sentence is positive or negative; (3) summarizing the results. This paper proposes several novel techniques to perform these tasks. Our experimental results using reviews of a number of products sold online demonstrate the effectiveness of the techniques.
Conference Paper
Full-text available
Sentiment analysis on Twitter data has attracted much attention recently. In this paper, we focus on target-dependent Twitter sentiment classification; namely, given a query, we classify the sentiments of the tweets as positive, negative or neutral according to whether they contain positive, negative or neutral sentiments about that query. Here the query serves as the target of the sentiments. The state-of-the-art approaches for solving this problem always adopt the target-independent strategy, which may assign irrelevant sentiments to the given target. Moreover, the state-of-the-art approaches only take the tweet to be classified into consideration when classifying the sentiment; they ignore its context (i.e., related tweets). However, because tweets are usually short and more ambiguous, sometimes it is not enough to consider only the current tweet for sentiment classification. In this paper, we propose to improve target-dependent Twitter sentiment classification by 1) incorporating target-dependent features; and 2) taking related tweets into consideration. According to the experimental results, our approach greatly improves the performance of target-dependent sentiment classification.
Conference Paper
Full-text available
In this paper, we present a system that automatically extracts the pros and cons from online reviews. Although many ap- proaches have been developed for ex- tracting opinions from text, our focus here is on extracting the reasons of the opinions, which may themselves be in the form of either fact or opinion. Leveraging online review sites with author-generated pros and cons, we propose a system for aligning the pros and cons to their sen- tences in review texts. A maximum en- tropy model is then trained on the result- ing labeled set to subsequently extract pros and cons from online review sites that do not explicitly provide them. Our experimental results show that our result- ing system identifies pros and cons with 66% precision and 76% recall.
Conference Paper
Full-text available
Joint sentiment-topic (JST) model was previously proposed to detect sentiment and topic simultaneously from text. The only supervision required by JST model learning is domain-independent polarity word priors. In this paper, we modify the JST model by incorporating word polarity priors through modifying the topic-word Dirichlet priors. We study the polarity-bearing topics extracted by JST and show that by augmenting the original feature space with polarity-bearing topics, the in-domain supervised classifiers learned from augmented feature representation achieve the state-of-the-art performance of 95% on the movie review data and an average of 90% on the multi-domain sentiment dataset. Furthermore, using feature augmentation and selection according to the information gain criteria for cross-domain sentiment classification, our proposed approach performs either better or comparably compared to previous approaches. Nevertheless, our approach is much simpler and does not require difficult parameter tuning.
Article
The abstract for this document is available on CSA Illumina.To view the Abstract, click the Abstract button above the document title.
Conference Paper
Twitter is a micro blogging website, where users can post messages in very short text called Tweets. Tweets contain user opinion and sentiment towards an object or person. This sentiment information is very useful in various aspects for business and governments. In this paper, we present a method which performs the task of tweet sentiment identification using a corpus of pre-annotated tweets. We present a sentiment scoring function which uses prior information to classify (binary classification) and weight various sentiment bearing words/phrases in tweets. Using this scoring function we achieve classification accuracy of 87% on Stanford Dataset and 88% on Mejaj dataset. Using supervised machine learning approach, we achieve classification accuracy of 88% on Stanford dataset.
Article
Customers increasingly rely on other consumers' reviews to make purchase decisions online. New insights into the customer review phenomenon can be derived from studying the semantic content and style properties of verbatim customer reviews to examine their influence on online retail sites' conversion rates. The authors employ text mining to extract changes in affective content and linguistic style properties of customer book reviews on Amazon. com. A dynamic panel data model reveals that the influence of positive affective content on conversion rates is asymmetrical, such that greater increases in positive affective content in customer reviews have a smaller effect on subsequent increases in conversion rate. No such tapering-off effect occurs for changes in negative affective content in reviews. Furthermore, positive changes in affective cues and increasing congruence with the product interest group's typical linguistic style directly and conjointly increase conversion rates. These findings suggest that managers should identify and promote the most influential reviews in a given product category, provide instructions to stimulate reviewers to write powerful reviews, and adapt the style of their own editorial reviews to the relevant product category.
Article
User-generated content is rapidly gaining traction as an input into the consumer purchase decision making process. After examining the implications of the developing Web 2.0 phenomenon for travel businesses, this article focuses on TripAdvisor (http://www.tripadvisor.com), the largest online network of travel consumers. Using a sample of 100 hotels randomly selected from the London market, it shows that TripAdvisor displays detailed rich data that can be used in travel planning. Content analysis was used to identify common causes of satisfaction and dissatisfaction among reviewers. It was also discovered that few hotels are actively managing their reputation on the TripAdvisor site. Despite a facility to respond to criticism, few hotels used this option, calling into question how seriously hotels are managing user-generated content. Analyses also suggested that the belief that user-generated content sites have been compromised by false reviews is unfounded, with little evidence being found of reviews with characteristics that typify false postings.
Conference Paper
This paper introduces an opinion judgment system that automatically gives advice on whether to recommend this product and furthermore provides corresponding reasons. The core task of the system can be considered as a binary sentence sentiment classification problem. A novel "polar- ity word - target" related feature extraction method is pro- posed. An opinion judgment system is then built based on the sentiment of each sentence predicted by a maximum en- tropy (ME) classifier with the novel features. The experi- mental results on two domains show that the special fea- ture extraction methods are promising; the opinion judg- ment system with 91.5% average accuracy is highly effec- tive.