Analyse des sentiments
Dans le chapitre précédent nous avons introduit le terme Opinion Mining. C’est le domaine qui s’occupe de traitement d’opinion, du sentiment, et de la subjectivité dans le texte et nous avons précisé que c’est un sous domaine de la catégorisation de texte. Les principales tâches de l’Opinion Mining sont l’analyse de l’opinion et l’analyse de la subjectivité. Cette dernière est utilisée pour reconnaitre le langage décrit l’opinion afin de distinguer les langues objectives. Le terme Opinion Mining apparaît dans un article de Dave [Dave et al. (2003)] qui a été publié dans l’acte de conférence WWW 2003. Selon Dave, l’Opinion Mining devrait « traiter un ensemble de résultats de recherche pour un cas donné, générer une liste des attributs (qualité, caractéristiques, etc.) et agréger des avis sur chacun d’entre eux (mauvais, modéré, de bonne qualité). Toutefois, l’Opinion Mining a récemment été interprétée de manière plus générale pour inclure de nombreux types d’analyse d’éva- luation de texte [Liu (2006)].Le terme « Analyse des Sentiments » est utilisé pour décrire l’analyse automatiquede texte évaluatif et pour la recherche de valeur prédictive des jugements. Elle a été introduite dans les travaux de Das et Chen [Das & Chen (2001)] et Tong [Tong (2001)] en 2001 afin d’analyser des sentiments dans le cadre de l’économie de marché. En- suite d’autres travaux sur l’analyse des sentiments ont été proposés par Turney [Turney (2002)] et Pang et al [Pang et al. (2002)]. Depuis 2002, un nombre important d’articles citant l’Analyse des Sentiments ont vus le jour, ces travaux se concentrent sur la classi- fication des commentaires et à leur polarité (positif ou négatif). Aujourd’hui, l’Opinion Mining et l’Analyse des Sentiments font partie du même domaine de recherche.
Connaitre l’opinion des autres personnes a toujours été un élément d’information important durant le processus de décision. Les gens très souvent demandent à d’autres de leur recommander un mécanicien d’automobiles ou d’expliquer leur choix de votes aux élections par exemple. Avant de prendre des décisions, les gens s’intéressent énor- mément aux avis des autres personnes dans différents domaines. Ils consultent les avis des autres consommateurs avant d’effectuer un achat, ou regardent les avis des autres personnes avant de voir un film au cinéma ou avant d’acheter un disque. Grace à l’In- ternet nous pouvons découvrir les opinions et les expériences de très grand nombre de personnes qui ne sont ni nos amis, ni les experts de domaines, mais des gens qui peuvent avoir les mêmes goûts que nous, et donc leurs opinions peuvent être très utiles pour nous avant de faire notre choix et d’avoir notre propre idée sur un sujet donné. Aujourd’hui, de plus en plus de personnes donnent leur avis sur différents sujets, ces avis sont à la disposition de tout le monde sur internet. Selon les sondages [comScore/the Kelsey group (2007), Horrigan (2008)], 81% des utilisateurs de l’Internet ont fait au moins une fois la recherche en ligne sur un produit et environ 80% parmi eux déclarent que les opinons des autres personnes ont une in- fluence significative sur leur décision d’achat, ce qui représente un très grand nombre de personnes. Environ 30% ont fourni un avis sur un produit, sur un service ou sur une personne en ligne via un système de notation, ce qui n’est pas insignifiant comme nombre. Pour cette raison, c’est à dire grâce a l’intérêt que les utilisateurs montrent pour les opinions sur les produits et les services, ainsi que l’influence potentielle qu’exercent de tels avis, les fournisseurs des articles montrent une très grande attention au déve- loppement des systèmes de notations [Hoffman (2008)].
Avec l’explosion du Web 2.0, des plates-formes comme les blogs, des forums de discussion, de réseau Peer-to-Peer, et divers autres types de moyens de communication sociale, les consommateurs ont à leur disposition une tribune sans précédent, de portée et de puissance, permettant de partager leurs expériences et de marquer leur avis (positif ou négatif) sur n’importe quel produit ou service. Les entreprises peuvent répondre aux besoins des consommateurs en effectuant de la surveillance et de l’analyse des opinions pour améliorer leur produit [Zabin & Jefferies (2008)]. Malheureusement le risque de modification des opinions est important. De ce fait, il est nécessaire d’avoir un système capable d’analyser automati- quement les comportements généraux liés à la consommation, afin de mieux comprendre comment les différents produits et les services sont perçus par les clients. Un tel système devra premièrement collecter des opinions des consommateurs et des utilisateurs dans des documents qui montrent les opinions et les phrases subjectives. Par- fois, cela est relativement facile, comme dans les cas de grands sites où les opinions des utilisateurs sont bien structurées comme par exemple Epinions.com, Imdb.com, Ama- zon.com. Le problème devient plus complexe dans le cas des blogs, qui contiennent aussi des parties de texte subjectives, mais les documents souhaités dans les blogs peuvent varier assez largement dans le contenu, le style, la présentation et même en niveau de grammaticalité. Il est très intéressant de travailler sur des commentaires venant des blogs car ils sont plus pertinents que les sites de vente, et généralement ils expriment mieux l’intensité des opinons.