Système mis en oeuvre pour la notation d’opinion

Système mis en oeuvre pour la notation d’opinion

Les besoins commerciaux

Avec la croissance du Web, le e-commerce est devenu très populaire. Beaucoup de sites Web offrent la possibilité de faire de la vente en ligne et donnent également la possibilité de mettre son propre avis en ligne sur des objets, des personnes, des produits et notamment des films. Les gens aiment généralement vérifier les recommandations des autres utilisateurs avant de se faire leurs propres opinions ou de faire leur choix.

Les prédictions en ligne sont donc devenues très utiles pour les clients. Pour prédire le choix potentiel, des systèmes de recommandation ang : Recommender System, RS ont été créés. Un RS permet de prédire un choix sans aucune connaissance personnelle des alternatives. Les Algorithmes des moteurs de prédiction sont basés sur l’expérience et l’avis des autres utilisateurs.

Il est utile de trouver des recommandations de personnes qui ont les mêmes goûts que nous, qui sont familiers avec le problème, ou qui sont des experts reconnus [Tarveen & Littman (2001)]. Un RS fournit des correspondances entre les utilisateurs qui ont le même profil. Un nouvel utilisateur doit donc créer son profil. Le moteur de prédiction proposera alors un nouveau choix limité basé sur le goût des autres utilisateurs qui ont le même profil.

La crédibilité du résultat du RS ne peut pas reposer sur des raisons commerciales, car cela pourrait rendre les gens méfiants. L’efficacité d’un tel système dépend de la qualité et de la quantité des données. Pour cette raison, le système présenté dans cette thèse four nit aux utilisateurs des profils qui sont nécessaires aux algorithmes des moteurs cognitifs.

L’objectif principal du système développé est de recueillir une énorme base de cri tiques cinématographiques avec leurs auteurs, et d’associer automatiquement les notes qui expriment des sentiments de la personne qui a écrit la critique.

Le résultat de ce traitement est la création de la base de données qui contient les profils des utilisateurs. Notre système est basé sur la représentation statistique et sémantique des documents. Notre travail est composé en partie de l’extraction et du filtrage de l’opinion du texte, et en partie de la notation des sentiments des phrases subjectives.

Le sujet de cette thèse m’a été proposé par l’équipe de chercheurs de l’entreprise Criteo qui développe un moteur de prédiction pour les critiques cinématographiques. Leurs besoins concernent la création d’un système autonome pour la détection et la no tation automatique de la critique cinématographique. Nous avons étudié et développé trois différentes méthodes de notation de l’opinion, nous avons effectué une étude com parative des trois méthodes et nous avons présenté les avantages et les inconvénients de chacune d’elles.

Nous présentons aussi un classificateur final pour combiner les différents résultats obtenus. Le système développé prépare la base de données d’entrées pour le système de prédictions. Notre système réalise les tâches suivantes :– Recherche automatique d’une critique cinématographique via internet,– Attribution automatique d’une note, allant de 1 à 5, par rapport aux sentiments décrits dans la critique,– Publication des résultats en générant les profils complets des utilisateurs. 

Architecture du système

Notre système possède une architecture modulaire. Ses tâches principales sont les suivantes : recherche et collecte des critiques sur Internet, attribution d’une note aux critiques et présentation des résultats. 60 5.2 Architecture du système Chaque tâche est réalisée par un module spécialisé [Figure 5.1]. En premier lien, pour la partie de la notation de l’opinion, nous avons développé trois méthodes différentes pour l’attribution d’une note à une critique.

Ces méthodes sont basées sur les différentes approches de la classification du document. En deuxième lien, nous avons développé pour chaque méthode un classificateur qui assigne séparé ment la note [Dziczkowski & Wegrzyn-Wolska (2008b)]. Nous avons, par conséquent obtenu trois notes pour chaque critique peuvant être différentes.

Nous avons finalement utilisé un autre classificateur qui assigne la note finale à la critique cinématographique, fondée uniquement sur les trois notes attribuées antérieurement pendant le processus de classification [Dziczkowski & Wegrzyn-Wolska (2008a)]. Pour le calcul de la note f inale, nous avons utilisé les valeurs des trois notes obtenues précédemment avec leurs probabilités

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *