La recommandation via l’analyse d’opinions

La recommandation via l’analyse d’opinions

Classification des techniques de recommandation

La première mise en œuvre des systèmes de recommandation a été un système de recommandation de filtrage collaboratif appelé Tapestry [Goldberg 1992], qui a été développé au milieu des années 1990. Depuis lors, les systèmes de recommandation sont devenus un domaine de recherche important et indépendant. De nombreuses technologies de recommandation ont été développées en utilisant un large éventail de techniques statistiques, d’apprentissage automatique et de recherche d’information. Cependant, le filtrage collaboratif et les approches basées sur le contenu ont reçu beaucoup d’attention de la part de la communauté des systèmes de recommandation et ont été largement utilisés dans les systèmes commerciaux pour recommander des produits simples et fréquemment achetés. Il y a trois types de recommandation dont les plus utilisés dans la littérature sont la recommandation basée sur le filtrage par contenu et celle basée sur le filtrage collaboratif et leur hybridation.

. Recommandation basée sur le filtrage par contenu

Les systèmes de recommandation basés sur le contenu s’appuient sur des évaluations effectuées par un utilisateur sur un ensemble de documents. L’objectif est alors de comprendre les motivations l’ayant conduit à juger comme pertinent ou non un document donné. Le système peut alors proposer à l’utilisateur un choix parmi de nouveaux documents jugés proches des documents qu’il a précédemment appréciés [Burke 2002]. Le choix des documents proposés est basé sur une comparaison des thèmes abordés dans les documents par rapport aux thèmes qui intéressent l’utilisateur [Bechet 2013]. 

Recommandation basée sur le filtrage collaboratif

Contrairement au filtrage basé sur le contenu, le filtrage collaboratif crée des communautés en comparant les utilisateurs entre eux sur la base de leurs évaluations passées et chaque utilisateur reçoit les documents jugés pertinents par sa communauté sans analyser le contenu des documents [Bechet 2013]. Il s’appuie alors sur les appréciations données (des notes, des comptes d’achats effectués, des nombres de visites, etc) par un ensemble d’utilisateurs sur un ensemble de documents [Poirier 2011].Pour faire des prévisions basées sur des configurations des intérêts des utilisateurs, le filtrage collaboratif utilise des méthodes statistiques. Il n’y a donc pas d’analyse du contenu et un document n’est connu que par son identifiant [Bechet 2013]. 

Recommandation hybride

Comme le définit Burke dans son étude publiée dans [Burke 2002]. La recommandation hybride peut être vu comme étant une combinaison des méthodes traditionnelles précédemment présentées afin d’en palier les limites, ces dernières sont actuellement les plus représentées dans la littérature, notamment à cause du fait qu’elles soient jugées comme étant les plus efficaces. Selon ce dernier, un système hybride est généralement organisé en deux phases : 1. Effectuer de manière indépendante les filtrages des articles via des méthodes collaboratives ou par le contenu (ou autres). 2. Combiner ces ensembles de recommandations via des méthodes d’hybridations telles que des pondérations et des commutations [Burke 2002]. 

Les systèmes de recommandation basés sur le filtrage collaboratif

Comme nous l’avons mentionné ci-avant, le filtrage collaboratif s’appuie sur une collaboration directe ou indirecte entre les utilisateurs. Dans le cas d’une collaboration directe, ce sont les utilisateurs eux-mêmes qui s’échangent des articles, alors que dans la collaboration indirecte, c’est au système de générer des recommandations en se basant sur des degrés de similarité entre les usagers. En effet, le filtrage collaboratif se base sur l’idée que les utilisateurs à la recherche d’informations devraient se servir de ce que d’autres ont déjà trouvé et évalué. Dans la vie quotidienne, si quelqu’un a besoin d’une information, il essaye de s’informer généralement auprès de ses amis, ses collègues, qui vont à leurs tours lui recommander des articles, des films, des livres, etc. Cette collaboration entre les gens permet d’améliorer l’échange des connaissances. Cependant, cela prend beaucoup de temps vu que cette ressource d’information ne peut pas toujours être à notre disposition. C’est à partir d’ici que l’idée de filtrage collaboratif est née, le besoin d’automatiser et de rendre l’échange des expériences et des avis personnels de certaines personnes utilisables par d’autres. Selon Golberg [Goldberg 2001] le filtrage collaboratif est l’automatisation des processus sociaux. Le filtrage collaboratif est l’approche la plus utilisée pour produire des recommandations applicables dans beaucoup de domaines, il se base sur la similarité de comportement (achats, visites, clics, notes, etc.) entre les utilisateurs [Dragut 2017]. En résumé, les systèmes de filtrage collaboratif (SFC) fonctionnent en recueillant les commentaires des utilisateurs sous la forme des appréciations des éléments dans un domaine donné et exploiter les similarités de comportement entre plusieurs utilisateurs pour recommander un document.

Principe

Le filtrage collaboratif se base sur l’hypothèse que les utilisateurs à la recherche d’information devraient pouvoir se servir de ce que d’autres ont déjà trouvé et évalué. Il devient alors possible de traiter n’importe quelle forme de contenu et de diffuser des ressources non nécessairement similaires à celles déjà reçues. Pour ce faire, pour chaque utilisateur d’un système de filtrage collaboratif, un ensemble de proches voisins est identifié, et la décision de proposer ou non un document à un utilisateur dépendra des appréciations des membres de son voisinage [Berrut 2003]. En effet, le filtrage collaboratif emploie des méthodes statistiques pour faire des prévisions basées sur des configurations des intérêts des utilisateurs. Ces prévisions sont exploitées pour faire des propositions à un utilisateur individuel, en se basant sur la corrélation entre son profil et les profils des autres utilisateurs qui présentent des intérêts et des goûts similaires [Berrut 2003]. En effet, pour les systèmes de filtrage d’information collaboratifs, les utilisateurs fournissent des évaluations des documents, sous forme de notes, pour constituer leurs profils. Ces estimations sont comparées à celles des autres utilisateurs et les similitudes sont mesurées. Des prévisions sont calculées comme une moyenne pondérée des avis d’autres utilisateurs avec des goûts soit semblables, soit complètement opposés. Il n’y a donc pas d’analyse du sujet ou du contenu et un document n’est connu que par son identifiant [Maltz 1995].

Profil de l’utilisateur

Il est nécessaire de construire un profil de l’utilisateur courant afin de faire de la recommandation collaborative. Les profils des utilisateurs peuvent être construits à partir d’informations collectées de deux manières : – Construction passive : dans ce cas, on considère les documents sélectionnés par l’utilisateur en se basant sur son passif (les pages consultées, les produits achetés, etc). – Construction active : en proposant aux utilisateurs de remplir des questionnaires par exemple, ou encore en permettant aux utilisateurs d’attribuer des notes aux documents reflétant leurs intérêts. Selon la manière dont les informations ont été collectées, les profils des utilisateurs peuvent contenir soit les documents qu’ils ont appréciés ou non, soit des descripteurs. Ces descripteurs peuvent correspondre à des documents qu’ils ont notés, consultés ou être déduits des réponses au questionnaire. 16 Chapitre 1 Les Systèmes de Recommandation 16 Une fois les profils des utilisateurs et les documents sont construits, des mesures de similarités sont appliquées afin de comparer et trouver les documents correspondant le plus au profil des utilisateurs [Poirier 2011]. 

Processus du filtrage collaboratif

Comme il est illustré dans la Figure 1-2 , il y a trois étapes principales dans un processus de filtrage collaboratif : évaluation des recommandations, formation des communautés et production des recommandations [Nguyen 2006]. Figure 1-2 Processus du filtrage collaboratif [Nguyen 2006].

Evaluation des recommandations

Selon le principe de base du filtrage collaboratif, les utilisateurs doivent fournir leurs évaluations sur des documents afin que le système forme les communautés. Evaluer une recommandation peut se faire de façon explicite ou implicite : – Explicite : L’utilisateur donne une valeur numérique sur une échelle donnée ou une valeur qualitative de satisfaction, par exemple : mauvaise, moyenne, bonne et excellente. – Implicite : Le système induit la satisfaction de l’utilisateur à travers ses actions [Clemente 2015, Poirier 2010]. Par exemple, le système estimera qu’une recommandation supprimée correspond à une évaluation très mauvaise, alors qu’une page de recommandation imprimée ou sauvegardée peut être interprétée comme une bonne évaluation.

Formation des communautés

Le processus de formation des communautés est le noyau d’un système de filtrage collaboratif. Le système doit calculer la communauté pour chaque utilisateur. Cela se fait par la proximité des évaluations des utilisateurs en utilisant des mesures de similarités telles que les coefficients de Pearson, Spearman et Kendall qui vont être détaillées prochainement.

Production des recommandations

Une fois la communauté de l’utilisateur est créée, le système prédit l’intérêt qu’un document particulier peut être présenter pour l’utilisateur en s’appuyant sur les évaluations que les membres de la communauté ont faites sur ce même document. Lorsque l’intérêt prédit dépasse un certain seuil, le système recommande le document à l’utilisateur [Herlocker 2000, Herlocker 1999].

Table des matières

Introduction Générale
Chapitre 1. Les Systèmes de Recommandation
1.1. Introduction
1.2. La recherche d’information et le filtrage d’information
1.2.1. La recherche d’information
1.2.2. Le filtrage d’informations
1.2.3. Comparaison entre la recherche d’information et le filtrage d’information
1.3. Les systèmes de recommandation
1.3.1. Classification des techniques de recommandation
1.4. Les systèmes de recommandation basés sur le filtrage collaboratif
1.4.1. Principe
1.4.2. Profil de l’utilisateur
1.4.3. Processus du filtrage collaboratif
1.5. L’évaluation des systèmes de recommandation
1.6. Conclusion
Chapitre 2. L’Analyse des Sentiments
2.1. Introduction
2.2. Définition de l’analyse des sentiments
2.2.1. Tache de l’analyse des sentiments
2.2.2. Caractéristiques de l’analyse des sentiments
2.3. Les opinions trompeuses (spams)
2.3.1. Types de spams et de spamming
2.4. L’analyse des sentiments en arabe
2.4.1. La langue arabe
2.4.2. Traitement du discours arabe
2.5. Conclusion
Chapitre 3. Classification d’Opinions
3.1. Introduction
3.2. Processus de classification d’opinions
3.2.1. Acquisition du corpus
3.2.2. Prétraitement des données
3.2.3. Extraction des caractéristiques
3.2.4. Réduction de dimension
3.2.5. Classification
3.3. Conclusion
Chapitre 4. Combinaison de RSS-SVM avec les Algorithmes Génétiques pour l’Analyse d’Opinions en Langue Arabe.
4.1. Introduction
4.2. Motivation
4.3. Le processus proposé pour la détection de polarité d’opinions
4.3.1. Collection des données
4.3.2. Prétraitement automatique
3 4 4 Extraction de caractéristiques
4.3.4. Classification
4.4. Résultats expérimentaux et évaluation
4.4.1. Expérimentation-A
4.4.2. Expérimentation B
4.4.3. Etude comparative
4.5. Conclusion
Chapitre 5. La Recommandation via la Détection d’Opinions Trompeuses (Spams)
5.1. Introduction
5.2. Motivation
5.3. Partie 1 : le processus de détection d’opinions spams en arabe
5.3.1. Acquisition des données
5.3.2. Extraction des caractéristiques
5.3.3. Détection des opinions spams
5.4. Partie 2 : la recommandation via l’analyse d’opinions
5.4.1. Le filtrage collaboratif
5.4.2. Elimination des spams et classification des opinions vraies
5.4.3. La recommandation
5.5. Résultats expérimentaux et évaluation
5.5.1. Expérimentation1.a
5.5.2. Expérimentation 1.b
5.5.3. Etude comparative
5.5.4. Expérimentation
5.6. Conclusion

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *