Impact de la fréquence sur l’abstractivité du lexique
Les informations théoriques présentées dans la première partie du rapport nous permettent de constater que d’après la littérature, des mots concrets et abstraits ont un impact sur la complexité de la perception d’un texte par les personnes ayant des difficultés de lecture. Étant donné qu’une expérience avec un groupe contrôle et un groupe de personnes ayant des troubles du langage était impossible, nous avons décidé de commencer par mener une expérience avec des normo lecteurs. Le but de cette première étude était de savoir si les mots polysémiques abstraits ou concrets étaient facilement repérables par des normo lecteurs. Nous avons établi l’hypothèse que la reconnaissance d’un mot comme concret ou abstrait est affectée par la fréquence d’un mot donné, des mots fréquents sont plus concrets par rapport à des mots moins fréquents. Nous avons ajouté à cette hypothèse la possibilité de corrélation avec la longueur d’une phrase (la quantité de contexte) et la position du mot cible dans la phrase. Les mots fréquents et les mots rares ont été sélectionnés à l’aide d’une base de données Lexique (New et al., 2001). Le critère de fréquence de cette ressource a été obtenu à partir des livres (plus de 50 pour les mots fréquents, moins de 30 pour les rares). La longueur des mots était contrôlée – tous les stimuli se composent de sept lettres et appartiennent à la catégorie grammaticale de nom. Parmi les mots ont été sélectionnés ceux qui, selon la ressource ReSyf (Billami et al., 2018), base lexicale de synonymes classés par le degré de difficulté et désambiguïsés sémantiquement, ont plusieurs sens abstraits et concrets (par exemple, ‘branche’, ‘rapport’, ‘contact’, ‘courant’).
Participants et tâche
Pour l’annotation il était nécessaire de trouver un contexte approprié pour chaque mot : un contexte aussi proche que possible du sens abstrait ou concret du concept (La dernière fois qu’il est allé en prison, il a explosé le plafond de ses cartes de crédit. – sens abstrait ; À cause du trou L’expérience a été réalisée en mars 2019. 27 personnes l’ont participée gracieusement, dont 25 francophones natifs et 2 avec une bonne maîtrise de la langue (niveau C). L’âge moyen des participants est 26 ans avec un niveau universitaire entre Bac+1 et Bac+8 (Annexe 2). 72 stimuli avec des contextes ont été randomisés et mélangés pour éviter de répéter le même mot un par un. Le questionnaire comprenait trois colonnes, une colonne avec des phrases et deux colonnes pour la réponse concrète et abstraite (cf. Annexe 1). La tâche des annotateurs était de lire la phrase et classer le mot cible en contexte comme abstrait ou concret. Notre étude a consisté à analyser la perception des mots concrets et abstraits par les lecteurs, afin de déterminer la dépendance du niveau d’iconicité principalement par rapport à la fréquence du mot (Annexe 3).
Les paramètres de comparaison et d’analyse, obtenus à l’aide de la méthode de calcul Kappa de Fleiss (1981) et la formule simplifiée de calcul de gamma de Gwet (2008) pour obtenir l’accord entre les annotateurs pour chaque stimulus. Aussi pour le niveau d’iconicité a été pris le pourcentage de réponses ‘concret’ par rapport à toutes les réponses pour chaque stimulus. Nous avons utilisé le logiciel R pour tous les opérations statistiques. Le niveau d’accord de Kappa de Fleiss était 0,309, ce qui correspond à un accord faible (attendu pour la tache de décision sémantique). Les résultats montrent qu’il n’y a pas de rapport entre la fréquence et l’accord ni pour les stimuli avec l’accord important ni pour ceux avec l’accord moyen et faible. En général, il y a même l’effet inverse : parmi les stimuli avec la plus grande valeur d’accord, il y a plus des mots rares et parmi les stimuli avec un accord faible il y a plus de mots fréquents. Pour les stimuli avec l’accord important les participants ont annoté 16 stimuli fréquents et 20 stimuli rares, pour l’accord faible : 20 stimuli fréquents et 16 rares (cf. Annexe 4). Une telle distribution peut être expliquée par le fait que les mots fréquents ont une application plus large et ont éventuellement plus de synonymes, ce qui rend difficile leur définition dans une catégorie particulière.