Classiﬁcation des lexèmes en microclasses

Classiﬁcation des lexèmes en microclasses

Ce chapitre propose une classiﬁcation ﬂexionnelle en microclasses au sein desquelles tous les paradigmes sont caractérisés par des patrons identiques. Les microclasses peuvent se dé- duire à partir des patrons d’alternance. Elles sont fondées sur l’identité du comportement ﬂexionnel : chaque microclasse est caractérisée par un vecteur de patrons, où chaque coor- donnée du vecteur indique le patron instancié pour cette microclasse pour une paire de cases de paradigme. La classiﬁcation des paradigmes en microclasses constitue le point de départ des entreprises de classiﬁcation plus ambitieuses présentées dans les chapitres 5 et 6. Les systèmes de microclasses méritent cependant d’être étudiés en tant que tels, ne serait-ce que parce que les critères permettant de les inférer sont relativement simples et consensuels.Nous décrivons tout d’abord dans la section 4.1 les distributions des fréquences de types de microclasse. Dans la section 4.2, nous décrivons les réseaux de similarités entre microclasses en suivant la méthodologie de Sims et Parker (2016). Enﬁn la section 4.3 explore l’utilité de l’inférence de structure hiérarchiques arborescentes pour observer les relations de distances et de similarité entre microclasses.Comme nous l’avons discuté au chapitre 1, section 1.3.3, les microclasses forment une clas- siﬁcation très ﬁne, distinguant la moindre variation dans le comportement ﬂexionnel. Pour cette raison, le nombre de microclasses trouvées est généralement considérablement plus haut que le nombre de macroclasses présentées dans les grammaires descriptives. Le tableau 4.1 indique le nombre de microclasses obtenu, pour chaque système ﬂexionnel étudié dans cette thèse, à l’issue du chapitre 2. Nous comparons le nombre de microclasses au nombre de pa- radigmes de surface pour chaque lexique. Dans le cas du français, de l’anglais, du portugais européen et de l’arabe, le nombre de paradigmes coïncide avec le nombre de lexème.

Dans les systèmes bipartites, c’est à dire en russe, en chatino et en navajo, nous comptons le nombre de paradigmes distincts pour chaque dimension. Par exemple, en navajo, notre lexique comporte 2157 lexèmes, qui s’analysent en 805 paradigmes de base On distingue trois situations concernant la proportion de paradigmes par microclasses : en anglais, français, portugais les classes sont peu nombreuses comparé au nombre de para- digmes, résultant en des microclasses comportant en moyenne quelques dizaines de formes. Cette situation correspond à l’intuition selon laquelle les microclasses constituent des sous- généralisations plus précises que des macroclasses. Le système segmental du russe, le système tonal du chatino de Zenzontepec et le système verbal de l’arabe présentent des ratios intermé- diaires, manifestant une généralisation moins forte des paradigmes aux microclasses.distinctes en surface. On trouve un ratio autour de 1 également pour le système accentuel du russe, le chatino de Yaitepec, et le système segmental du chatino de Zenzontepec. Ces ratios sont très bas, soulignant le fait qu’une partition de microclasses constitue un mauvais modèle de la structure de ces systèmes ﬂexion- nels. S’il existe dans ces systèmes des similarités et des relations implicatives entre formes, comme nous l’avons vu dans le chapitre 3, elles ne s’organisent pas en microclasses. Autrement dit, les relations d’interprédictibilité locales à certaines paires de formes ne se combinent pas en faisceaux de relations parallèles. Notons que les systèmes du chatino et le système accentuel du russe présentent seulement un petit nombre de paradigmes de surface uniques. Pour le chatino, il se peut que nos données présentent principalement des paradigmes exemplaires de micro- classes, et qu’en conséquence, les fréquences de type des microclasses ne constituent pas un échantillon réaliste. En chatino comme pour le système accentuel du russe, il y a suﬃsamment peu de formes distinctes pour qu’il soit imaginable qu’un locuteur puisse les mémoriser.

La proportion de paradigmes par microclasse nous renseigne cependant très peu sur les distributions de leur taille. Les deux ﬁgures 4.1 présentent les distributions de fréquence de type de microclasses par rang pour chaque système. Nous pourrions nous attendre à ce que les systèmes présentant un très faible nombre de paradigmes par microclasse en moyenne suivent une distribution distincte. Pour cette raison, nous produisons deux ﬁgures distinctes selon que le ratio est supérieur ou inférieur à 5 paradigmes par microclasses. Dans les deux cas, les dis- tributions des fréquences de type des microclasses suivent une loi de puissance (les deux axes des ﬁgures sont présentés à l’échelle logarithmique). Il existe toujours peu de microclasses très fréquentes, et beaucoup plus de microclasses très rares (1 lexème). Cette observation rejoint celles de Blevins, Milin et Ramscar (2017) discutées au chapitre 3 concernant l’organisation zipﬁenne du lexique.