Démarche d’investigation lexicologique. Explications en réponse aux critiques de Rotgé
Établissement heuristique de répertoires non exhaustifs
À la différence de l’étymologie structurale, la théorie de la saillance ne prétendra que partiellement étudier des structures morpho-sémantiques pour corroborer telle ou telle étymologie. Le but premier sera d’établir des invariants pré-morphématiques (éléments articulatoires, submorphémiques ou graphématiques) ou, plus tard, poétiques, sous-jacents à ces structures. Par suite, il conviendra de détecter des figures d’analogie, des mécanismes motivationnels qui supposent une corrélation sur les plans sémantique et sémiologique de deux ou plusieurs mots et dont le signifiant se fait le signal.
La première étape consiste paradoxalement en l’intuition du locuteur-observateur du langage. Nous opérerons à la lecture de dictionnaires de langue, d’usage mais aussi de revues de presse, de romans, des recoupements des emplois dans la langue écrite ou orale avec des formes que nous tenterons de relier sémiologiquement. Cela invite à l’élaboration de répertoires les plus exhaustifs possible autour d’un même invariant en partant soit de la forme soit du sens.
Or, de la même manière que ce que précise Philps concernant le marqueur sub-lexical <sn-> lié à la notion de « bucco-nasalité » :
Si l’on érige les deux identités constatées ci-dessus, à savoir l’identité sémiologique (sn-) et l’identité notionnelle (bucco-nasalité) en critères d’appartenance à un ensemble, l’on crée, ce faisant, une métaclasse lexicale composée des seuls « mots en sn- » qui attestent ces deux critères, métaclasse dont sont exclus, par définition, les mots qui ne les attestent pas […].
On ne trouve donc pas ici une systématique mais une pertinence de rattachement structural / saillanciel fondée à la fois sur l’isotopie des racines étudiées et sur les mécanismes corrélatoires dont usent ou ont usé les locuteurs pour « associer des mots » par le biais de l’invariant, ce qui démontre sa « productivité ». Outre les mécanismes détectés et mis en lumière par Guiraud, Nemo ou Eskénazi, nous tenterons d’en déceler de nouveaux et d’autres de types différents au cours de la phase d’application en nous basant sur des critères exclusivement analogiques.
La question de la « suffisance isotopique »
Il est difficile de déterminer avec précision quelle serait l’isotopie minimale pour corroborer l’existence et la viabilité d’une saillance. L’entreprise est en réalité plus complexe.
En effet, si le critère quantitatif assure bien évidemment un certain degré de pertinence de l’analyse, le critère qualitatif entre aussi en ligne de compte car toutes les formes n’existent pas ni toutes les natures saillancielles ne sont sollicitées. De même, le statut saillanciel conditionne largement la quantité de vocables structurés. Par exemple, la fonction poétique du langage laisse entrevoir des mises en systèmes différentes de celles émergeant dans les énoncés plus usuels .Les actualisations de ce type de saillance sont certes infinies mais très nettement plus ponctuelles. La saillance poétique reste pourtant le signal d’adoption d’un angle de vue plutôt que d’un autre.
Ainsi, malgré parfois une faible isotopie de l’invariant, il est possible que des correspondances inversives ou analytiques, des modulations de voisement, des corrélations graphiques, etc. soient discernables et légitiment le positionnement théorique autour de cette saillance.
La prise en considération des usages discursifs
Wilfrid Rotgé met en garde contre la recherche exclusive de l’invariant linguistique en omettant les emplois en énoncé :
La première conclusion à laquelle on peut se livrer est que les arguments utilisés contre la recherche du fondamental, du central, de l’invariant doivent avoir pour effet de nous prémunir d’un danger, celui de se limiter à une telle recherche. Il est essentiel de ne jamais perdre de vue les effets produits par un opérateur donné.
Il est en effet inconcevable de ne pas tenir compte de la praxis. Pour notre part, il conviendra, dans la mesure du possible, d’observer les effets de sens en tentant de les rationaliser par le niveau saillanciel. Il ne faudra pas évincer des exemples sous prétexte que l’actualisation ne soit pas effective, ne serait-ce que parce que les mots d’un lexique donné ne pourraient être (ou avoir été) tous motivés selon nos critères. Cette quête ne saurait, au demeurant, en aucun cas être exhaustive à l’échelle de l’ensemble des répertoires détectés et analysés. Car notre objectif est en réalité à visée au moins double. Il s’agira, dans un premier temps, de corroborer l’existence et la pertinence de la notion de saillance telle que nous l’entendons sur un nombre de vocables le plus important possible. Ensuite, il nous incombera d’opérer des recoupements avec des emplois plus ou moins fréquents pour constater telle ou telle actualisation. Enfin, nous vérifierons dans un troisième temps, si certains signifiants, parmi les centaines qui composent notre corpus, ont connu plusieurs actualisations donnant lieu à des cas instaurés de polyréférentialité. Précisons que la mise en contexte des mots étudiés ne pourra non plus être ni systématique ni exhaustive dans ce travail. Nous la limiterons aux cas qui le nécessiteront le plus.
Calcul des coefficients saillanciels
Au cœur de cette problématique, se trouvera donc la question de la fréquence des différents emplois et c’est à ce moment-là que nous nous servirons de ce que nous nous proposons de nommer la coefficience saillancielle. Il ne s’agit pas de la fréquence d’emploi des signifiants eux-mêmes mais de l’usage de ces signifiants en fonction de l’angle de vue adopté, c’est-à-dire de la fréquence d’exploitation d’une saillance donnée. Le calcul se fera sur la base du pourcentage des emplois impliqués par chaque macrosigne. Le constat se fera en panchronie, puis amené à une échelle de < 1 à 10. Cela nous permettra de prendre en charge les usages discursifs sans pour autant les hiérarchiser au sens où l’on accorderait moins d’intérêt aux emplois peu habituels car ils sont tous autorisés (ou l’ont été) par le signifiant.477 Les coefficients instaureront alors des degrés sur une échelle la plus précise possible. Les corpus servant de référence seront le CREA et le CORDE, dont les données seront ensuite ajoutées et appliquées. Cette problématique de la fréquence de sollicitation saillancielle suggère toutefois des orientations différentes en fonction de l’idiome concerné. C’est pour cela que nous devrons poser plus avant dans l’exposition de la méthodologie la question du traitement des données statistiques des formes canoniques.
Le risque d’un invariant trop abstrait
La quête de la saillance, comme écrit précédemment pour le marqueur sub-lexical, impose de ne pas poser un « sens » mais un macro-signe communs. Et une fois de plus, le lexique, à la différence de la grammaire, et a fortiori les discours poétiques, plus ouverts, présentent des possibilités de structurations plus larges. Cette théorie ne partira donc pas en quête de l’invariant minimal impliquant tout le lexique mais essaiera de montrer des organismes, voire des systèmes lexicaux révélant des propriétés spécifiques, ce que nous nommerons des paramètres. Si ces structures ne sont pas hermétiques, nous pourrions nous orienter vers une autre actualisation saillancielle possible relevant d’une nouvelle structure (cf. chapitres quatrième et cinquième), démarche contraire à celle consistant à chercher un invariant toujours plus abstrait.
De l’instauration de corrélations
La conception de toutes les dimensions du signifiant comme factrices de corrélations
Fort de l’importance accordée à la motivation relative, vous nous proposons de chercher des phénomènes motivationnels récurrents générateurs ou intégrateurs basés sur des faits d’ordres articulatoire, phonétique mais également graphique ou synesthésique. Par exemple, si les phonosymbolistes ont déjà remarqué et statistiquement identifié des structures en conférant à certains sons des capacités expressives, à leur tour, ces sons représentent des saillances potentielles et les autres mots qui les contiennent sont, de ce fait, sujets à remotivation. Il en va de même pour le symbolisme graphique. Nous essaierons alors d’illustrer la prise en compte par le système de ces paramètres pour signifier. Cela nous permettra aussi de montrer à quel point la motivation n’est ni quantitativement ni qualitativement homogène en adhérant à ces propos de Guillaume et en les appliquant à la sémiologie : […] le sine linguistique fixe dans la langue une condition invariante à partir de laquelle se développent des conséquences en nombre illimité: toutes celles qui s’avèrent possibles dans les limites, constamment respectées, de la condition définie.478
En effet, étudier le domaine lexical, où l’on décèle souvent une moindre systématicité, implique, plus encore qu’en grammaire, la prise en considération d’une certaine flexibilité. Et cette flexibilité passe aussi par une « décompositionnalité » du signifiant qui repose sur un principe complexe.
La question de la « décompositionnalité » du signifiant
Dans ce travail, nous utiliserons les termes déjà employés de segment ou de (dé)segmentation du mot pour évoquer un fragment de signifiant plus ou moins long mais composé d’au moins deux phones et transcendant parfois les syllabes. Ainsi, pour traiter les cas de rincón et esquina, nous exposons que -inc- [ink] et -quin- [kín] sont des segments internes. Les segments ont donc une longueur qui se définit le plus souvent en fonction des autres que l’on retrouve dans les mots du même champ lexical. Le « découpage » sera ainsi fonction des autres mots morpho sémantiquement voisins, ainsi que nous l’avons évoqué en les mises en cohérence opérées, c’est-à-dire en vertu des actualisations saillancielles détectées. Cette approche découle du postulat de non-distinction entre autonomies et nonautonomies syntaxiques, mais aussi morphologiques.
Exploration de données statistiques pour la prise en compte des contraintes
Si depuis le début de ce travail, nous nous référons régulièrement à l’économie, qu’elle soit articulatoire ou linguistique, c’est qu’il est reconnu qu’elle acquiert une réelle portée dans l’ensemble du langage, et qu’elle lui impose des contraintes importantes. La méthode que nous prétendons ébaucher ici ne saurait se passer de données statistiques sémiosyntaxiques et, d’abord, sur la distribution des phones, notamment les permissions et les interdictions combinatoires. Il convient donc de recourir à des logiciels informatiques de recoupements en fonction de critères précis sur un corpus donné pour entamer une telle démarche. Nous avons donc créé, en collaboration avec Damien Grégoire, ingénieur en informatique, un programme apte à la reconnaissance, au recensement de tels binômes et à leur rendu statistique correspondant, basé sur le corpus de mots OTA. Nous avons cherché toutes les combinaisons phonétiques possibles que le système espagnol permettait afin d’établir plus scientifiquement les raisons de la non-sollicitation d’une forme. Il est en effet nécessaire de déterminer au préalable si une forme n’existe pas, n’est que peu ou très peu usitée, ou tout simplement évincée des possibilités d’actualisations saillancielles d’une structure donnée. Par exemple, un trop grand décalage par rapport aux proportions calculées au niveau du (sous-)système lexical relèverait d’un paramétrage propre à la structure.
Chaque système dispose en effet de contraintes spécifiques et on est en droit de penser qu’il en va de même pour chaque structure. S’appuyant sur des écrits de Nitsch et de Herzog, Jakobson relève, par exemple, qu’à l’inverse de nos langues néo-latines, « aucune correspondance n’est admise [en tchèque] entre consonnes voisées et non-voisées, de sorte que les mots tchèques [boty, boky, stopy, kosy, sochy] ne peuvent rimer avec body, doby, kozy, rohy. » De même, dans les chants de certains peuples indiens d’Amérique tels que les Pimapago et les Tepecano, la distinction phonématique entre plosives voisées et non-voisées et entre plosives et nasales est remplacée par une variation libre, tandis que la variation entre labiales, dentales, vélaires et palatales est rigoureusement maintenue.
Ce contraste avec ces deux langues d’aires linguistiques totalement distinctes et éloignées amène le Maître russe à penser que, dans ces langues, en poésie, les consonnes perdent deux traits distinctifs sur quatre : voisé / non voisé et nasal / oral, et conservent deux autres grave / aigu et compact / diffus. La sélection et la stratification hiérarchique des catégories agissantes constituent un facteur de première importance pour la poétique, sur le plan phonologique comme sur le plan grammatical.
Or, si cela vaut pour la poésie, lieu où les signifiant agissent le plus souvent comme facteurs motivants, ces contraintes sont également un cadre dans lequel s’instaure chaque possibilité de motivation du signifiant lexical par structuration paradigmatique. Par exemple, si une modulation de voisement ne pourra être prise en compte pour corréler les deux signes kosy / kozy en tchèque, elle pourra l’être en espagnol pour meter / medir. Sur cette base, lesstructurations pourront ou ne pourront pas se faire, en fonction de ce paramètre. Or, ce phénomène module nettement les capacités structurelles internes ou leur en fait solliciter d’autres distinctes.
Ce travail a cependant besoin de limites et ne saurait traiter des questions de façon exhaustive. Aussi est-il important désormais de délinéer concrètement notre approche.
Délimitations quantitatives et qualitatives de la méthode : questions pratiques, champs d’application et corpus
Quelle structuration des questions abordées ? Nouveau découpage lié aux indiscriminations postulées
Une approche par étude de cas
Du fait des postulats posés, il s’avère difficilement possible de mener une analyse autrement que par des études de cas. Pour chacune d’entre elles, nous exposerons d’abord sous forme de bref répertoire ou autre, les acceptions du DRAE et / ou d’autres dictionnaires au cas où l’on y détecterait des « sens complémentaires » accompagnés, au besoin, des indications étymologiques (dont la datation) extraites du Diccionario crítico etimológico castellano e hispánico de Corominas et Pascual. En certaines occasions, nous nous autoriserons à émettre nos propres hypothèses, ce qui sera alors précisé par la mention « hipótesis propia ». S’ensuivra l’analyse des sens et des formes en cohérence avec la démarche et le plan envisagés. Les structures que nous entreprendrons de mettre au jour seront donc, à l’instar de la démarche de Guiraud (1986), recherchées dans un optique onomasiologique ou sémasiologique, ou encore dans une perspective de comparaison des termes co-référentiels, des polyréférentiels, et des énantiosèmes pour mettre en exergue certains mécanismes. Nous pourrons alors recourir au test de la commutation en nous appuyant la plupart du temps sur des usages réels. Les périphrases élucidatoires utilisées par les Académiciens seront également une source de détection de termes proches sémantiquement.
Limites méthodologiques. Ce qui n’est pas le propos
Même si nous tenterons d’examiner les signifiants avec le plus de précision possible, nous ne prendrons pas en compte les éléments supra-segmentaux et ce, pour au moins deux raisons. Premièrement, nous avons préféré, pour l’heure, nous orienter vers des motivations percevables dans les corpus dictionnairiques. Deuxièmement, l’étude du supra-segmental ne nous aurait concerné que dans le cadre du chapitre septième portant sur l’étude du discours poétique. Nous restons toutefois convaincu qu’il est des motivations possibles au sein du discours qui passent par le prisme de la prosodie et nous pensons ajouter ce paramètre à nos futures recherches.
Il ne s’agira pas non plus ici de déterminer à partir de quel stade de rapprochement sémiologique, deux mots sont bien potentiellement en corrélation morpho-sémantique. Les observations conduiront aux conclusions nécessaires. Nous tenterons néanmoins d’en dresser des continuums et un tableau des mécanismes en fin de travail pour spécifier le lieu d’exercice de chacun. Nous allons en outre essayer de placer un maximum de vocables étudiés dans des énoncés extraits des corpus mentionnés supra, notamment dans des cas d’usage « insolite », s’avérant épineux ou trop éloignés du sens premier. Nous recourrons également aux mises en Il serait possible d’évoquer plusieurs systèmes lexicaux car il sera fait parfois référence à des termes propres à certains pays d’Amérique du Sud ou Centrale. contextes lorsque nous souhaiterons faire apparaître une nuance d’ordre sémantique et non pas conceptuelle.
Ce ne sera toutefois pas l’objet d’illustrer les centaines de sens répertoriés mais plutôt d’en déceler des invariances et d’opérer des recoupements de mécanismes que manifesterait la forme.
Enfin, comme précisé plus haut, la théorie de la saillance se veut avant tout morphosémantique. La syntaxe ne sera donc pas traitée ici. De notre avis, une méthode plus globale qui viserait à analyser conjointement les éléments phonologiques, phonétiques, morphologiques, et syntaxiques n’y parviendrait ni avec les mêmes outils ni avec la même précision. D’autres approches partent de la morphosyntaxe pour déceler les mécanismes liés à la motivation et pour montrer les interactions discursives du signifiant / signifié à ce stade plus tardif de la sémiotisation : la mise en phrase. C’est ce à quoi contribuent magistralement, depuis plusieurs années, Jean-Claude Chevalier, Marie-France Delport, Yves Macchi et d’autres tenants de la « linguistique du signifiant ». 485 Ainsi, les hypothèses qui seraient tenues pour non pertinentes par la méthode de la saillance, pourrait étayer une argumentation probante au niveau syntaxique et inversement.
Choix et justification du corpus. Apports de l’abord critique de la lexicographie
Les supports d’investigation seront les lexiques espagnol et hispano-américains. Nous nous baserons sur un corpus de mots issus de dictionnaires unilingues espagnols divers. Il nous sera ainsi possible de couvrir toutes les époques et tous les registres de langue. Nous utiliserons des dictionnaires d’usage (Diccionario de uso del español, María Moliner ou le CLAVE), plusieurs dictionnaires de langue contemporains (Diccionario de la lengua española, Real Academia Española ; Diccionario del español actual, Manuel Seco et alii) et anciens (Tesoro de la lengua castellana o española de Sebastián de Covarrubias, 1611 et le Diccionario de Autoridades, 1726) principalement. Nous pourrons aussi consulter le Nuevo Tesoro Lexicográfico de la Lengua Española (NTLLE) pour accéder à d’autres éditions anciennes du DRAE. Nous userons en parallèle d’un dictionnaire étymologique : le Diccionario crítico etimológico de la lengua castellana e hispánica, de Joan Corominas et José Pascual. Nous nous servirons aussi du dictionnaire récent de Aquilino Sánchez Pérez qui se base sur le corpus Cumbre de près de vingt millions de mots et qui, en sus, présente l’avantage de comporter un index de fréquence d’emploi des vocables.
Les dictionnaires de mots co-référentiels, polyréférentiels et énantiosémiques nous seront utiles pour déterminer quelles saillances sont concernées dans chacun des cas pouvant provoquer cette « coïncidence ». Notre approche, ainsi dynamisée, ne se limitera donc pas à la description et à l’analyse de répertoires structurés. Nous utiliserons également quelque peu les dictionnaires techniques ou d’argot pour mettre en lumière les manifestations d’actualisations saillancielles remarquables dans un langage spécialisé. Dans tous ces cas, nous tâcherons de faire un « bon usage de la commutation » en consultant le site Internet www.wordreference.com. Cela nous permettra ainsi un cadrage plus étendu pour porter notre attention sur les changements de signifiants et de signifiés qui se sont opérés à travers l’histoire et sur les coïncidences et les différences résultatives en espagnol actuel. La deuxième raison de ce recours à un corpus dictionnairique réside dans ce que les signes s’y trouvent pré-classés en paradigme suivant leurs segments initiaux ou finaux. Aussi, le travail de reconnaissance morphologique s’en trouvera-t-il facilité. L’informatique sera d’une aide précieuse pour la suite de la confection du corpus. Nous userons en effet des banques de données de la Real Academia Española installés sur Internet (CREA et CORDE, respectivement synchronique et diachronique), le Corpus del español de Mark Davies (www.corpusdelespanol.org) ainsi que www.google.es afin d’illustrer les résultats collectésau cours du travail de recherche. Cela aura pour objet de compléter la recherche dictionnairique et d’étendre plus précisément la réalité référentielle d’un vocable donné, ainsi que le corpus OTA pour les formes canoniques.