Terminologie et informatique rétrospective des rapports entre deux disciplines du XXe siècle

Terminologie et informatique rétrospective des rapports entre deux disciplines du XXe siècle

Nous avons vu que la pratique terminographique a précédé de quelques siècles la naissance de la terminologie comme discipline, qui n’a vu le jour que dans les années 1930. Le XXe siècle a donné également le jour à une autre discipline qui a radicalement changé la vie des hommes : l’informatique. Née dans le contexte de la Seconde guerre mondiale, l’informatique trouve dans Alan Turing un de ses pères. Si pendant longtemps les ordinateurs ont été surtout au service du monde politique et militaire (notamment dans le cadre de la Guerre froide), dans l’espace de quelques décennies ils ont complètement réorganisé le monde du travail, au moins dans les pays les plus industrialisés. Ces derniers, nous l’avons vu dans le chapitre 1 de la partie I, sont aussi les pays où la terminologie a connu le plus grand développement. Évidemment, ce n’est pas un hasard, la terminologie allant de pair avec le progrès scientifique et technique. Pour cette raison, la terminologie ne pouvait que trouver dans l’informatique un allié précieux pour se développer. Commencés dans les années 1960, les rapports entre ces deux disciplines n’ont fait que s’intensifier, au point qu’il est désormais impossible de parler de terminologie sans parler d’informatique. Dans ce chapitre, nous retraçons les étapes saillantes de cette alliance.

Wüster et l’informatique

Lors de la présentation de la TGT, nous avons laissé de côté la section 5, dans laquelle Wüster expose le rapport entre terminologie et informatique. Quelle définition l’ingénieur autrichien donne-t-il de l’informatique ? « De toutes les sciences dont nous avons parlé jusqu’ici, l’informatique est la plus jeune. C’est la science de la construction et de l’utilisation des ordinateurs. Les ordinateurs ne servent pas uniquement à effectuer des opérations mathématiques. Ils constituent également une aide technique capitale pour une autre science qui n’est pas beaucoup plus vieille que l’informatique, la science de la documentation et de l’information, d’où le nom d’informatique. » (1981 : 102) À l’époque où ces lignes étaient écrites56, les ordinateurs exerçaient principalement deux tâches : le stockage des données et la recherche documentaire, menée par le biais de descripteurs ou de notations. Les premiers sont des mots-clés recueillis dans des thésaurus, c’est-à-dire des dictionnaires structurés sur une classification de notions, tandis que les seconds sont simplement des séries de chiffres ou de lettres. À l’époque, ces systèmes de descripteurs reçoivent l’appellation de langue de descripteurs, langage d’indexation ou langage documentaire. À propos des classifications des notions sur lesquelles ils reposent, Wüster regrette le fait que souvent confusion est faite entre les systèmes logiques et ontologiques de notions, en raison d’un mauvais usage de la part des spécialistes de thésaurus des termes de générique et de spécifique57. Dans cette partie de la TGT il présente alors les trois abréviations indispensables qui sont employées dans l’élaboration d’un thésaurus et qui sont empruntées à l’anglais : BT (Broader Term), NT (Narrower Term) et RT (Related Term). Elles désignent respectivement la notion générique (l’hyperonyme), la notion spécifique (l’hyponyme) et la relation partie-tout (le méronyme). Un autre écart que WÜSTER constate entre les classifications informatiques et les principes terminologiques concerne les classifications thématiques : « Dans le domaine de l’information, la notion de classification est souvent plus large que dans celui de la terminologie. Cette notion s’étend non seulement aux systèmes logiques et ontologiques de notions, mais également à ce que j’ai proposé d’appeler classification thématique. D’autres auteurs ont utilisé l’expression classification documentaire, qui n’apparaît pas, cependant, comme suffisamment claire. Une classification thématique ressemble quelque peu à une table des matières comportant des divisions. Les subdivisions d’une partie sont des thèmes spécifiques de la partie principale, le thème générique. Thèmes spécifiques et thèmes génériques ne sont pas néanmoins nécessairement des spécifiques ou des notions de partie. Il est, de plus, regrettable que l’on nomme souvent thèmes génériques et thèmes spécifiques des notions génériques et des notions spécifiques, car cela crée des problèmes de compréhension. » (1981 : 104) Une suite de plusieurs descripteurs constitue une étiquette, associée à une information dans l’ordinateur, qu’il est possible de demander par conjonction ou disjonction de thèmes. Comme on peut le constater, la visée normative observée dans les autres sections de la TGT intéresse aussi la section concernant l’informatique. Cela est particulièrement évident à propos de l’élaboration des thésaurus, que Wüster définit comme « un processus de normalisation » (1981 : 105). Ce dernier passe par trois étapes : 1) l’établissement d’une classification de notions ; 2) la sélection de ces notions par l’analyse des grades des séries verticales de notions ; 3) la sélection des termes, qui donne comme résultat la suppression des synonymes et, possiblement, des homonymes. Si la première et la troisième étape de ce processus ne présentent pratiquement pas de différence avec la normalisation générale de la terminologie, la deuxième étape est spécifique du travail d’élaboration d’un thésaurus. 

Un rapport basé sur un intérêt commun 

les concepts CABRÉ opère une distinction entre le type de rapport que la terminologie entretient avec des disciplines comme la linguistique, la logique et l’ontologie et le rapport qui la lie à l’informatique et à la documentation. Si, d’une certaine façon, la terminologie puise des principes théoriques dans les premières pour se constituer en domaine d’étude, elle entretient avec les secondes des relations qui sont plutôt des relations d’échange : « La terminologie fournit à la documentation et à l’informatique sa réflexion sur les concepts ; celles-ci, en utilisant les éléments théoriques de la terminologie, élaborent des outils d’une très grande utilité pour la terminologie, surtout appliquée. […] D’une part, la terminologie ne peut plus se passer de l’informatique pour mener à bien son travail ; de l’autre, la terminologie fournit à l’informatique des éléments qui lui permettent de faire des progrès dans le domaine de l’intelligence artificielle, surtout dans la construction de systèmes-experts. De fait, ce qui réunit la terminologie et l’informatique, ce sont les concepts. Les concepts sont les unités qui constituent […] la base des connaissances. […]Le concept est à la base tant de la théorie de la terminologie que de celle de l’intelligence artificielle. » (1998 : 101) Cette réflexion sur les concepts couvre désormais des champs très vastes d’application, dont les plus importants sont sans doute la recherche d’informations (RI) et l’extraction d’informations (EI). La première nécessite une tâche préalable telle que l’indexation des documents, à laquelle on peut parvenir par le biais de différentes méthodes. Les types d’index produits peuvent être variés. En ce qui concerne la deuxième, « [Elle] consiste […] à rechercher des éléments spécifiques, définis par la tâche d’extraction, dans des textes non structurés (en langage naturel) et à les caractériser selon les catégories définies au préalable. Ce processus peut être vu comme une étape de (pré)traitement destiné à produire un document plus propice au traitement automatique, ou au contraire, si les informations extraites constituent le résultat attendu, comme un aboutissement. » (KEVERS 2011 : 33) CHAUDIRON situe la terminologie dans le champ plus vaste de l’ingénierie linguistique, dont l’objectif primaire est la conception et l’élaboration d’outils facilitant l’accès à l’information, devenu d’autant plus problématique avec l’avènement d’Internet : « La question du traitement automatique de l’information textuelle sur Internet est une question clé. L’extension des réseaux induit un bouleversement des besoins informationnels, qui se caractérise par une nécessité accrue d’identifier et de traiter l’information en (presque) temps réel, de détecter les indices d’une modification de l’environnement, de filtrer l’information la plus adaptée au contexte d’usage, de naviguer facilement dans des volumes de données toujours plus imposants. » (2005 : 25) Dans ce contexte, la terminologie recouvre une double fonction : elle permet de structurer l’information et de cerner ainsi des domaines de connaissance et aussi de rendre plus performants les logiciels conçus pour le traitement automatique de l’information. Il en ressort que la terminologie fait l’objet de « […] deux approches complémentaires : une première approche qualifiée de vue informationnelle qui considère les terminologies comme la ressource essentielle de la gestion de l’information et une seconde approche qualifiée de vue logicielle dans laquelle la – 60 – terminologie est considérée comme une ressource linguistique nécessaire au bon fonctionnement des logiciels d’ingénierie linguistique. » (CHAUDIRON 2005 : 26) L’auteur représente le traitement informationnel comme un cycle constitué de trois éléments : l’univers informationnel, les terminologies spécialisées et les outils d’ingénierie linguistique. Dans ce cycle, les terminologies spécialisées décrivent des univers informationnels et les fournissent à l’ingénierie linguistique, qui les gère par le biais d’outils. Suivant les applications, la terminologie peut se configurer tant comme ressource linguistique indispensable – cela surtout dans le cas d’applications de TAL comme la traduction automatique, le filtrage d’informations ou le résumé automatique – que comme le produit d’outils d’ingénierie linguistique – comme les extracteurs de termes, que nous analyserons plus loin. De son côté, KEVERS souligne que le problème de l’accès à l’information n’est pas spécifique de l’ère numérique, mais était déjà connu dans le domaine des sciences documentaires (2011 : 31). La continuité entre terminologie et documentation58 est d’autant plus évidente lorsque l’on passe en revue les applications, les techniques et les outils mis au point pour celles-ci : dans ce qui suit, nous aurons souvent l’occasion de constater que bon nombre de techniques utilisées dans les sciences documentaires ont ensuite été « recyclées » en terminologie. 

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *