Ressources commerciales disponibles au catalogue de l’ELDA
Dans cette partie, nous fournissons une évaluation qualitative des ressources commerciales disponibles au catalogue de l’ELDA (http://www.elda.org/), pertinentes au regard des objectifs du projet Sémoteur. Les différentes ressources sont désignées par leur intitulé au catalogue de l’ELDA, les éléments de présentation synthétique sont en partie ceux fournis par le catalogue, ou par les éditeurs de ressource.
Les ressources examinées ci-après ont été sélectionnées sur les critères suivants : • lexique électronique en langue française ; • informations syntaxiques sur les entrées verbales, nominales ou adjectivales, indiquant le nombre (valence) et le type de compléments (cadre de sous-catégorisation) ; • informations sémantiques sur les entrées présentes dans la ressource. Les tarifs indiqués sont ceux relevés dans le catalogue ELDA.
ELRA-L0005 Lexique Français Les informations ci-dessous sont tirées du catalogue ELDA; • Vocabulaire général • Entrées : 50 000 • Format : ASCII • Support : disquette, cartouche QIC 150 MB Le lexique français lanTmark se répartit selon les catégories suivantes : noms (36.000), verbes (6.000), adjectifs (7.000), adverbes (1.000). Chaque entrée comporte des informations morphologiques (flexions, marques de superlatif et comparatif), informations syntaxiques (traits de position, genre, marqueurs de complément et arguments de verbe), informations sémantiques (lexico-sémantiques pour les noms et les adjectifs).
Prix Membres Prix Non Membres Academic – Commercial 48000.00 EUR Academic – Commercial 80000.00 EUR Academic – Research 6000.00 EUR Academic – Research 10000.00 EUR Commercial – Commercial 48000.00 EUR Commercial – Commercial 80000.00 EUR Commercial – Research 48000.00 EUR Commercial – Research 80000.00 EUR Évaluation L’intérêt de cette ressource réside dans la richesse d’informations disponibles, notamment aux niveaux syntaxique et sémantique :
« marqueurs de complément et arguments de verbe » et informations « lexico-sémantiques pour les noms et les adjectifs ». Toutefois, aucun échantillon ou exemple de description ne sont fournis. Par ailleurs, la date d’édition (1997), ainsi que les supports de stockage indiqués laissent augurer d’une ressource ancienne, qui n’a pas fait l’objet de mises à jour récentes. Le prix demandé pour cette ressource,
au regard de son caractère relativement obsolète, semble exagéré. 38 ELRA-M0001 Lexique multilingue de base (MEMODATA) Les informations ci-dessous sont tirées du catalogue ELDA. • Entrées : 30 000 pour chaque langue • Langues : français, anglais, italien, allemand, espagnol • Format: ASCII ou ANSI avec séparateurs entre les entrées • Support : CD-ROM Les mots sont associés par leur sens. Les catégories lexicales sont : noms (5 * 18 000), verbes (5 * 8 000), adjectifs (5 * 6 000), adverbes (5 * 1 500).