Aperçu sur les automates et les transducteurs
Dans le domaine d’EI, divers formalismes (automates à nombre fini d’états, les transducteurs et les réseaux de transition) sont exploités par les chercheurs afin d’aboutir des modèles formels définissant rigoureusement leurs méthodes proposées. Cependant, ces formalismes peuvent ne pas répondre exactement à leurs besoins au niveau d’analyse lexicale des données traitées. L’analyse morphologique est parfois non abordée par ces formalismes lors du traitement des phénomènes linguistiques associés aux langues ayant une morphologique complexe. Au niveau d’analyse sémantique, les travaux de recherches existants se bloquent car ils n’ont pas abouti à un compromis au sein d’un formalisme exploité sur le couplage de l’extraction des informations à partir d’un texte et leurs annotations. La protection des informations extraites et annotées reste encore une responsabilité non prise en compte par certains formalismes. Ces informations doivent être protégées pour subir d’autres traitements pouvant engendrer des ambiguïtés. L’ordonnancement des instructions réalisées par le formalisme choisi devient un défi car son absence rend la tâche à réaliser manque de précision et souffre d’un taux d’erreurs élevé. En fait, l’existence de l’ordonnancement reste insuffisante jusqu’à fixer un ordre précis défini pour éviter l’ambiguïté. La manipulation des informations à extraire via un formalisme nécessite aussi une plateforme linguistique assurant son fonctionnement et son adaptation aux besoins d’applications à réaliser. La plateforme linguistique doit fournir un bon enchainement des tâches et fournir des nouveautés par rapport à celles fonctionnant d’une façon classique.
Le présent chapitre se compose de sept parties dont la première est dédiée à donner un aperçu sur le formalisme d’automate. Cette partie inclut la présentation du principe de fonctionnement d’un automate et ses différents types associés. Dans la deuxième partie, nous abordons l’automate à nombre fini d’états à travers sa présentation formelle et l’explication des opérations qu’il peut subir avec des exemples. Dans la troisième partie, nous expliquons les réseaux de transition et les types qu’ils peuvent avoir via des exemples. La présentation des transducteurs à nombre fini d’état se fait dans la partie quatre via sa représentation formelle et celle graphique qui est dépendante et indépendante d’une plateforme linguistique. Nous donnons aussi les domaines d’application des transducteurs à nombre fini d’états en s’appuyant sur des exemples explicatifs. Dans la cinquième partie, nous rappelons le principe d’une cascade de transducteurs et les applications qui l’exploitent dans divers domaines vont être illustrées dans la partie six. La dernière partie s’intéresse à la présentation de la plateforme linguistique Unitex qui est dédiée au TAL et qui manipulent les transducteurs à nombre fini d’états. Dans cette partie, nous nous effectuons une comparaison entre Unitex et une autre plateforme via divers critères.
Un automate est un modèle abstrait qui n’a pas une existence physique. Ce modèle permet de traiter l’information à travers la transformation d’un problème donné à un langage. Notamment, l’automate essaie d’analyser chaque élément de ce langage transformé pour résoudre le problème posé. Plusieurs applications du TAL reposent sur la notion d’automate parmi lesquelles nous citons l’analyse lexicale, morphologique et syntaxique et la REN plus précisément les systèmes basés sur l’approche symbolique [Fehri, 2012 ; Mesfar, 2008]. Le principe de fonctionnement d’un automate est décrit comme suit : étant donné que le problème est découpé en instances, chaque instance est représentée par un mot. Par la suite, un test sera effectué consistant à voir si ce mot appartient au langage représentant ce problème ou non. En se basant sur le résultat positif ou négatif de ce test, l’automate décide si le problème admet une solution ou non. Schématiquement, un automate est caractérisé par un ensemble de variables discrètes d’entrée, de sortie et d’états internes. Dans ce travail, nous nous intéressons à plusieurs types d’automates : les automates à nombre fini d’états, les réseaux de transition et les transducteurs. La représentation de chaque type est effectuée de divers diagrammes de transitions. En fait, il existe une équivalence entre certains types. Dans ce qui suit, nous commençons par l’automate à nombre fini d’états. 2.2. Automate à nombre fini d’états déterministe ou non déterministe Etant donné un automate non déterministe A, il existe un automate déterministe A’ qui recon- naît le même langage [Straubing et Weil, 2012]. Néanmoins, la différence entre les deux auto- mates est que les automates finis déterministes possèdent un seul état initial I= {q0}.