Grammaires locales étendues principes

Grammaires locales étendues principes

Dans le chapitre 3 nous avons étudié les grammaires locales et leur pertinence pour traiter des problèmes liés au traitement automatique des langues (tal). Nous avons défini une grammaire locale (lg) comme un formalisme de description de règles syntaxiques ou sémantiques sous forme de graphe. Nous avons également étudié la représentation d’une grammaire locale par des réseaux de transitions récursifs (rtns) qui peuvent être vus comme des grammaires non-contextuelles (cfgs) dans lesquelles on admet que les membres droits des règles soient des automates finis au lieu de simples séquences de symboles.De plus, nous avons évoqué le fait que ces grammaires peuvent également reconnaître des langages contextuels (type 1) et sans restriction (type 0) en reconnaissant tout d’abord un langage régulier (type 3) ou non-contextuel (type 2) et en appliquant par la suite une opération pour exclure les séquences qui n’appartiennent pas au langage à reconnaître (0 ou 1).

Bien que la possibilité d’établir des contraintes sur les variables reste un atout indispensable pour augmenter le pouvoir de reconnaissance des grammaires locales, la non-standarisation des opérateurs parmi les outils disponibles, leur nombre réduit, le fait qu’il soit complexe de mettre en œuvre de nouvelles opérations sans modifier l’algorithme d’analyse syntaxique sous-jacent, ainsi que l’impossibilité de les paramétrer, de les adapter et de les modifier pour s’ajuster à différents types de problèmes, continuent à limiter la puissance de reconnaissance des grammaires locales. Entre autres, est en jeu la capacité d’une grammaire locale à conserver un bon niveau de précision, tout en améliorant leur rappel.

Dans ce chapitre nous introduisons la notion de grammaire locale étendue (elg) comme une extension des grammaires locales classiques, plus particulièrement nous nous concentrons sur les grammaires locales qui sont représentées par des graphes syntaxiques et qui sont utilisés pour la recherche de motifs. Dans ce sens, il s’agit également d’un formalisme permettant de décrire formellement des ensembles de séquences grammaticales acceptées. Cependant, à la différence d’une grammaire locale, dans une grammaire locale étendue, il est possible d’associer aux étiquettes de sortie des transitions, des symboles non-terminaux qui représentent des appels à des actions conditionnelles, appelées fonctions étendues. Ces fonctions sont évaluées à l’extérieur de la grammaire, c’est-à-dire, en dehors de l’analyseur syntaxique.

Ainsi, alors qu’une grammaire locale permet uniquement de décrire des motifs syntaxiques ou sémantiques, une elg peut en plus effectuer, au cours de l’analyse, des opérations arbitraires basées, par exemple, sur les motifs et sur l’état de l’analyse. Les fonctions étendues ont la possibilité de recevoir des paramètres, de réaliser des traitements, et de renvoyer comme résultat des symboles terminaux à concaténer à la sortie de la transition. Comme telles, les fonctions étendues peuvent être utilisées pour augmenter le pouvoir transformationnel des grammaires locales : repérer – en tolérant les fautes inattendues – des motifs dans un texte, puis les normaliser,les enrichir, les valider, les mettre en relation ou les baliser à la volée.

Aperçu général

Le graphe 4.1 représente une grammaire locale étendue pour la reconnaissance de dates. La fonction étendue llike (looks like) vérifie si une séquence inconnue, stockée dans la variable d, est similaire (avec un seuil maximal de 2) à un nom de jour, de même, elle teste, dans la deuxième appelle, si la séquence stockée sur la variable m est similaire à un nom de mois.La fonction étendue llike utilise une approche naïve pour rechercher approximati- vement un motif p (input) dans une liste W (e.g. ’January’,’February’,…). Des autres approches sont plus adéquates à mettre en œuvre. Cependant, ce qui est important à retenir est que l’analyseur syntaxique ne connaît pas à l’avance cette fonction étendue et n’est pas responsable de son évaluation. Cela implique que la fonction peut être modifiée ou améliorée sans changer l’algorithme d’analyse syntaxique, et même sans apporter des changements au graphe graphe 4.1, et donc sans le recompiler.

De plus, une grammaire locale étendue enrichit le modèle des grammaires locales par un nouveau formalisme qui permet d’ajouter, par des transitions étiquetées, des fonctions conditionnelles qui sont externes à l’analyseur syntaxique. Ces fonctions permettent d’inclure ainsi, à la volée, dans les analyses effectuées, la combinaison d’une ou plusieurs approches, comme des calculs mathématiques, des manipulations de chaînes de caractères, des analyses statistiques, l’interrogation de bases de données, ou l’exploitation d’autres ressources utiles.

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *