Réseaux bayésiens dynamiques formalismes, caractéristiques, exemples

Réseaux bayésiens dynamiques formalismes, caractéristiques, exemples

Ce chapitre propose une présentation théorique des réseaux bayésiens dynamiques. Après une brève description des modèles espace-état, quelques rappels théoriques sur les modèles graphiques sont introduits. Ils permettent de déﬁnir les réseaux bayésiens dynamiques et de mettre en évidence leur aptitude à modéliser un processus temporel comme la compréhen- sion de la parole. Les modèles stochastiques que nous avons conçus pour la génération de fragments de struc- tures sémantiques sont à base de réseaux bayésiens dynamiques (DBN). Les bases théoriques déﬁnissant les DBN sont rappelées dans ce chapitre. Comme la plupart des situations liées à l’activité humaine, le processus de com- préhension ne peut être étudié sans considérer sa dimension temporelle. La compréhen- sion d’un messaLes modèles espace-état intègrent la distinction entre les variables observées (par ex- emple les mots…) et les variables cachées (par exemple les frames sémantiques associées au fragment de message). Ils permettent de représenter les relations de dépendances et de causalités dans un cadre temporel (Dean et Kanazawa, 1989).Les modèles graphiques sont des outils de représentation efﬁcaces des modèles espace-état. Alliant théorie des probabilités et théorie des graphes, les modèles graphiques permettent de représenter de façon factorisée des distributions jointes de probabilitéssur un ensemble de variables aléatoires. Une étude exhaustive des capacités de modéli- sation, d’inférence et d’apprentissage de ces modèles est proposée dans (Jordan, 1998). ge impose l’utilisation d’observations multiples au cours de sa formu- lation. L’analyse de ces observations séquentielles a pour but de capturer le sens du segment de message observé en utilisant les connaissances issues des précédents seg- ments. Le sens et les variables sémantiques utilisées pour le représenter n’étant pas observés, la modélisation du processus par des modèles espace-état est adéquate.

Dans le cadre de ce travail, les modèles graphiques étudiés sont des modèles dirigés acycliques, nommés Réseaux bayésiens (Pearl, 1986, 1998). Ces réseaux utilisent conjoin- tement connaissances d’experts et observations dans le cadre inférentiel bayésien. Le graphe dirigé acyclique modélisant la structure du réseau est déterminé par l’expert qui ﬁxe les relations de dépendance entre les variables du modèle. La distribution de probabilités jointe sur l’ensemble des variables du modèle est ensuite déﬁnie en util- isant les propriété de décomposition propres aux modèles graphiques rappelées dans la section 7.2 suivante. ∈ E du graphe associé au réseau bayésien représentent les dépendances entre les variables. On dit que u ∈ V est un parent de v ∈ V si (u, v) ∈ E. L’ensemble des nœuds parents d’un nœud v est noté pa(v). Les ﬁls de v sont les nœuds dont v est un parent. Les descendants de v sont les nœuds ﬁls de ﬁls et leurs descendants. Si le graphe du réseau est complet, soit au pire cas, la factorisation (7.4) est équiv- alente à la factorisation générale (7.2) à l’ordre des variables près. Dans tous les autres cas, d’autant plus favorables que la densité du graphe est faible, le calcul de la loi jointe est très simpliﬁée par l’utilisation de la factorisation (7.4).Les réseaux bayésiens décrits dans ce paragraphe ne peuvent appréhender que des ensembles ﬁnis de variables aléatoires. Ils ne sont donc pas aptes à modéliser le pro- cessus de la compréhension orale dans sa dimension temporelle et séquentielle. De nouveaux types de réseaux ont été proposés pour représenter les processus temporels en conservant les atouts des réseaux bayésiens. Il s’agit des réseaux bayésiens dynamiques étudiés dans le paragraphe suivant.Les réseaux bayésiens dynamiques (Dynamic Bayesian Network, DBN) étendent la notion de réseaux bayésiens à la modélisation de distributions de probabilités sur des ensembles dénombrables de vecteurs aléatoires. Les phénomènes étant modélisés dans un espace d’états, ces vecteurs aléatoires représentent les variables observées, cachées et inférées du modèle. Une étude exhaustive des DBN est présentée dans (Mihajlovic et Petkovic, 2001) et (Murphy, 2002).L’aspect dynamique d’un DBN est lié à sa faculté de modéliser l’évolution temporelle d’un phénomène. La structure du réseau bayésien choisi pour représenter le phénomène n’évolue pas avec le temps. En revanche, les distributions de probabilités associées aux états successifs de ce réseau sont dépendantes de la succession temporelle des observa- tions. Ces dépendances sont supportées par les variables aléatoires de transition entre deux états successifs. Les DBN permettent la modélisation des dépendances entre les variables du réseau bayésien au temps t ainsi que celles liant deux étapes temporelles successives t − 1 et t. Un DBN modélise donc un système dynamique.