Télécharger le fichier original (Mémoire de fin d’études)
Rappel des objectifs de la thèse
Cette thèse s’inscrit dans le projet FABOAM (Fixed Access, Backhaul and core net-work OAM) du programme de recherche NOEMI (Network OpEration, administration, Maintenance and Integration) d’Orange Labs dont l’objectif est de développer des Opé-rations d’Administration et de Maintenance (OAM) pour la gestion flexible et automa-tisée des équipements et des périphériques réseau, afin de faciliter l’exploitation et la valorisation des réseaux. Les travaux de cette thèse se focalisent sur le développement d’un outil de diagnostic automatique des réseaux d’accès fixes bien qu’ils soient suffi-samment génériques pour être appliqués à d’autres types de réseaux. L’objectif est de dé-passer les méthodes courantes de diagnostic basées sur des règles spécialisées qui ont déjà montré leurs limites lorsque la dimension du réseau à diagnostiquer est grande et les signatures de pannes très diversifiées. L’idée sous-jacente est de développer une mé-thode de diagnostic qui s’appuie sur un modèle ou une représentation explicite de la structure et du fonctionnement du réseau en faisant recours aux méthodes probabilistes de gestion de l’incertitude puisque le fonctionnement d’un réseau encore appelé propa-gation de pannes et d’alarmes est un phénomène non déterministe en plus d’être dis-tribué et parfois dynamique. L’objectif opérationnel pour l’opérateur de télécommunica-tion Orange est d’améliorer les performances de localisation de pannes du système expert DELC (Diagnostic Expert de la Ligne Cliente) actuellement en exploitation dans son sys-tème de gestion des réseaux d’accès cuivre et optique, et de réduire ainsi les coûts relatifs aux interventions dans les infrastructures.
Synthèse des contributions
Modèle générique
Bien que l’objectif opérationnel de la thèse se focalise sur les réseaux d’accès, nous avons proposé une méthode générique qui facilite la modélisation de tout système distri-bué y compris les réseaux de télécommunications. Cette méthode repose sur un principe simple : modéliser le fonctionnement ou le comportement d’un réseau revient à modéli-ser le comportement de chacun des composants qui le constituent. Chaque composant est modélisé par deux graphes de dépendances acycliques (DAG) : un DAG qui modélise la propagation locale de pannes et d’alarmes sur le composant considéré et autre DAG qui modélise la propagation distribuée de pannes et d’alarmes entre ce composant et les composants voisins auxquels il est connecté. En effet, nous séparons la propagation locale de pannes et d’alarmes sur un composant, de la propagation distribuée entre com-posants connectés. Procédant de cette façon, nous modélisons également la topologie du réseau. Le modèle générique est organisé en trois couches. La couche 1 contient l’en-semble des DAGs modélisant la propagation distribuée entre composants connectés. La couche 2 contient l’ensemble des DAGs modélisant chacun la propagation locale sur un composant. Les couches 1 et 2 sont conçues de telle sorte que leur combinaison donne un large DAG qui modélise le fonctionnement du réseau tout entier. Mais la séparation entre la propagation locale et la propagation distribuée, implémentée par les couches 1 et 2, décompose ce large DAG en plusieurs parties interconnectées apportant ainsi des propriétés de modularité et d’extensibilité au modèle. La couche 3 est une représentation en arbre de jonction du réseau bayésien obtenu en probabilisant le large graphe. Notons que cette méthode générique apporte une solution permettant de réduire la complexité de modélisation des réseaux de très grande dimension. En effet, on peut modéliser le ré-seau de façon incrémentale, c’est-à-dire composant après composant. Le modèle du ré-seau peut donc être modifié facilement pour s’adapter aux éventuelles évolutions de son architecture. En effet, de nouveaux composants peuvent être ajoutés dans le modèle ou être retirés du modèle lorsque l’opérateur le souhaite.
Diagnostic du réseau d’accès optique GPON-FTTH
La méthode générique a été appliquée pour modéliser la propagation de pannes et d’alarmes sur le réseau d’accès optique GPON-FTTH. Nous avons commencé par mo-déliser deux des trois composants d’un PON du réseau GPON-FTTH : les composants OLT et ONT situés aux extrémités d’un PON. Les paramètres de ce modèle initial ont été approximativement déterminés sur la base des connaissances expertes relatives au fonctionnement du réseau GPON-FTTH. Une implémentation en Python appelé PANDA 1.0 de ce modèle ainsi que de l’algorithme d’inférence sur un arbre de jonction, nous a permis de doublement valider ce modèle initial. La validation consiste à vérifier que le modèle donne des résultats tout à fait cohérents et raisonnables vis-à-vis de l’expertise métier du réseau GPON-FTTH. Dans un premier temps, la vérification est faite avec des cas de diagnostic simples générés en laboratoire sur une plateforme expérimentale. Dans un second temps, la vérification est faite avec des cas de diagnostic réels issus du réseau GPON-FTTH commercial de l’opérateur Orange. L’outil PANDA 1.0 donne des résultats de diagnostic cohérents avec l’expertise métier du réseau d’accès GPON-FTTH, et plus raisonnables sur un échantillon de cas de diagnostic représentatifs, que le système expert à base de règles DELC.
Puisqu’il est très difficile même pour des experts avérés d’un réseau de déterminer avec précision les paramètres d’un modèle statistique de ce réseau, nous avons pensé que les performances de diagnostic du modèle probabiliste seraient meilleures si les pa-ramètres de ce modèle sont artificiellement appris à partir des données générées par les équipements du réseau. Une étude détaillée de l’algorithme EM (Expectation Maximiza-tion) a été réalisée et nous avons ajusté automatiquement les paramètres « experts » du modèle initial en appliquant l’EM sur des données réelles du réseau GPON-FTTH. No-tons que l’EM a été initialisé avec les paramètres « experts » afin d’être sûr qu’il converge vers de nouveaux paramètres plus vraisemblables aux données du réseau GPON-FTTH que les paramètres « experts ». Cette seconde implémentation a été appelée PANDA 2.0 et ses performances sont raisonnablement meilleures que ceux de PANDA 1.0 sans toutefois s’en écarter considérablement, ce qui veut dire que les paramètres « experts » de PANDA 1.0 ont bien été calibrés.
Cependant, les deux premières versions de l’outil PANDA sont des implémentations d’un modèle partiel ou initial du réseau GPON-FTTH. En effet, le modèle initial n’effectue que le diagnostic de bout en bout d’un PON puisqu’il ne contient que les composants aux extrémités du PON. Nous avons proposé une extension du modèle initial appelé PANDA 3.0 en y intégrant le modèle du réseau de distribution optique (ODN) qui constitue le troisième composant d’un PON. PANDA 3.0 est de ce fait capable de regarder ce qui se passe dans l’ODN puisqu’il permet de corréler ou déduire l’état des coupleurs et des liai-sons optiques dans l’ODN sur la base des observations aux extrémités d’un PON. PANDA 3.0 reproduit les calculs de diagnostic des deux premières versions en plus d’être capable d’isoler un ou plusieurs liens incriminés dans le réseau de distribution optique.
Perspectives envisagées
Une perspective très intéressante des travaux menés dans le cadre de cette thèse serait de décomposer l’arbre de jonction qui constitue la couche 3 du modèle générique. En ef-fet, la représentation en arbre de jonction de la combinaison des couches 1 et 2 n’est pas unique. Au lieu d’avoir une couche 3 faite d’un seul grand arbre de jonction, on peut envi-sager d’avoir plutôt n arbres de jonction pour un réseau de n composants tel que l’arbre de jonction i est équivalent au DAG i qui modélise la propagation locale de pannes sur le composant i . Les arbres de jonction de deux composants connectés i et j i seront ainsi connectés au moyen des cliques communes, c’est-à-dire les cliques contenant certaines variables appartenant au DAG i et d’autres variables appartenant au DAG j . L’intérêt de cette approche serait de distribuer et de paralléliser l’inférence sur la couche 3 du modèle entre les arbres de jonction.
Une autre perspective serait d’ajuster automatiquement les dépendances et les pa-ramètres du modèle probabiliste du réseau GPON-FTTH avec l’objectif d’améliorer en-core davantage les performances de diagnostic. Un algorithme tel que l’algorithme SEM (Structural Expectation Maximization) pourrait être étudié et appliqué dans ce cas. No-tons que l’application de l’algorithme EM paramétrique ou structurel s’avère très intéres-sante pour un opérateur de télécommunications. En effet, une application pratique pour-rait être d’implémenter un système de diagnostic complètement autonome dans lequel une boucle fermée est créée entre le modèle probabiliste de diagnostic intégrant les capa-cités d’apprentissage artificiel, les résultats de diagnostic conduisant à des interventions ciblées des techniciens sur l’infrastructure et les données reportées par les techniciens qui pourront être utilisées pour ajuster automatiquement le modèle probabiliste pour le rendre plus performant. Cependant la fiabilité de ces données doit être garantie pour évi-ter de faire dériver le modèle au lieu de l’améliorer.
Table des matières
1 Introduction
1.1 Énoncé du problème
1.2 Contribution
1.3 Structure de la dissertation
2 État de l’art dans le domaine du diagnostic des réseaux de télécommunication
2.1 Introduction
2.2 Système expert à base de règles
2.3 Système expert à base de modèles
2.4 Le diagnostic comme système d’apprentissage artificiel
2.5 Réseau de Petri
2.6 Graphe de dépendances
2.7 Réseaux bayésiens
2.8 Discussions et conclusion
3 Algorithmes d’inférence exacte sur un réseau bayésien
3.1 Introduction
3.2 Quelques bases en théorie des probabilités
3.3 Opération de marginalisation
3.4 Algorithme de somme-produit
3.5 Algorithme d’inférence sur un arbre de jonction
3.6 Discussion et conclusion
4 Apprentissage artificiel des paramètres d’un réseau bayésien
4.1 Introduction
4.2 Estimation paramétrique au sens duMaximum de vraisemblance (MLE)
4.3 L’algorithme MLE avec des données incomplètes
4.4 L’algorithme EMsur un réseau bayésien
4.5 Discussion et conclusion
5 Modèle générique pour le diagnostic automatique d’un réseau de télécommunication
5.1 Introduction
5.2 Propagation de pannes dans un réseau
5.3 Description du modèle générique
5.4 Formalisme du modèle générique
5.5 Calcul de diagnostic du modèle générique
5.6 Capacité de reconfiguration du modèle générique
5.7 Conclusion et perspectives
6 Modélisation probabiliste du réseau FTTH (Fiber To The Home) de type GPON (Gigabit Passive Optical Network)
6.1 Introduction
6.2 Modèle du réseau GPON-FTTH
6.3 Paramètres experts du modèle initial d’un PON
6.4 Validation du modèle initial d’un PON
6.5 Comparaison entre système expert et modèle probabiliste de diagnostic
6.6 Discussion et conclusion
7 Ajustement automatique des paramètres du modèle GPON-FTTH : application de l’algorithme EM
7.1 Introduction
7.2 Contexte applicatif de l’algorithme EM
7.3 L’EMavec les données réelles d’apprentissage
7.4 Valeur ajoutée de l’EMpour le diagnostic du réseau d’accès GPON-FTTH
7.5 Discussion et conclusion
8 Extension du modèle GPON-FTTH : prise en compte du réseau de distribution optique
8.1 Introduction
8.2 Diversité des ingénieries de l’ODN (Optical Distribution Network)
8.3 Modélisation automatique de l’ODN
8.4 Modèle complet du réseau GPON-FTTH
8.5 Valeur ajoutée du modèle de l’ODN pour le diagnostic GPON-FTTH
8.6 Discussion et conclusion
9 Conclusion
9.1 Rappel des objectifs de la thèse
9.2 Synthèse des contributions
9.3 Perspectives envisagées
Actions de valorisation
Références bibliographiques