Télécharger le fichier original (Mémoire de fin d’études)
Banque d’images
Dans le domaine ferroviaire et en particulier à la SNCF, il n’existait pas de données pour l’analyse d’images dans le but d’en déduire un coefficient d’adhérence. Le cas d’emploi n’ayant pas été traité, aucune recherche sur les caméras et capteurs existants n’était disponible. Il en était de même pour les algorithmes permettant l’analyse d’images spectrales de polluants sur des rails. Pour cette raison, il a fallu construire une chaîne d’acquisition d’images, faire l’approvisionnement d’une caméra adaptée et créer une banque d’images.
La banque d’image créée comprend des images mosaïques ainsi que les masques représentant la « vérité terrain ». On appelle vérité terrain la répartition réelle (variable selon l’opérateur humain qui étiquette les pixels), dans l’image, des polluants recherchés. Chaque image est analysée visuellement et étiquetée manuellement. Cette étape longue et fastidieuse est nécessaire pour pouvoir par la suite évaluer l’efficacité de nos algorithmes. Pour un gain de temps, les masques ont été élaborés à l’aide de l’outil Pixel Annotation Tool (BREHERET 2017).
Dans une première étape nous avons utilisé des spectromètres dans le cadre des deux collaborations décrites au chapitre « Spectroscopie et caractérisation des matériaux ». Ces instruments permettent de mesurer et d’analyser le comportement de différents matériaux en réponse à une illumination. Pour un éclairage donné, nous avons caractérisé chaque matériau et mis en avant leurs attributs discriminants. Grâce à ces caractérisations, nous avons déterminé la bande fréquentielle optimale pour la détection et la reconnaissance des polluants. Nous avons ainsi pu sélectionner un capteur adapté au besoin.
Il a été envisagé d’exploiter les données issues des courbes spectrales de référence, obtenues par spectroscopie, pour guider la reconnaissance de celles obtenues en chaque pixel par la caméra. Rapidement il est apparu que les données ne sont pas directement comparables. Plusieurs facteurs entrent en ligne de compte. Les données n’ont ni été acquises dans les mêmes conditions, ni réalisées avec les mêmes caractéristiques matérielles. Chacun des capteurs a une sensibilité et un niveau de bruit associé qui lui sont propres. La finesse, c’est-à-dire la largeur à mi-hauteur des gaussiennes de bande spectrales (voir le chapitre « Système et Calibration »), illustre le pouvoir de discrimination spectrale du capteur. Ce pouvoir de discrimination des fréquences est beaucoup plus performant pour un spectromètre que pour un filtre MSFA Fabry-Pérot (équipant notre caméra), ceux-ci étant utilisés avec un éclairage polychrome. Enfin, les lois de transformation intégrées par le constructeur sur les données brutes de la caméra diffèrent de celles du spectromètre.
A ces écarts bruts entre les données des deux capteurs s’ajoutent des prétraitements spécifiques qui éloignent encore les signaux à traiter. Les prétraitements appliqués aux différentes images du cube, peu échantillonnées spectralement, ne sont pas les mêmes que ceux employés pour les courbes du spectromètre. Lors de la calibration du capteur, étape visant à corriger l’image brute, nous souhaitons améliorer l’image pour faciliter l’extraction d’informations. Ce faisant elle est déformée par rapport au signal original, d’une façon spécifique à la correction appliquée. La chaîne de correction que l’on met en place dépend donc du type de données et de ce que l’on cherche à exploiter en sortie.
Puisque les traitements appliqués aux courbes obtenues en sortie du spectromètre (spectroscopie différentielle et suppression du continuum) ne sont pas adaptées aux données de la caméra, nous avons cherché des algorithmes ayant fait leur preuve sur ce type de données.
Pour ce faire, nous travaillons dans cette partie sur ces images multispectrales corrigées : après prise en compte des offset constructeurs, elles ont été reconstruites par demosaicing, le vignettage a été corrigé
et une étape de filtrage a été mise en œuvre. Chaque cube spectral contient 25 images, de taille 216×409 pixels, dans la bande fréquentielle 675-975nm.
Nos travaux ont pour objectif la détection de pollution sur les rails ; une étape complémentaire de reconnaissance est nécessaire. Il y a alors un besoin de pouvoir définir des classes d’appartenance pour chacun des pixels. Dans ce chapitre, nous avons recensé des méthodes existantes de traitement pour la classification supervisée et non supervisée, que nous avons ensuite couplées et évaluées en jouant sur les différentes associations. Nous présentons nos résultats et nos conclusions au Chapitre 6.
Méthode à vecteurs support
Souvent le nombre d’échantillons disponibles pour l’apprentissage est insuffisant pour que les estimateurs fournissent un modèle avec une bonne précision. D’un autre côté, l’acquisition d’un grand nombre d’exemples s’avère être souvent très coûteuse et peut même mener à des problèmes de sur-apprentissage. Pour ces deux raisons, il faut trouver un compromis entre le nombre d’échantillons et la précision recherchée. C’est ce que permettent les méthodes à vecteurs supports que nous présentons.
Introduction
Les méthodes à vecteurs supports ou séparateurs à vastes marges (en : Support Vector Machine, SVM) sont des méthodes d’apprentissage supervisé qui sont largement utilisées pour l’analyse de données. Elles sont basées sur la théorie de l’apprentissage statistique, développée par VAPNIK en 1963. Depuis l’idée initiale a été fortement étudiée et le standard actuel a été proposé par Corinna CORTES et Vladimir VAPNIK (CORTES et VAPNIK 1995).
L’algorithme consiste à chercher géométriquement la surface de séparation optimale entre les classes de données par détermination du sous-ensemble des échantillons d’entraînement le plus représentatif des frontières des classes. Les échantillons de ce sous-ensemble sont appelés les vecteurs supports.
Les méthodes par SVM possèdent des propriétés qui semblent adaptées à la classification d’images spectrales : elles sont robustes, insensibles à la dimension de l’espace et ne nécessitent qu’un nombre restreint d’échantillons d’apprentissage. Les techniques de SVM montrent aussi une meilleure capacité à généraliser et une plus grande probabilité de fournir une bonne classification. En cela elles offrent des avantages par rapport à d’autres algorithmes de classification.
Cependant les SVM ne prennent pas en compte l’information de structure spatiale de l’image pour guider la classification des pixels. Or, dans un cube multispectral, au sein d’une même classe, les variations spectrales peuvent être importantes. Les méthodes de classifications qui se basent uniquement sur les caractéristiques spectrales des données conduisent à des résultats bruités où des pixels isolés peuvent être mal étiquetés au sein d’un groupe homogène. Les méthodes implémentées, supervisées ou non, n’échappent pas à ce problème. Certaines méthodes de classification actuelles tirent parti de cette information spatiale mais elles sont lourdes en charge de calcul, ce qui les rend inadaptées à notre application.
Nous proposons ici de filtrer nos images au préalable de façon à prendre en compte l’information spatiale et réduire le bruit sur la classification résultante. Le filtrage vectoriel par diffusion anisotropique est utilisé ; il permet une homogénéisation importante des régions tout en conservant correctement les contours des régions. Le filtrage spatial des images modifie sensiblement les statistiques des classes ainsi que la topologie des données. Notons que le filtrage peut entraîner une chute importante de variance intra-classe qui peut réduire les performances des méthodes de classification statistique. A l’inverse, la modification de la topologie augmente les performances des méthodes de classification géométrique, dont les SVM font partie.
Par leur construction, les SVM sont des classificateurs binaires. Néanmoins grâce aux nombreuses contributions sur le sujet, ils ont été adaptés à la classification multi-classes. Les deux approches les plus connues sont « un contre tous » et « un contre un ».
Nous rappelons dans ce chapitre les principes de base du SVM ; les résultats associés aux méthodes mises en place sont présentés au Chapitre 6. Les performances de notre méthode SVM seront évaluées et comparées aux approches de Séparation Aveugle de Sources, étudiées aux paragraphes suivants présentant en particulier la Factorisation en Matrices Non-négatives (NMF).
Bases théoriques des SVM
Les séparateurs à vastes marges sont des algorithmes qui construisent un ou plusieurs hyperplans dans un espace de dimension élevée ou infinie. Ils peuvent être utilisés pour des tâches de classification, de régression et d’autres utilisations (GUNN 1998).
Le principe des SVM consiste à projeter les données de l’espace d’entrée (appartenant à deux classes distinctes) dans un espace de dimension égale ou plus grande de façon à ce que les données y soient linéairement séparables. Dans cet espace, on construit un hyperplan séparant les classes tel que :
– Les vecteurs appartenant aux différentes classes se trouvent de part et d’autre de l’hyperplan choisi.
– La plus petite distance entre les vecteurs supports de chaque classe et l’hyperplan est maximisée.
Cette distance, appelée « marge » du classificateur est illustrée en Figure 66. Cette approche garantit généralement que plus la marge est grande et plus l’erreur de généralisation est petite.
Table des matières
REMERCIEMENTS
RESUME
ABSTRACT
INTRODUCTION GENERALE
CHAPITRE 1 : CONTACT ROUE-RAIL ET TRIBOLOGIE
1 Introduction
2 Historique ferroviaire et contexte
3 Frottement, adhérence, glissement
4 Anatomie du véhicule ferroviaire et de la voie
4.1 Le bogie, l’essieu et la roue
4.2 Le rail à patin
5 Modèle du contact roue-rail.
5.1 Problème normal, ellipse de Hertz
5.2 Contact tangentiel, théories de Carter et de Kalker
5.2.1 Théorie de Carter
5.2.2 Théorie simplifiée de Kalker
5.2.3 Théorie complète de Kalker
5.3 Facteurs de perte d’adhérence
5.4 Impact de la perte d’adhérence
5.5 Méthodes existantes de gestion de la perte d’adhérence
5.5.1 Nettoyage des voies
5.5.2 Sablage
5.5.3 Anti-enrayeurs
5.5.4 Action sur la conduite et les abords de voies
6 Limitation de l’existant et ouverture
7 Description succincte du système
7.1 Montage type « Surveille »
7.2 Protection de la caméra en roulement.
7.3 Traitements
8 Impacts
8.1 Métiers : maintenance et exploitation
8.2 Ecosystème SNCF
8.3 Vers un train autonome
9 Conclusion
CHAPITRE 2 : SPECTROSCOPIE ET CARACTERISATION DE MATERIAUX
1 Introduction
2 Spectroscopie
2.1 Caractérisation d’un spectromètre
2.2 Notions de réflectances
2.2.1 Réflectance Bidirectionnelle (BRDF) ou pseudo-réflectance
2.2.2 Réflectance hémisphérique
3 Acquisitions des données
3.1 Mesures en réflectance hémisphérique RHD
3.1.1 Configuration du système d’acquisition
3.1.2 Mesures en réflectance hémisphérique-directionnelle
3.2 Mesures directionnelles BRDF dites de pseudo-réflectance
3.2.1 Configuration du banc de mesures laser (BRDF)
3.2.2 Exemple de spectres obtenus
3.2.3 Mesures en BRDF
4 Caractérisation des matériaux par analyse spectroscopique
4.1 Spectroscopie différentielle
4.1.1 Définition
4.1.2 Lissage des courbes et calcul des dérivés
4.1.3 Les propriétés des courbes de dérivées
4.1.4 Résultats
4.2 Suppression du continuum
5 Courbes spectrale et adhérence
6 Conclusion
CHAPITRE 3 : SYSTEME ET CALIBRATION
1 Système de vision
1.1 Etude préliminaire des technologies existantes d’imageurs spectraux
1.1.1 Caméra ponctuelle : imageur à balayage de point
1.1.2 Caméra linéaire : imageur à balayage de lignes (spatial)
1.1.3 Caméra matricielle : imageur à balayage de fréquence (spectral)
1.1.4 Caméra matricielle : imageur sans balayage (snapshot)
1.2 Choix du capteur et système d’acquisition
1.2.1 Capteur CMOS
1.2.2 Matériels spectraux
2 Calibration
2.1 Offset
2.2 Caractérisation des fréquences d’acquisition
2.2.1 Réponse des filtres
2.2.2 Efficacité quantique et harmonique d’ordre 2
2.3 Construction des cubes images et dématriçage
2.3.1 Multispectral Filter Array (MSFA)
2.3.2 Dématriçage multispectral
2.3.3 Méthodes de dématriçage implémentées
2.3.4 Comparaison des méthodes
2.4 Suppression de l’influence de la lumière (SIL)
2.5 Correction du vignettage (CV)
2.6 Résultats
3 Conclusion
CHAPITRE 4 : ANALYSE DANS L’ESPACE IMAGE : PREMIERE APPROCHE
1 Espace de représentation
1.1 Présentation
1.2 Espace image
1.3 Normes
2 Réduction du bruit
2.1 Par morphologie mathématique
2.2 Par diffusion anisotrope
3 Détection de contours
4 Détection d’anomalies
4.1 RX detector
4.2 Gaussian Mixture Model (GMM)
4.3 Cas particulier de la détection de spécularité
5 Application aux images ferroviaires
5.1 Réduction du bruit
5.2 Détection de contours
5.3 Anomalie du rail : les spécularités
6 Conclusion
CHAPITRE 5 : CLASSIFICATION SPECTRALE DES DONNEES
1 Banque d’images
2 Méthode à vecteurs support
2.1 Introduction
2.2 Bases théoriques des SVM
2.3 Classification linéaire
2.4 Classification non-linéaire
2.5 Classification multi-classes
3 Séparation aveugle de sources (SAS)
3.1 Type de mélanges usuels
3.1.1 Mélanges linéaires
3.1.2 Mélanges non-linéaires
3.1.3 Conclusion
3.2 Méthode pour les mélanges linéaires instantanés
3.2.1 Analyse en Composantes Indépendantes (ICA)
3.2.2 Analyse en Composantes Principales ACP (en : PCA)
3.2.3 Analyse par méthode des K-moyennes (en : K-means)
3.2.4 Autres méthodes
4 Etat de l’art NMF
4.1 NMF : existence et unicité des solutions
4.1.1 Solutions
4.1.2 Fonction coût
4.2 Factorisation en Matrices Non-négatives (NMF) sans contrainte
4.2.1 Algorithme de descente du gradient
4.2.2 Algorithme à mise à jour multiplicative ou algorithme multiplicatif
4.2.3 Algorithme des moindres carrés
4.3 Factorisation en Matrice Non-négative sous contrainte
4.3.1 Unicité de la O-NMF
4.3.2 O-NMF unilatérales
4.3.3 O-NMF bilatérale ou tri-facteurs
4.4 Démixage et clustering
4.4.1 Matrice d’abondance
4.4.2 Spectral Angle Mapper (SAM).
5 Conclusion
CHAPITRE 6 : SEGMENTATION D’IMAGES, DETECTION ET RECONNAISSANCE
POLLUANTS POUR L’EVALUATION DE L’ADHERENCE
1 Introduction
2 Mesures de performances
2.1 Matrice de confusion
2.2 Précision/Rappel
3 Méthode de classification supervisée par SVM
3.1 Fonctions noyaux expérimentées, linéaires et non-linéaires
3.2 Variation de l’équation de l’hyperplan
3.3 Résultats de la classification supervisée
4 Méthode de classification non supervisée par NMF-SAM
4.1 NMF hiérarchique de rang 2
4.2 Implémentation de l’algorithme de classification supervisée NMF-SAM
4.3 Résultat de la classification non-supervisée
5 Efficacité des algorithmes avec et sans apprentissage préalable
5.1 Performance des SVM
5.2 Performances des NMF-SAM
6 Synthèse des résultats de détection et de reconnaissance
7 Evaluation de l’adhérence à partir des résultats de classification
8 Conclusion
CONCLUSION ET PERSPECTIVES
BIBLIOGRAPHIE
ANNEXE
1 Définitions de spectroscopie
1.1 Les différents rayonnements
1.1.1 Rayon Incident
1.1.2 Rayon transmis
1.1.3 Rayon absorbé
1.1.4 Rayon réfléchi
1.2 Les variables de radiométrie
1.2.1 Flux.
1.2.2 Eclairement (en : Irradiance)
1.2.3 Luminance (en : Radiance)
1.2.4 Réflectance
1.2.5 Transmittance et absorbance
2 Résultats de spectroscopie obtenus avec Hytech Imaging
3 Color Filter Array
4 Interférométrie et différence de marche entre rayons consécutifs