Influence de l’estimateur de la matrice de covariance sur les résultats de classification

Télécharger le fichier original (Mémoire de fin d’études)

Introduction

La cartographie de la Terre à grande échelle peut se faire de deux manières principales : l’observation par des systèmes d’acquisition d’images optiques ou par des systèmes radars. L’utilisation de systèmes ra-dars apporte plusieurs avantages par rapport aux systèmes optiques, nommément l’indépendance par rapport à l’éclairement de la zone à observer et la capacité à traverser la couche nuageuse. Ainsi, les données peuvent être acquises à toute heure du jour et de la nuit et par tous les temps. Ces propriétés ont largement contribué au déploiement très important des systèmes radars dans de nombreuses applications, que ce soit dans le domaine civil ou dans le domaine militaire. Ces applications incluent notamment la détection de bateaux, la détection d’icebergs, la classification de l’occupation des sols et bien d’autres.
Le Radar à Synthèse d’Ouverture, appelé Synthetic Aperture Radar (SAR) en anglais est un système d’ima-gerie radar qui permet d’atteindre en pratique des résolutions spatiales élevées est . Ceci en fait la base de tous les systèmes d’acquisition d’images radar à l’heure actuelle. Un système SAR fonctionne en émettant une onde électromagnétique en direction du sol et en mesurant à la fois la phase et l’amplitude du signal de retour (appelé signal rétrodiffusé). Les données ainsi mesurées sont donc complexes. De plus, dû à la propriété de polarisation des ondes électromagnétiques, des systèmes SAR appelés PolSAR (pour Polarimetric SAR) sont capables d’émettre et de recevoir des ondes polarisées orthogonalement à la fois en émission et en réception. Pour chaque cellule de résolution du système radar, on dispose ainsi de plusieurs mesures grâce aux différentes combinaisons possibles de polarisation, contenues dans une matrice appelée matrice de diffusion.
En raison de la nature aléatoire de l’environnement observé par un radar, où des modifications dans l’espace ou dans le temps peuvent intervenir de manière très rapide, le signal rétrodiffusé est représenté par une variable aléatoire. Traditionnellement, pour des radars disposant d’une faible résolution, chaque cellule de résolution contient un très grand nombre de réflecteurs sur lesquels l’onde provenant du radar va venir se réfléchir. Le signal mesuré pour cette cellule de résolution est donc la somme des signaux élémentaires sur chacun des ré-flecteurs présents au sein de la cellule. Comme ce nombre est important, le Théorème Central Limite implique que le signal rétrodiffusé est distribué selon une loi gaussienne. Ainsi, les données SAR polarimétriques sont généralement modélisées par une loi gaussienne complexe multivariée.
Ces données polarimétriques contiennent les relations entre les différents canaux de polarisation qui peuvent être reliées à des informations physiques sur la scène imagée. Pouvoir analyser ces relations permet de remonter aux processus physiques se déroulant lorsqu’une onde électromagnétique rencontre un objet et ainsi de pouvoir caractériser cet objet. La nature aléatoire de ces interactions peut être étudiée en considérant les moments du second ordre des données, à savoir leur matrice de covariance.
Comme il a été mentionné précédemment, les images SAR polarimétriques peuvent être utilisées pour de nombreuses applications et en particulier, pour la classification de l’occupation des sols. Ainsi, la classification des images SAR polarimétriques est un domaine de recherche très actif. Deux approches principales sont ap-parues dans la littérature correspondante.
La première approche est de classifier les pixels grâce à leurs caractéristiques physiques. Plusieurs décom-positions de matrices ont été proposées à ce sujet :
— des décompositions cohérentes, basées sur la matrice de diffusion : décomposition de Cameron [19] ou de Krogager [48], afin de caractériser les réflecteurs spéculaires. C’est une approche déterministe.
— des décompositions non-cohérentes, basées sur la matrice de covariance : décomposition de Freeman [34] ou de Cloude-Pottier [24], qui permettent de caractériser les réflecteurs étendus. C’est une approche statistique, non-déterministe.
La deuxième approche est de classifier les images à partir de leurs propriétés statistiques. Kong a proposé une mesure de distance pour un type de données SAR polarimétriques [46], qui a été étendue par la suite par van Zyl [74], Yueh [82] et Lee [51]. La mesure de distance proposée par Lee est basée sur la distribution de Wishart associée à la matrice de covariance et résultant de l’hypothèse de la distribution gaussienne du signal rétrodif-fusé.
Cependant, les systèmes d’acquisitions PolSAR récents sont capables d’obtenir des images en très haute résolution, de l’ordre du décimètre. Dans ce cas, le nombre de réflecteurs à l’intérieur de chaque cellule de résolution diminue de manière drastique et varie grandement d’une cellule à l’autre. Ceci entraîne une hétéro-généité dans la distribution du signal rétrodiffusé qui n’est pas prise en compte par la distribution gaussienne. Il est donc nécessaire de modéliser le signal de manière à pouvoir tenir compte de cette hétérogénéité. Pour cela, le modèle des vecteurs aléatoires sphériquement invariants (ou Spherically Invariant Random Vectors, soit SIRV), initialement proposé par Yao [81] pour la théorie de l’information, a été introduit dans la communauté de la détection radar, notamment par Farina [33]. Ce modèle théorique a fait l’objet de validations par un grand nombre de campagnes de mesures, notamment par le MIT (Massachussets Institute of Technology) [12] ou l’ONERA (The French Aerospace Lab, anciennement Office National d’Études et Recherches Aérospatiales), ainsi que par les travaux, entre autres, de Trunk [71], Goldman [37], Ward [76] ou Watts [77].
Par ailleurs, une grande partie des algorithmes de classification pour les images SAR polarimétriques et en particulier le classifieur Wishart proposé par Lee dans [50] fait appel à la moyenne de matrices de covariance pour calculer la matrice correspondant au centre de chaque classe. Ce centre est calculé comme la moyenne arithmétique des matrices. Cependant, les travaux récents de Barbaresco [6–8], inspirés par les travaux de Moa-kher [55], ainsi que les travaux de Devlaminck [30] dans le cadre de l’imagerie optique, ont permis de mettre en avant le fait que l’espace des matrices de covariance, à savoir l’espace des matrices hermitiennes définies positives, n’est pas un espace euclidien mais est doté d’une structure de variété riemannienne. Il est alors né-cessaire d’employer des outils prenant en compte cette structure non-euclidienne. C’est notamment le cas de la géométrie de l’information et des travaux de Rao [4, 17] qui permettent d’obtenir de manière relativement simple une expression de la moyenne de matrices hermitiennes définies positives.
Le but de ce travail de thèse est donc d’étudier l’impact de ces nouveaux outils sur la classification d’images SAR polarimétriques en termes de précision de classification et d’interprétation du sens physique des résultats de classification, au travers des décompositions polarimétriques usuelles.
Ce manuscrit est construit en quatre chapitres, qui abordent chacun un des points principaux présentés dans les paragraphes précédents. Le premier chapitre expose dans un premier temps le principe de l’imagerie SAR et de la polarimétrie, au travers de la caractérisation de la propagation des ondes électromagnétiques à partir des équations de Maxwell. Les outils statistiques classiques employés pour la classification polarimétrique sont ensuite rappelés, à savoir l’hypothèse d’une distribution gaussienne du signal rétrodiffusé et l’estimation de la matrice de covariance de ce signal, communément appelée la Sample Covariance Matrix (SCM). Par la suite, des décompositions polarimétriques, basées notamment sur la matrice de covariance et destinées à expliquer la nature des phénomènes physiques se déroulant dans une cellule de résolution, ainsi qu’un algorithme de classification classique (appelé classifieur Wishart) sont présentés. Enfin, le modèle de signal non-gaussien est introduit avec l’estimateur adapté à cette hypothèse ainsi que les propriétés de l’algorithme permettant d’obte-nir cet estimateur et les propriétés statistiques de l’estimateur proprement dit.
Le deuxième chapitre est consacré à l’étude d’un test statistique d’égalité de matrices de covariance et à son application dans des algorithmes de classification polarimétrique. L’expression du test pour le cas gaussien est rappelée puis son extension au cas SIRV est présentée. Dans chaque cas, deux scénarios sont envisagés : un scénario où une des deux matrices de covariance est connue et un scénario où les deux matrices de covariance sont inconnues. Le test fournit une distance statistique entre deux matrices, qui est employée dans trois algo-rithmes de classifications différents : le classifieur Wishart, un algorithme développé pendant ce doctorat pour tirer parti de la région critique fournie par le test et un algorithme de segmentation hiérarchique. Les résultats sont présentés sur des données réelles, acquises par le système RAMSES de l’ONERA.
Dans le troisième chapitre, les principes de la géométrie de l’information sont rappelés, ainsi que la manière de calculer la moyenne géométrique de matrices de covariance et la distance géométrique entre deux matrices de covariance. Ces résultats sont d’abord présentés pour le cas de matrices réelles symétriques définies positives avant d’être étendus au cas des matrices hermitiennes définies positives. L’apport de cette technique est ensuite étudiée sur des images simulées puis sur des images réelles. Une interprétation polarimétrique des résultats est proposée.
Le quatirème et dernier chapitre présente des résultats préliminaires sur des travaux d’extension des mé-thodes développées pour le cas de données SAR polarimétriques et leur potentialité d’application sur des don-nées hyperspectrales. L’imagerie hyperspectrale consiste à acquérir une image dans un grand nombre de bandes spectrales situées dans la région du spectre électromagnétique contenant la lumière visible. Malgré quelques différences, ces deux types de données sont suffisamment proches pour justifier de cette tentative d’extension de ces méthodes, à savoir un modèle de signal non-gaussien et l’emploi de la géométrie de l’information. Des premiers résultats sont présentés sur des données réelles de la NASA (National Aeronautics and Space Admi-nistration).
Enfin, nous concluons ce travail en soulignant les points importants qui s’en dégagent et en proposant des perspectives pour poursuivre ces travaux.

Table des matières

Introduction
1 État de l’art
1.1 Radar SAR polarimétrique
1.1.1 Imagerie radar
1.1.2 Radar à Synthèse d’Ouverture
1.1.3 Polarimétrie
1.2 Traitements classiques en classification SAR polarimétrique
1.2.1 Hypothèse de bruit gaussien
1.2.2 Estimation de la matrice de covariance
1.2.3 Décompositions polarimétriques
1.2.4 Classifieur Wishart
1.3 Modèle de vecteurs aléatoires sphériquement invariants
1.3.1 Définition
1.3.2 L’Estimateur du Point Fixe
1.3.3 Propriétés statistiques du FPE
1.3.4 Estimation de la texture
1.3.5 Influence de l’estimateur de la matrice de covariance sur les résultats de classification
1.4 Conclusion
2 Classification non supervisée
2.1 Test de Box
2.1.1 Inconvénients du classifieur Wishart
2.1.2 Test d’égalité de matrices de covariance
2.1.3 M-Test de Box
2.2 Algorithmes et résultats
2.2.1 Algorithmes
2.2.2 Résultats
2.3 Implémentation du test de Box au sein d’autres algorithmes
2.3.1 Application avec une segmentation initiale
2.3.2 Application sans segmentation initiale
2.3.3 Application à la classification hiérarchique
2.4 Conclusion
3 Centres de classe et géométrie riemannienne
3.1 Calcul des centres de classe pour le FPE
3.2 Contribution de la géométrie riemannienne
3.2.1 Cas des matrices réelles définies positives
3.2.2 Extension aux matrices hermitiennes définies positives
3.3 Simulations
3.4 Données réelles
3.4.1 Utilisation de la distance de Wishart
3.4.2 Utilisation de la distance géométrique
3.4.3 Répartition des pixels dans l’espace H-α
3.5 Conclusion
4 Extension à l’imagerie hyperspectrale
4.1 Principe de l’imagerie hyperspectrale
4.1.1 Principe de l’imagerie hyperspectrale
4.1.2 Classification pour l’imagerie hyperspectrale
4.2 Application : données réelles
4.2.1 Jeu de données
4.2.2 Algorithmes et résultats
4.3 Conclusion
Conclusion
Annexe A Statistical Classification for Heterogeneous Polarimetric SAR Images
Annexe B English summary
Annexe C Liste des publications
Bibliographie

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *