Processus de classification automatique supervisée
Du pixel à la region : la segmentation Les images peuvent etre analysees au niveau de la scéne, suivant une approche bas èe sur le pixel, ou encore une approche basee sur la région. Cette derniére approche consiste ` a extraire des caractèristiques des régions de l’image, obtenues via une segmentation. La segmentation a pour but de partitionner l’image en regions homogénes, gr ` ace a un critere prèdéfini. Idéalement, cette homog énéit é est sémantique, de telle sorte que les differentes régions de la segmentation correspondent aux différents objets de l’image. Cependant, en pratique, les algorithmes de segmentation produisent des regions ho- mogenes suivant des attributs de bas-niveau. ` Il existe des centaines d’algorithmes de segmentation dans la litterature. Pal et Pal [Pal & Pal, 1993] proposent une critique de quelques algorithmes de segmentation. Certaines methodes, bas ées sur les histogrammes, sont de mise en oeuvre assez simple et ont des performances souvent reduites, car elles ne tirent pas profit de l’aspect spatial de l’information d’image. L’idee g énérale de ces m éthodes consiste a isoler les pics de l’his- ` togramme : a une dimension, on proc ède donc ` a des seuillages [Otsu, 1979] ou des multi- ` seuillages [Nakagawa & Rosenfeld, 1979; Taxt et al., 1989], tandis qu’a` n dimensions, on opere des classifications [Dubuisson, 1990]. ` Certaines methodes de segmentation, telles que la croissance de r égions ( region growing) [Adams & Bishof, 1994] ou le partage et la reunion de r égions ( split and merge), operent directement sur les pixels de l’image. Par ailleurs, d’autres techniques bas èes sur la detection de contours, qui essaye de localiser les points de changement brusque Processus de classification automatique supervis d’intensite dans l’image, cherchent a exploiter le fait qu’il existe une transition d ètectable éntre deux regions connexes. Ces deux types d’approches de la segmentation sont par- ticulierement d ètaill ées dans [Bolon et al., 1995]. Mueller et ses coll égues [Mueller et al., ` 2004], quant a eux, proposent une m èthode de segmentation bas ée a la fois sur les r ègions ét les contours, pour l’extraction de champs d’agriculture dans les images satellitaires a` haute resolution. Plusieurs travaux sur la segmentation des images utilisent les modeles d’interaction ` spatiale tels que les champs de Markov (Markov Random Fields ou MRF) ou de Gibbs (Gibbs Random Fields ou GRF), pour modeliser les images [Derin & Elliot, 1987; Jain, 1981]. Plus recemment, Deng et Clausi [Deng & Clausi, 2004], pr ésentent une m éthode classique de segmentation basee sur les MRF, dans laquelle le poids du terme de r égularisation varie selon les iterations de l’algorithme. De m éme, dans [Poggi et al., 2005], les auteurs utilisent les champs de Markov structures en arbre, pour am éliorer les performances de la segmentation. Par ailleurs, les reseaux de neurones, qui permettent d’avoir la sortie en temps réel gr ace a leur aptitude ` a effectuer des traitements en parall èle, ont montrè de bonnes performances pour la segmentation d’images, meme quand le niveau de bruit est tresèlevé. Blanz et Gish [Blanz & Gish, 1990] par exemple, ont utilis é un r éseau a` trois couches pour la segmentation des images, dans lequel le nombre de neurones dans la couche d’entree d épend du nombre de primitives d’entr ée pour chaque pixel, et le nombre de neurones dans la couche de sortie est egal au nombre de classes.
Extraction de primitives
Pour toute operation d’analyse et de fouille d’images, le type de primitives utilis ées, éncore appeles attributs ou caract éristiques, est essentiel, car le succ és des op èrations ulterieures d épend de cette information de bas-niveau, extraite de l’image. Dans la litt éra- ture, ces attributs caracterisent des pixels, mais aussi des r égions ou des objets de l’image, ét peuvent etre class es en trois cat égories : spectrales, texturelles et g éométriques.
Primitives spectrales
La litterature propose outre le niveau de gris de chaque pixel pour chaque bande spectrale (vecteur multispectral), les caracteristiques statistiques et ce que l’on appelle les neocanaux, r ésultant de traitements élabor és a partir de plusieurs bandes spectrales. ` Les caracteristiques statistiques sont en g énéral la moyenne et l’ écart-type (moments statistiques du premier et second ordre), calcules dans un certain voisinage. Les moments statistiques d’ordre superieur tels que l’asym étrie (skewness) et l’aplatissement (kurtosis) peuvent aussi etre utilis es pour d écrire l’image. Soit I, une image en niveaux de gris, sa moyenne s’exprime de la maniere suivante : ` m1 = 1 NlNc X Nl l=1 X Nc c=1 Ilc (3.1) et son ecart-type, qui mesure la dispersion des échantillons autour de la moyenne, est donne par : m2 = vuut 1 NlNc X Nl l=1 X Nc c=1 (Ilc − m1) 2 (3.2) Cependant, il y a un risque de perte d’information lorsque le voisinage est grand. Une alternative est alors d’utiliser les histogrammes [Swain & Ballard, 1991]. Les neocanaux sont des analyses multivari ées, tr és utilis èes dans le traitement des images satellitaires. Il s’agit souvent d’operations math ématiques visant soit a r èduire la somme d’informations (en codage RVB par exemple, on ne peut visualiser que 3 canaux en meme temps), soit la mise en evidence de th émes particuliers (v ègétation, sols, …). Les indices de vegétation, par exemple, sont utilis és pour d éterminer le taux de v égétation dans l’image (Leaf Area Index ou LAI) et ceci, pixel par pixel. Il en existe plusieurs, separa- bles en 3 categories : les indices intrins éques (NDVI), les indices li ès aux variations du sol (PVI, WDVI) et les indices lies aux propri étés de l’atmosph ére tels que ARVI et GEMI ` [Rondeaux et al., 1996]. Ils different par leur capacit è a bien estimer le LAI, et par leur ` sensibilite a la brillance des sols ou aux effets de l’atmosph ère [Bannari et al., 1997]. Le ` plus utilise est le NDVI ( Normalized Difference Vegetation Index), defini par : NDV I = P IR − R P IR + R (3.3) ou PIR et R sont respectivement les r èflectances (mesure de la puissance r éfléchie sur la puissance rec¸ue) dans les canaux proche infrarouge et rouge. Il a etéélabor é a partir des ` canaux 5 et 7 de Landsat MSS, puis etendu a d’autres types de capteurs. La r èponse spec- trale d’un couvert vegétal dense est forte dans les longueurs d’onde proche infrarouge ét faible dans les longueurs d’onde rouge (la chlorophylle absorbe le rayonnement incident de la partie visible du spectre electromagn étique), alors que la r éponse spectrale d’un couvert clairseme est inverse. La diff érence normalis ée permet de rendre compte de ces deux phenom énes sur une m ème image. Le n eocanal r ésultant pr ésente un gradient croissant d’activite végétale allant du noir signifiant l’absence de couverture, au blanc qui rend compte d’une activite chlorophyllienne tr ésèlev ée. La figure 3.3 montre l’exemple d’une image SPOT a 20 m de r èsolution et l’image NDVI correspondante.