Parcelles d’entrainement et parcelles test
La classification supervisée est basée sur des échantillons d’entraînement servant de référence pour la labellisation des pixels. Ces échantillons définissent les caractéristiques spectrales de chaque classe d’occupation du sol et sont définis à partir des données terrain. De seulement quelques mètres carrés de superficies, ces zones d’apprentissages ont pour but de regrouper des parcelles représentatives de milieux homogènes qui seront labellisées selon une nomenclature prédéfinie. Le traitement automatique de l’image consiste ensuite à attribuer à chaque pixel le label de la classe lui étant la plus proche (Caloz et Collet, 2001). La qualité et les résultats de classification dépendent énormément du choix de ces parcelles, notamment la taille et la façon de procéder de les sélectionner. Il faut au moins que le nombre de pixels de ces parcelles soit 30 fois supérieur au nombre de bandes utilisées pour la classification (Conglaton, 1988 ; Stehman et Czaplewski, 1998).
L’image étudiée est subdivisée en 8 classes : les FDHSMA (FDHSMA : Forêts Denses Humides Sempervirentes de Moyenne Altitude), les FDHSMA-FS (FDHSMA-FS : forêts denses humides sempervirentes à feuillages sclérophylles de montagne), les forêts secondaires, les recrues après feux, les peuplements d’eucalyptus, les formations marécageuses, les savanes herbeuses et les mosaïques de cultures (Tableau. 2.). Elle couvre une région de 318 hectares soit: 1164 x 432 pixels (2,5 mètres). Les nombres de pixels dans les parcelles d’entrainement (Carte. 3.) et les parcelles contrôle (Carte. 4.) sont montrés dans le tableau 2 suivant. Ces parcelles sont obtenues à partir de la méthode de validation croisée (cf. §2.4.7.). Ces classes thématiques retenues sont celles définies selon les entités écologiques observées dans le site étudié. L’approche de sélection utilisée est la méthode dite de la sélection par bloc (Rakotoniaina, 1999). Pour avoir une idée de la séparabilité de ces classes, nous avons calculé leurs indices de Jeffries Matusita basées sur les bandes spectrales et les néo-canaux utilisées (cf. §2.4.8.).
Méthode de fusion d’images Les méthodes de fusion consistent à améliorer la résolution spatiale d’une image multispectrale afin de faire ressortir des informations que seule une image panchromatique pourrait fournir. Le principe consiste à fusionner une image multispectrale présentant une plus faible résolution spatiale avec une image panchromatique plus précise spatialement afin d’obtenir une nouvelle image ayant une résolution spatiale et spectrale plus élevée. Bien qu’elles tendent à améliorer la résolution spatiale, les méthodes de fusion altèrent plus ou moins les valeurs spectrales des canaux ce qui peut a fortiori poser des problèmes pour leur exploitation. L’objectif est donc de privilégier une méthode de fusion permettant une amélioration de la résolution spatiale de l’image multispectrale en la combinant à l’image panchromatique, tout en conservant au maximum les données spectrales de chaque pixel (Thomas., 2006.). Parmi les nombreuses techniques de fusion proposées dans la littérature, on peut distinguer la catégorie des méthodes d’injection globale de celles regroupant les méthodes d’injection différenciée (Rakotoniaina, 1999.).
La première contient les méthodes qui prennent en compte simultanément l’ensemble des bandes dans le processus de fusion (méthodes IHS et ACP), alors que la seconde regroupe celles qui traitent séparément l’information spatiale et chaque bande spectrale (méthode HPF et méthode des ondelettes) (Chavez et al., 1991 ; Garguet, 1994 ; Terrettaz, 1998 ; Rakotoniaina, 1999 ; Caloz et Collet, 2001). Actuellement, le CNES (CNES : Centre Nationale des Etudes Spatiales), via le logiciel libre OTB-Monteverdi, propose également une méthode de fusion selon une variante de la méthode d’injection différenciée. Il s’agit de la technique dite : Gram-Schmidt Spectral Sharpening qui tend à conserver au maximum la qualité des données spectrales de l’image tout en offrant des résultats très satisfaisant quant à l’amélioration de la résolution spatiale. Plusieurs chercheurs, dans le cadre du Projet MORPHEO mené par l’Agence Spatiale Italienne, ont ainsi comparé la qualité de la méthode Gram-Schmidt (GS : Gram-Schmidt) par rapport à des méthodes traditionnelles et répandues telles que l’IHS (IHS : Intesity Hue Saturation) ou Brovey. En principe, cette technique consiste à multiplier chaque bande spectrale (XS) par un coefficient selon la formule suivante (Quarteroni, 2000): . (1) ( ) OTB Pansharpening XS PAN Filtred PAN La signature spectrale de chaque pixel dans les bandes est ainsi conservée selon ce facteur multiplicatif. Une illustration d’une image fusionnée est montrée sur la figure ci-dessous (Figure.5).
Les images non spectrales
Un grand nombre d’indices ont été proposés en plus des 4 bandes spectrales captées par SPOT 5, de nouvelles informations peuvent être créées par combinaison de ces canaux dont : les indices de végétations ; les indices de brillance. A ce jour, il en existe plus d’une vingtaine. Leurs informations sont souvent redondantes (Bariou et al, 1985; Girard et Girard, 1999; Jensen, 2000; Caloz et Collet, 2001). L’utilisation d’indices de végétation est très répandue pour identifier la couverture végétale d’un milieu et répond à une démarche empirique afin d’estimer un certain nombre de paramètres relatifs à l’activité chlorophyllienne (l’indice foliaire). En fait, ces indices traduisent la densité du feuillage et la proportion de sol effectivement couverte par la végétation (Croisille et al., 2005). Les indices de végétations utilisés dans le présent travail comprennent deux groupes différents. Le premier groupe est constitué par : Le ratio simple (SR : Simple Ratio) et l’indice de la différence normalisée (NDVI : Normalized Difference Vegetation Index). Ce sont les indices de végétations les plus connues qui emploient deux bandes : le rouge (XS2) et le proche-infrarouge (XS3). Le second groupe est formé par : le ratio simple réduit (RSR : Reduced Simple Ratio) et l’indice de la différence normalisée et corrigée (NDVIc : Normalised and Corrected Difference Vegetation Index) (Propastin, 2009 ; Tableau. 3.). Ces indices utilisent d’habitude trois bandes simultanément : le rouge (XS2), le proche-infrarouge (XS3) et le moyen-infrarouge (XS4). R : Compte numérique dans le canal du rouge PIR : Compte numérique dans le canal du proche infrarouge MIR : Compte numérique dans le canal du moyen infrarouge L’IB (IB : indice de brillance) (14), sensible à l’humidité et la présence de sel en surface, permet de faire ressortir des informations relatives à la présence de surfaces absorbantes, telles que les sols très humides voire totalement recouverts d’eau. La présence de ces sols est traduite par des couleurs sombres s’opposant à des surfaces plus réfléchissantes telles que les zones bâties ou certains types de végétation (Croisille et al., 2005). L’indice de brillance est le suivant : IB R² PIR² (14) R : Compte numérique dans le canal du rouge PIR : Compte numérique dans le canal du proche infrarouge Ces images, dites aussi, non spectrales sont utilisées afin de compléter l’information apportée par chaque pixel dont la valeur, issue des valeurs spectrales de l’image originale, exprime la propriété des objets de la surface terrestre (Caloz et Collet, 2001).
K Plus Proches Voisins
Cette approche n’exige pas de connaitre la loi de distribution des variables donc c’est une méthode non paramétrique. Sa version de base est introduite par Cover et Hart (1967). Pour un k fixé, ce classificateur fait voter les k plus proches voisins d’un pixel à classer (posons x) pour connaitre à quel classe appartient ce pixel. Le principe de cette méthode est simple. Un pixel inconnu x est assigné à la classe Ci si et seulement si la classe majoritaire dans les k plus proches voisin de x est la classe Ci. La proximité des pixels est évaluée par la distance spectrale calculée entre le pixel x et chacun des pixels des zones d’apprentissage (Schowengerdt, 1997). Le paramètre k permet de réduire les effets du bruit statistique sur la classification. Cependant, si k est trop grand, l’algorithme aura tendance à assigner un nouvel objet à la classe de la zone d’apprentissage la plus représentée. La vitesse de cet algorithme est proportionnelle au nombre d’éléments de la zone d’apprentissage. D’après Tintrup et al en 1998 et Pal et al., en 2001, la valeur optimale donnée à k est égale à la racine carrée du nombre total de pixels des zones d’entraînement. Ce classificateur est une extrapolation du classificateur euclidien. Au lieu d’utiliser le vecteur caractéristique moyen m comme unique prototype d’une classe, l’approche K-PPV fait intervenir tous les exemplaires des vecteurs caractéristiques disponibles. L’erreur produite par cette méthode peut être au maximum deux fois plus grande que celle introduite par classificateur Baysien (Devijver et Kittler, 1982).
Avant-propos |