La classification d’image en télédétection

LA CLASSIFICATION D’IMAGE EN TÉLÉDÉTECTION

Un analyste qui tente de classer les caractéristiques d’une image, utilise les éléments de l’interprétation visuelle pour identifier des groupes homogènes de pixels qui représentent des classes intéressantes de surfaces. La classification d’images utilise en général l’information spectrale contenue dans les valeurs des pixels d’une ou de plusieurs bandes spectrales pour classifier chaque pixel individuellement. Ce type de classification est appelé reconnaissance de regroupements spectraux .

Principe et but de la classification

Les deux façons de procéder (manuelle ou automatique) ont pour but d’assigner une classe bien définie ou thème (par exemple : eau, forêt de conifères, maïs, etc.) à chacun des pixels d’une image. L’image obtenue est essentiellement une représentation thématique de l’image originale. Lorsqu’on parle de classes, il faut différencier ce qu’on appelle classes d’informations et classes spectrales [1]. Les classes d’informations sont des catégories d’intérêt que l’analyse tente d’identifier dans les images, comme des différents types de cultures, de forêts ou d’espèces d’arbres, différents types de caractéristiques géologiques ou de roches, etc. Les classes spectrales sont des groupes de pixels ayant plus ou moins les mêmes caractéristiques en ce qui concerne leur valeur d’intensité dans les différentes bandes spectrales de l’image.

L’objectif ultime de la classification est de faire la correspondance entre les classes spectrales et les classes d’information. Il est rare qu’une correspondance directe soit possible entre ces deux types de classes. Des classes spectrales bien définies peuvent apparaître parfois sans qu’elles correspondent nécessairement à des classes d’information intéressantes pour l’analyse. D’un côté, une classe d’information très large (par exemple forêt) peut contenir plusieurs sous – classes spectrales avec des variations spectrales définies. En utilisant l’exemple de la forêt, les sous- classes peuvent être causées par des variations dans l’âge, l’espèce, la densité des arbres ou simplement par les effets d’ombrage ou des variations dans l’illumination. L’analyste a le rôle de déterminer l’utilité des différentes classes spectrales et de valider leur correspondance à des classes d’information utiles.

Les catégories de classification d’images de télédétection

Les méthodes de classification peuvent être séparées en deux grandes catégories: les méthodes de classification supervisée et les méthodes de classification non- supervisée .

Classification supervisée
Lors de l’utilisation d’une méthode de classification supervisée, l’analyste identifie des échantillons assez homogènes de l’image qui sont représentatifs de différents types de surfaces (classes d’information). Ces échantillons forment un ensemble de données d’apprentissage. La sélection de ces données est basée sur les connaissances de l’analyste, sa familiarité avec les régions géographiques et les types de surfaces présentes dans l’image. L’analyste supervise donc la classification d’où le nom de classification supervisée [1]. Les informations numériques de chaque pixel dans chacune des bandes spectrales de cet ensemble sont utilisées par l’ordinateur pour définir les classes et ensuite identifier les régions des propriétés similaires à chaque classe. L’ordinateur utilise un programme spécial ou algorithme afin de déterminer la « signature » numérique de chacune des classes. Plusieurs types d’algorithmes sont possibles. Une classification supervisée commence donc par l’identification des classes spectrales contenues dans l’image.

Classification non- supervisée
La classification non supervisée procède de la façon contraire. Les classes spectrales sont formées en premier lieu, basées uniquement sur l’information numérique des données. Les classes sont ensuite associées, par un analyste, à des classes d’information utile (si possible). Des programmes appelés algorithmes de classification sont utilisés pour déterminer les groupes statistiques naturels ou les structures des données. Habituellement, l’analyste spécifie le nombre de groupes ou classes qui seront formés avec les données. De plus, l’analyste peut spécifier certains paramètres relatifs à la distance entre les classes et la variance à l’intérieur même d’une classe. Le résultat final de ce processus de classification itératif est l’obtention des classes que l’analyste pourra combiner ou séparer de nouveau. Chacune de ces étapes nécessite une nouvelle application de l’algorithme. L’intervention humaine n’est donc pas tellement nécessaire dans l’élaboration de la classification non supervisée. Cette méthode ne commence pas avec un ensemble prédéterminé de classes comme pour la classification supervisée .

Evaluation de la qualité d’une classification

Problématique

D’une manière générale, la qualité d’une classification est évaluée par rapport aux objectifs poursuivis par l’analyste et au thème traité. Chacun convient que les précisions attendues pour produire les classes nécessaires au fonctionnement d’un modèle hydrologique sont sensiblement différentes de celles fixées pour un inventaire cultural. La diversité des objectifs entraîne une diversité de critères d’évaluation. Selon le thème, l’accent peut être mis sur la conformité thématique ou géométrique. L’évaluation globale d’une classification est donc un concept complexe comprenant la référence à plusieurs critères et pouvant se dérouler en plusieurs étapes [3]. Il n’est guère possible de formuler une procédure unique. Une bonne évaluation repose sur l’esprit critique de l’analyste et sur sa rigueur scientifique. Néanmoins, la phase confiée à l’algorithme de classification représente une action déterministe précise. Il est donc légitime de l’évaluer pour elle-même. Il incombe à l’analyste ensuite d’estimer la part que cette évaluation représente dans la qualité des résultats finaux.

Les classifications dirigées ont été conçues pour permettre une évaluation de la capacité d’un algorithme à restituer une zone dont on lui a fourni la signature spectrale. L’évaluation ne s’opère donc que sur une partie connue de l’image, c’est-à-dire sur des zones tests. Par hypothèse, on étend ces résultats à l’ensemble de l’image. Cette inférence repose sur des hypothèses statistiques spécifiques, mais qui relèvent aussi du bon sens : la représentativité de ces zones tests par rapport à l’ensemble de l’image à classer et leur indépendance par rapport aux zones d’entraînement ayant servi au calage du modèle de classification. Dans quelle mesure l’évaluation réalisée sur les zones tests est-elle extrapolable à l’ensemble de la région traitée ? L’analyste confortera son évaluation en recourant à toute information éventuellement disponible et relative au lieu d’étude : carte topographique, ancien état de l’occupation du sol, bref, toute information susceptible de conforter la fiabilité du document final. Ce constat renforce encore la nécessité d’intégrer l‘image de télédétection dans une base de données géographiques.

L’évaluation quantitative s’appuie sur des outils statistiques développés dans le cadre d’une échelle de mesure nominale dont l’élément principal est la matrice de confusion. De cette matrice, on déduit plusieurs indices caractérisant chacun une propriété particulière des résultats.

Matrice de confusion

La matrice de confusion est un tableau à double entrée, une table de contingence . En ligne s’expriment les résultats par rapport aux différentes classes thématiques définies dans l’image classifiée. Les colonnes expriment les résultats par rapport aux zones de références délimitées qui servent soit à calculer les paramètres statistiques pour la classification (zone de calage), soit à vérifier les résultats de classification (zone test). La cellule de croisement indique par conséquent le nombre de pixels appartenant à la classe i et assignés à la classe j. Les cellules correspondant à i = j expriment le nombre de pixels correctement affectés. Les calculs des marges de la matrice de confusion révèlent le nombre de pixels qui ont été classés dans une autre classe que celle à laquelle ils appartiennent réellement ou qui n’ont pas été classés du tout.

Table des matières

INTRODUCTION GÉNÉRALE
PARTIE I : GÉNÉRALITÉS
Chapitre I : LA CLASSIFICATION D’IMAGE EN TÉLÉDÉTECTION
I.1 Introduction
I.2 Principe et but de la classification
I.3 Les catégories de classification d’images de télédétection
I.4 Les classificateurs ou algorithmes de classification
I.5 Evaluation de la qualité d’une classification
Chapitre II : NOTION DE FUSION EN TÉLÉDÉTECTION
II.1 Introduction
II.2 Fusion d’images
II.3 Combinaison de classificateurs
PARTIE II : LA THÉORIE DE DEMPSTER – SHAFER ou LA THÉORIE DE L’ÉVIDENCE
Chapitre III : PRÉSENTATION DE LA THÉORIE DE DEMPSTER – SHAFER
III.1 Introduction
III.2 Principe
III.3 Modélisation des masses d’évidence
III.4 Règle de combinaison de Dempster
Chapitre IV : APPLICATION DE LA THÉORIE AUX IMAGES CLASSIFIÉES
IV.1 Introduction
IV.2 Logiciels utilisés
IV.3 Données
IV.4 Processus de combinaison
PARTIE III : RÉSULTATS ET DISCUSSIONS
Chapitre V : RÉSULTATS ET DISCUSSIONS
V.1 Résultats obtenus à partir des classificateurs individuels
V.2 Résultats de la combinaison de classificateurs
V.3 Discussions
V.4 Apport de la combinaison de classificateurs selon la théorie de Dempster – Shafer
CONCLUSION GÉNÉRALE
ANNEXE
RÉFÉRENCES