Techniques de classification d’images de télédétection pour la détection de routes

Plusieurs techniques d’extraction existent pour identifier des routes à partir des données de télédétection (Veneziano et al., 2002). Le choix d’une technique de détection de route dépend du type et de la qualité de la donnée de télédétection. Elle repose généralement sur une technique de classification d’images pour identifier les composantes terrestres (Mena, 2003). Certaines données nécessitent un prétraitement avant d’entamer le processus de classification. On pense par exemple au traitement d’orthorectification des données dans le milieu montagneux pour éliminer des biais de géoréférence au traitement atmosphérique des images satellitaires, ou encore le traitement des valeurs radiométriques normalisées. Il faut aussi s’assurer que les données soient géoréférencées pour assurer leur compatibilité spatiale et permettre la superposition géométrique (Ta et al., 2008). Les techniques d’extraction de réseau routier exploitent généralement deux types d’approches de classification des données de télédétection, en prenant en considération soit les caractéristiques spectrales de l’image (l’approche de la classification à base des pixels) ou soit un ensemble des caractéristiques spectrales, texturales et contextuelles des objets (l’approche de la classification orientée objet (COO)) (Achbun et al., 2011).

La classification à base des pixels des données de télédétection est apparue dans les années 1970 et elle est basée sur les informations de chaque pixel. La méthode de classification à base des pixels consiste en un regroupement des pixels spectralement similaires pour réaliser la classification de l’image (Karsenty et al., 2005). Cependant, la classification par pixel rend difficile l’interprétation de données à cause de l’effet de sel et poivre dans le résultat final (Achbun et al., 2011). Lorsque la résolution spatiale est fine, la discrimination des différentes classes d’occupation du sol n’est plus aisée car l’hétérogénéité des objets à extraire croît. La classification par pixel n’est limitée qu’aux caractéristiques spectrales du pixel. Par conséquent, elle n’est pas bien adaptée pour l’analyse des données de télédétection contenant beaucoup de détails d’informations, typique des images à très haute résolution spatiale. Afin de remédier à ces limites, l’approche de la COO a été développée se basant sur les objets (Blaschke et al., 2000; Sparfel et al., 2010).

La COO est une technique d’analyse des données de télédétection basée sur le regroupement des pixels selon leur appartenance à des régions homogènes, ayant en commun des caractéristiques spectrales, spatiale, morphologique, texturales, contextuelle, temporelle et thématique (Blaschke, 2010). La COO permet d’attribuer les objets spatiaux à des classes d’occupation du territoire (Achbun et al., 2011). La COO est un processus en deux étapes, qui sont la segmentation pour produire les objets spatiaux et la classification des objets. La segmentation a pour objectif de générer différents objets d’image de télédétection ayant de caractéristiques spectrales, spatiales, géométriques et texturales homogènes. La COO améliore la précision des objets détectés lors de la segmentation de l’image en zones homogènes, ce qui joue sur la qualité visuelle de la production cartographique par rapport à la méthode pixel par pixel (Achbun et al., 2011). Les objets d’image déduits de la segmentation jouent un double rôle dans la COO, ils améliorent la classification automatique des images de télédétection et aussi ils permettent l’exportation des informations extraites facilement en polygones dans les systèmes de géo-information (Sherba et al., 2014). La COO présente l’avantage d’intégrer, au-delà des caractéristiques spectrales, d’autres caractéristiques spatiales additionnelles pour classifier les objets de l’image. Elle permet l’usage d’informations spatiales selon plusieurs catégories (spectrales, indices, forme, relationnelle) de l’image (Blaschke et al., 2000; Sparfel et al., 2010). On pense aux caractéristiques de l’objet telles que, la géométrie (la largeur, la pente, le périmètre, le rapport de la longueur sur la largeur), la forme, la compacité, le lissage et la topologie exprimant la position géographique de l’objet dans l’image par rapport aux autres objets (Karsenty et al., 2005). Plusieurs méthodes de classification ont été utilisées parmi lesquelles, on trouve principalement la classification par fonctions d’appartenance ou semi-automatique. Ces fonctions font appel à des règles de décision se basant sur le pouvoir séparateur des différents paramètres en jeu (couleurs et texture) (Clode et al., 2004; Karsenty et al., 2005; Kiss et al., 2015). La classification utilisant un grand nombre de métriques dans les fonctions est la plus précise parmi les approches disponible de la COO (Achbun et al., 2011; Myint et al., 2011; Sparfel et al., 2010).

Un échantillonnage composé de 241 observations de terrain pour l’ensemble de trois zones d’études a été réalisé à l’été 2019. Les données de terrain réfèrent aux caractéristiques des composantes de route telles que : largeur de la surface de roulement, largeur de l’emprise, la pente de la route, la localisation de la route (X,Y avec GPS portatif Trimble) et la profondeur de fossé. Les différentes informations sur le chemin servent à identifier les composantes morphologiques et caractériser les routes. La stratification de l’échantillonnage a été réalisée pour chaque zone selon la classe d’âge de route (récente > 2012 et vieille < 2012, information disponible auprès des compagnies forestières opérant dans chaque zone), la classe de largeur de l’emprise du chemin d’été gravelé entre 25 m et 35 m disponibles dans la base de données routière du MFFP de Québec (Latrémouille, 2012; MERN, 2015), la pente longitudinale de la route (forte pente > 4 % et faible pente < 4 %) avec cinq réplicas. Nous avons regroupé avec la méthode de clustering par segmentation hiérarchique ascendante sous le logiciel R les routes glavelées disponibles en trois principales catégories de largeur de l’emprise et de la pente longitudinale des observations de terrain, en se basant sur le critère de dissimilarité de distance euclidienne. Le regroupement en cluster a été déterminé par la méthode ward.D2 de la fonction hclust pour minimiser la variance intraclasse (Dolnicar et al., 2018; Murtagh et Legendre, 2014; Rizzo et al., 2019) et le découpage en trois clusters par la méthode cutree (Rizzo et al., 2019; Roy et Bhattacharya, 2019).

La figure 2.2a montre un regroupement des routes en trois catégories (étroite, moyenne et large) selon la largeur de l’emprise dont les intervalles varient 7 – 15m, 16 – 30m et 31 – 46m respectivement. La figure 2.2b présente trois classes de pente longitudinale (faible, moyenne et forte) variant entre 0 – 4%, 5 – 10% et 11 – 16% respectivement. En plus des données précédemment disponibles, nous avons utilisé également les données de l’imagerie Sentinel-2 orthorectifiés (Gascon et al., 2017; Li et al., 2018) et des produits dérivés du LiDAR aéroporté (MNT et MHC) pour les trois zones d’étude. Les images Sentinel-2 sélectionnées, ont été acquises par les satellites 2A et 2B respectivement le 9 octobre 2019, le 24 août 2019 et le 18 septembre 2019 à une résolution spatiale de 10 mètres panchromatique. Nous avons considéré uniquement les données optiques de Sentinel-2 à faible taux de nuage pour préserver et garantir le maximum possible d’informations (Gascon et al., 2017). Le MNT et le MHC proviennent du MFFP de Québec à une résolution de 1m, produits avec les données LiDAR de densité de deux à quatre points par mètre carré au sol. Les données dérivées de LiDAR sont disponibles pour les zones de Senneterre depuis 2018, et pour les zones de La Doré et de La Tuque en 2019 (Leboeuf et Pomerleau, 2016).

Étude de sensibilité des paramètres de la segmentation

La segmentation multi résolution a été utilisée pour découper les images d’entrée en objets homogènes ayant les mêmes caractéristiques spectrales, géométriques, et texturales des pixels (Akcay et al., 2018; Benz et al., 2004; Blaschke et al., 2000). Les données d’entrées à la segmentation sont principalement les couches obtenues après filtrage (la pente et l’IC filtrés) et celles non filtrées (le MHC, la pente et l’IC). Chaque couche a été associée à un poids en fonction de son impact et intérêt dans le processus de l’identification des objets route (Mallinis et al., 2008; Sparfel et al., 2010). Une approche empirique et itérative d’une plage de poids allant de 0% à 100% a été testée pour évaluer l’apport de chaque couche dans le processus de la segmentation. Le poids le plus fort (100% de poids) a été accordé à l’IC et au MHC, car ces couches sont riches en information sur les dimensions et structures de sol nu. Le poids faible (10% de poids) a été affecté aux couches restantes par rapport à leur contribution dans le processus de segmentation (Akcay et al., 2018). Trois approches de segmentation ont été réalisées en fonction de la nature de la donnée d’entrée, chacune considérant en entrée soit : les données dérivées de LiDAR aéroporté (Pente filtrée, Pente et MHC), les données optiques Sentinel-2 (IC filtré et IC) ou la combinaison de deux données précédentes.

Une approche empirique et itérative de la segmentation d’une image en objets a été nécessaire pour raffiner les paramètres de la segmentation et de définir leurs poids optimaux respectifs (Benz et al., 2004; Sherba et al., 2014; Willhauck et al., 2000). Les paramètres d’échelle de la forme et de la compacité ont été choisis pour la création d’objets routiers homogènes (Achbun et al., 2011; Baatz et Schäpe, 2010; Willhauck et al., 2000). Parce qu’il n’existe pas des poids idéaux des paramètres de segmentation, l’échelle (E) a été variée entre 10, 20, 50, 100, 200 et 400 dans le but d’obtenir respectivement les objets de petites, moyennes et grandes tailles. La forme (F) variant inversement avec la couleur dans l’intervalle des valeurs entre 0 et 1 avec un pas de 0.1. La compacité (C) a été fixée dans l’intervalle des valeurs 0 et 0.5 avec un pas de 0.1. Les poids optimaux des paramètres ont été retenus que lorsque les critères suivants ont été respectés : éviter la sursegmentation des objets, y compris toutes les valeurs de la compacité supérieures à 0.5 et avoir la meilleure exactitude estimée de la segmentation, de telle sorte que les objets segmentés couvrent la forme linéaire de la route (Akcay et al., 2018; Karakış et al., 2006).

Table des matières

AVANT-PROPOS
LISTE DES FIGURES
LISTE DES TABLEAUX
RÉSUMÉ
CHAPITRE I INTRODUCTION GÉNÉRALE
1.1 Problématique
1.2 État des connaissances
1.2.1 Réseau routier forestier
1.2.2 Caractérisation du réseau routier forestier
1.2.3 Données de télédétection
1.2.4 Techniques de classification d’images de télédétection pour la détection de routes
1.3 Objectifs
CHAPITRE II DÉTECTION AUTOMATIQUE DU RÉSEAU ROUTIER EN FORÊT BORÉALE PAR TÉLÉDÉTECTION
2.1 Résumé
2.2 Introduction
2.3 Méthodes
2.3.1 Zone d’étude
2.3.2 Données
2.3.3 Détection et caractérisation des routes
2.4 Résultats
2.4.1 Prétraitement des données disponibles
2.4.2 Étude de sensibilité des paramètres de la segmentation
2.4.3 Sélection des métriques
2.4.4 Classification par fonctions d’appartenance
2.4.5 Post-traitement
2.4.6 Évaluation des performances
2.5 Discussion
2.6 Conclusion
CHAPITRE III CONCLUSION GÉNÉRALE
ANNEXE A ANALYSE DE SENSIBILITE DES PARAMETRES DE LA SEGEMENTATION MULTI-RESOLUTION
ANNEXE B ÉVALUATION DES PERFORMANCES PAR ZONE D’ÉTUDE (SENNETERRE, LA DORÉE ET LA TUQUE) EN FONCTION DE LA SOURCE DE DONNÉES (LIDAR, SENTINEL-2 ET LA FUSION DE DEUX) AVANT POST-TRAITEMENT
ANNEXE C ÉVALUATION DES PERFORMANCES PAR ZONE D’ÉTUDE (SENNETERRE, LA DORÉE ET LA TUQUE) EN FONCTION DE LA SOURCE DE DONNÉES (LIDAR, SENTINEL-2 ET LA FUSION DE DEUX) APRÈS POST-TRAITEMENT
BIBLIOGRAPHIE GÉNÉRALE