Notion de pollution lumineuse

Formation pollution lumineuse, tutoriel & guide de travaux pratiques en pdf.

Hypothèses de travail

Les objectifs de travail ont été matérialisés en hypothèses explorant l’absence de différences entre les grandes régions suisses, l’existence de disparité entre les villes de tailles différentes, l’opposition entre l’urbain et le rural et la variation selon un gradient centre-périphérie. Ainsi, le phénomène ne devrait pas varier entre les grandes régions mais plutôt en fonction de la taille de la ville et d’un éloignement par rapport aux communes centrales.
Bien que l’hypothèse alternative (H1) représente l’hypothèse de recherche, il a été choisi de mentionner l’hypothèse nulle (H0) car « le travail statistique est fondé sur les deux » (Guay, 2014, p. 8). Ainsi :
§ H0 : Les cantons présentent des taux de croissance et une répartition des émissions lumineuses différents.
H1 : Les taux de croissance et la répartition des émissions lumineuses entre les cantons sont similaires.
§ H0 : Les aires métropolitaines connaissent des taux de croissance et une répartition des émissions lumineuses différents.
H1 : Les taux de croissance et la répartition des émissions lumineuses sont similaires entre les aires métropolitaines.
§ H0 : Les régions linguistiques possèdent des taux de croissance et une distribution du phénomène différents. H1 : Les taux de croissance et la distribution des émissions lumineuses sont similaires entre les régions linguistiques.
§ H0 : Les taux de croissance et les émissions lumineuses sont identiques entre l’urbain et le rural.
H1 : Les régions urbaines connaissent des taux de croissance et des émissions lumineuses plus élevés que les régions rurales.
§ H0 : Les communes centres (CEN), périurbaines (PERI) et suburbaines (SUB) connaissent des taux de croissance et une répartition des émissions équivalents.
H1 : Les communes centres (CEN) possèdent des taux de croissance et une répartition des émissions plus élevés que les communes périurbaines (PERI) et suburbaines (SUB).
§ H0 : les taux de croissance et la répartition des émissions entre les communes intégrant une ville sont similaires.
H1 : Les communes de grande taille (>100’000 habitants) et incorporant une ville possèdent des taux de croissance et une répartition des émissions plus élevés que les communes de taille moyenne (50’000 à 99’999 habitants) et petite (20’000 à 49’999) incluant une ville.
L’expérimentation de ces hypothèses passe par l’acquisition d’une multitude de données dont la présentation est indispensable.

Présentation des données

Tableau 2: données utilisées
Le tableau 2 résume l’ensemble des données utilisées lors de cette étude. Pour retracer l’évolution du phénomène, 33 images satellitaires DMSP-OLS Nighttime Lights Time Series en format tiff ont été récupérées gratuitement sur le site de l’Agence américaine d’Observation Océanique et Atmosphérique (NOAA)3. Lors de la création des images composites annuelles, la NOAA utilise uniquement des observations de grande qualité sans couverture nuageuse, ni d’éclairage solaire et lunaire. Ces images prennent des valeurs entre 1 et 63 et couvrent la période 1992 – 2012. Il a été choisi pour cette étude d’utiliser les données « F1?YYYY_v4b_stable_lights.avg_vis.tif » car elles sont exemptes de tout évènement éphémère (feu) et représentent uniquement les lumières persistantes ou stables. Cependant, l’inter-calibration des images annuelles provenant de multiples satellites DMSP-OLS4 est essentielle en l’absence de calibration interne.
Quant à la distribution du phénomène, 12 images mensuelles d’avril 2015 à mars 2016 en format tiff ont été téléchargées5. Leur construction repose sur la combinaison de données issues de la bande DBN et exemptes de couverture nuageuse et de lumières parasites (foudre, lumière de la lune) (NOAA).
Pour effectuer des analyses statistiques sur les données, il est nécessaire d’agréger les pixels selon une unité d’analyse. La commune semble l’unité la plus adaptée par son nombre restreint (2324 en 2015) et la possibilité d’y joindre facilement les différents niveaux géographiques de la Suisse (unités d’observation). Cette jointure rend ainsi possible l’élaboration d’analyses en fonction de l’appartenance à un type de commune (urbain, rural, périurbain, etc.) ou à une région (linguistique, métropolitaine, etc.).
En outre, différents éléments utiles au bon déroulement de l’étude ont été collectés (couches de base en shapefile des lacs, des frontières administratives nationales et communales, une table contenant le PIB de la Suisse entre 1991 et 2014 indispensable lors du choix de la méthode d’inter-calibration des images DMSP-OLS, …).

Méthodologie

La méthodologie suivie s’appuie sur quatre phases. Les données utilisées pour quantifier le phénomène sont, tout d’abord, extraites des images satellitaires DMSP-OLS et NPP-VIIRS pour chaque commune (SOL – Sum Of Lights). Elles sont ensuite traitées sous forme de tables, jointes aux niveaux géographiques de la Suisse et combinées pour former une base de données. Après une analyse exploratoire, les données sont transformées si nécessaire puis finalement analysées par des tests statistiques en fonction du caractère paramétrique ou non des données.

Collecte des données nécessaires sous Arcgis

Figure 4 : traitements effectués pour extraire la somme des valeurs des pixels par communes
Les traitements résumés à la figure 4 ont été automatisés par un script python disponible à l’annexe 15 pour DMSP-OLS et à l’annexe 14 pour NPP-VIIRS. Dans la mesure où l’inter-calibration des images DMSP-OLS selon la méthode d’Elvidge a été automatisée lors d’un précédent travail (Haenni, 2016), il n’a pas été jugé nécessaire d’intégrer son script en annexe.

Prétraitements

Découpage
Les images satellitaires couvrant l’entièreté du globe (DMSP-OLS) ou une partie (NPP-VIIRS), il a été nécessaire de les découper en fonction d’un rectangle incluant la Suisse. Ce procédé permet d’éviter la manipulation de fichiers volumineux ralentissant les processus et traitements futurs.
Inter-calibration des images DMSP-OLS
Les images NPP-VIIRS étant calibrées entre elles, seules les images satellitaires DMSP-OLS ont été inter-calibrées selon les méthodes d’Elvidge et al. (2014) et Wu et al. (2013). Ces deux méthodes reposent sur l’invariance des valeurs des pixels d’une région pour Elvidge (Sicile) (2014, p. 101) ou de trois pour Wu (Mauritus, Puerto Rico, Okinawa) (Wu et al., 2013, p. 7360) afin d’obtenir un modèle de régression. La méthode de Wu, se basant sur une image de référence non saturée, permet en outre de corriger la saturation des images satellitaires DMSP-OLS(Wu et al., 2013, p. 7359). Dès lors, il est possible d’appliquer les équations suivantes à l’ensemble des images satellitaires :
Pour la méthode d’Elvidge (2014, p. 102) : Y=C0+XC1+X2C2
Pour la méthode de Wu et al. (2013, p. 7360) : Y + 1 = a*(X+1)b
X représente les images non inter-calibrées, Co, C1, C2, a et b sont les coefficients issus des différents modèles et indiqués par Elvdige et al. (2014, p. 102) ou Wu et al. (2013, p. 7362).
Vérification des résultats
Pour contrôler les résultats de l’inter-calibration, les valeurs des pixels pour la Suisse ont été sommées avant et après l’application des deux méthodes et rassemblées dans les figures disponibles à l’annexe
1. Les deux méthodes permettent une meilleure continuité des données entre les années et une diminution des écarts entre des images d’années similaires mais de satellites DMSP différents. Des analyses complémentaires quant à la vérification de l’inter-calibration peuvent, en outre, être consultées à l’annexe 1.
Comparaison des méthodes
Les deux méthodes harmonisant les valeurs des données, il est dès lors nécessaire de choisir celle la plus optimale pour la Suisse. Pour ce faire, l’indice de la différence normalisée (NDI – normalized difference index) proposé par Wu et al (2013, p. 7361) et reposant sur la comparaison d’images de même année mais de capteurs différents, a été calculé pour les deux méthodes.
Un NDI faible représente ainsi un inter-calibration de qualité satisfaisante. La méthode la plus adaptée correspondrait donc à celle dont la moyenne des NDI est la plus faible. La figure 5, rassemblant les différents NDI selon les deux méthodes, illustre la difficulté à départager les deux méthodes car les moyennes (0.0261 pour Elvidge et 0.0283 pour Wu), et les écarts sont similaires entre les méthodes.
Figure 5 : NDI selon les méthodes d’intercalibration – utile à la vérification
Une autre démarche soumise par Wu et al (2013, p. 7361) consiste à analyser la relation entre la somme des valeurs des pixels (SOL) pour chaque année et le produit intérieur brut (PIB – en $ constant 2005). Ces deux variables étant liées par une relation linéaire (corrélation) selon certaines études (Wu et al., 2013, p. 7366), la méthode la plus adéquate possède ainsi le R2 le plus proche de 1. La figure 6 révèle une corrélation forte (R2 de 0.747) entre le PIB et la somme des lumières pour la méthode de Wu et faible (R2 de 0.409) pour la méthode d’Elvidge. Par conséquent la méthode de Wu semble la plus adaptée pour cette étude.
Figure 6 : lien entre le PIB en $ constant de 2005 et la somme des valeurs des pixels (SOL)
Calcul d’une composite annuelle (moyenne) – NPP-VIIRS Les images mensuelles du NPP-VIIRS d’avril 2015 à mars 2016 ont été combinées en une seule image couvrant ainsi une année complète et permettant une analyse plus robuste.

 Projection équivalente

Les images satellitaires présentant un système de coordonnées géographiques GCS_WGS_1984, il a été indispensable de les projeter selon une projection équivalente conique d’Albers conservant les surfaces et dont les caractéristiques sont résumées ci-contre.
Pour obtenir une projection optimale, cette dernière est centrée sur la Suisse.

Extraction et agrégation des valeurs des pixels par communes

La somme des valeurs des pixels (SOL) de chaque commune a été extraite par l’outil « statistique zonale (table) » avec une résolution de 250 mètres pour correspondre à l’unité spatiale d’analyse (la commune). Dès lors, un travail de recombinaison des tables est essentiel pour obtenir une base de données exploitable.

Création d’une base de données sous Excel

L’étape précédente a permis la collecte d’une table contenant la somme des lumières issue des images satellitaires NPP-VIIRS et de 31 tables correspondant aux images DMSP-OLS pour les 2324 communes suisses. Lorsque deux satellites DMSP couvrent la même année, une moyenne des deux images est utilisée, réduisant ainsi les tables à 19 (1992 à 2010). L’étape suivante consiste à joindre, en utilisant le numéro des communes comme géocode (identifiant), les différents niveaux géographiques (Les niveaux géographiques de la Suisse – OFS) ainsi que la superficie des communes en hectares avec la table intégrant les données agrégées issues des satellites. À ce propos, l’annexe 2 résume les différentes nomenclatures retenues pour cette étude, leurs valeurs et leurs intitulés.
Pour retracer l’évolution du phénomène entre 1992 et 2010, un taux de croissance (tc) a été calculé
Etant donnée la grande variabilité des données issues des satellites DMSP-OLS, ce taux de croissance a été calculé à partir de la moyenne de deux périodes (1992-1995 à 2007-2010), réduisant ainsi passablement le risque d’erreur dû à l’inter-calibration.
Quant aux différentes données issues de l’agrégation par commune des valeurs des pixels des images satellitaires (SOL), elles sont divisées par la superficie en hectares de la commune correspondante pour minimiser les effets de taille et ainsi rendre possible leur comparaison.
La base de données rassemblant les deux variables quantitatives (taux de croissance entre les périodes 1992-1995 et 2007-2010 et la somme des valeurs des pixels corrigée par la superficie en hectares) et les différents niveaux géographiques pour chacune des 2324 communes suisses, il est dès lors possible d’effectuer des comparaisons spatio-temporelles (1992 et 2010 – DMSP-OLS) et spatiales (NPP-VIIRS, moyenne d’avril 2015 à mars 2016).

Analyse exploratoire des données sous

La base de données recueillant ainsi des variables quantitatives (tc et SOLc) et qualitatives (niveaux géographiques de la Suisse), il est judicieux de partager l’analyse exploratoire entre les données spatio-temporelles (taux de croissance) et spatiales (SOLc) ainsi qu’entre les différentes variables qualitatives). L’analyse exploratoire consiste principalement à vérifier la normalité de la distribution (test de Shapiro-Wilk, Skewness, kurtosis, histogramme et boxplot), l’homogénéité des variances (Test de Levene et de Fligner Killeen) et la présence d’outliers (Boxplot, z-score). Les deux premières assomptions sont fondamentales car elles orientent le choix des futurs tests statistiques qui serviront à évaluer la significativité des différences au sein des divers sous-groupes. Dans le cas de leur violation, une transformation (logarithme, racine) est appliquée sur les données et permet parfois de résoudre certains problèmes de distribution et d’hétérogénéité des variances.
Toujours est-il que, lorsqu’aucune transformation ne fonctionne, le recours à des tests non-paramétriques ne faisant aucune hypothèse sur la distribution des données s’impose. Après une brève initiation théorique aux tests statistiques mentionnés précédemment et à leur seuil de rejet α, ces derniers seront, comme en témoigne la figure 7, appliqués au taux de croissance (tc) et à la somme des valeurs des pixels corrigée par la surface en hectares (SOLc) pour l’ensemble des données et pour chaque sous-groupe (niveaux géographiques suisses). De plus, différents exemples de commandes sous R en lien avec l’analyse exploratoire sont disponibles aux annexes 3 et 4.

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *