MODÉLISATION STATISTIQUE INTER ÉVÉNEMENTIELLES DES VOLUMES, DES MASSES
ET DES CONCENTRATIONS
MODÈLES DE DISTRIBUTION
Méthodologie Des nombreuses études ont montré que la distribution des valeurs de la concentration moyenne événementielle en polluant pour un site donné suit une loi lognormale (Duncan, 1999; Smullen et al., 1999; Sztruhara et al., 2002; Mourad et al., 2005c; Dembélé, 2010). Nous avons donc testé l’adéquation de cette loi aux distributions empiriques observées. Nous avons aussi cherché à vérifier si une loi normale pouvait fournir une représentation acceptable. En effet ce type de loi est plus facile à manier dans une simulation de type MonteCarlo (Bertrand-Krajewski and Chebbo, 2004; Rossi et al., 2005). Nous rappelons que si une variable aléatoire positive X suit une loi lognormale de moyenne X et d’écart-typeσ X , alors le logarithme népérien de cette variable Y Ln X = ( ) suite une loi normale, et les relations entre les paramètres des deux distributions sont : ( ) ( ) 2 2 2 et 1 X e e X X µ σ σ σ + = = − , Avec µ σ et respectivement la moyenne et l’écart type des concentrations moyennes de la loi normale obtenue après transformation logarithmique népérienne. La médiane de la variable aléatoire X est e µ . Elle est inférieure à la valeur moyenne X (Figure 81) et les fortes valeurs de la variable aléatoire lognormale ont moins de probabilité à se produire que celle des faibles valeurs. Par ailleurs, la loi lognormale est plus satisfaisante que la loi normale pour représenter des données positives pour des raisons physiques, car elle minorée par zéro. Pour déterminer si une distribution de valeurs suit une loi normale ou une loi lognormale, nous avons utilisé deux tests statistiques : test de normalité de distributions et test d’ajustement d’une distribution. Le premier test a été utilisé pour tester la normalité d’une distribution est le test non-paramétrique de Shapiro-Wilk. Nous avons utilisé ce test pour tester aussi la lognormalité d’une distribution en faisant une transformation logarithmique népérienne. Le test non-paramétrique de Kolmogorov-Smirnov a été utilisé pour vérifier l’ajustement d’une loi théorique aux distributions des flux et des concentrations. Ce test est basé sur la distance maximale entre une fonction de répartition théorique (entièrement déterminée par les valeurs connues de ses paramètres) et la fonction de répartition empirique de l’échantillon.
Résultats obtenus
Volume moyen événementiel
La forme des fonctions de répartition empiriques des volumes moyens événementiels par unité de surface active atteste que leurs distributions ne sont pas normales (Figure 82). Cette non-normalité a été validée par un test statistique de Shapiro-Wilk au seuil de signification de 5% (valeur p <10-4 pour les deux sites). De plus, le test de Kolmogorov-Smirnov montre qu’on peut valider l’hypothèse H0 : « les deux sites ont même distribution de volume » au seuil de signification de 5% (valeur p = 34% >>5%). Les distributions des valeurs du volume moyen événementiel peuvent être approximées par une loi lognormale (Figure 82) au seuil de signification de 5% sur les deux bassins versants (test de Kolmogorov-Smirnov et test de Shapiro-Wilk). L’ajustement d’une loi lognormale en utilisant le test d’ajustement de Kolmogorov-Smirnov montre que les paramètres ajustés sont très proches des paramètres empiriques. Le Tableau 21 synthétise les caractéristiques statistiques des ces distributions. Les valeurs sont normalisées par la surface active pour les deux bassins versants. Ce tableau montre que les moyennes et les écart-types ajustés de deux distributions s’avèrent assez voisins entre les deux bassins versants, avec une production un peu plus forte à Clichy qu’à Quais.
Masse moyenne événementielle
Comme pour les volumes, la forme des distributions des masses moyennes événementielles par surface active atteste que ces masses ne sont pas normalement distribuées. Le test de Shapiro-Wilk valide cette observation au seuil de signification de 5% (valeur p <10-4 pour les deux sites). De plus, le test de Kolmogorov-Smirnov montre qu’on peut valider l’hypothèse H0 : « les deux sites ont même distribution de masse» au seuil de signification de 5% (valeur p = 67% >>5%). Sur les deux bassins versants, les résultats montrent que la masse moyenne événementielle est distribuée suivant une loi lognormale (Figure 83). Le test statistique accepte cette hypothèse au seuil de signification de 5%. Le Tableau 22 synthétise les caractéristiques statistiques des ces distributions. Ce tableau montre que les paramètres ajustés de deux distributions s’avèrent assez voisins entre les deux bassins versants.