Caractéristique de tendance centrale
La Moyenne arithmétique :
Notée Me, c’est la valeur, observée ou possible, dans la série des données classées par ordre croissant (décroissant) qui partage cette série en deux parties comprenant exactement le même nombre de données de part et d’autre d’elle-même. Contrairement à la moyenne arithmétique, elle n’est pas influencée par les valeurs extrêmes ou aberrantes. On déduit la médiane de deux façons, selon les valeurs xi, d’effectifs n rangées par ordre croissant : empirique. Elle tient compte de toutes les données, c’est la meilleure caractéristique de dispersion d’un échantillon ou d’une distribution. Elle se traduit par la relation : Notée , c’est la racine carrée de la variance. Elle est la moyenne de la somme des carrés des écarts par rapport à la moyenne arithmétique. Plus est petit, plus les données sont regroupées autour de 𝑥 et plus la série est homogène.
Boîte à dispersion
[2] Plus connu sous l’appellation, diagramme en « boîte à moustache » ou « Box-Plot (Tukey) ». Il permet de représenter les principales caractéristiques d’une distribution en utilisant les quartiles comme : la médiane, l’intervalle interquartile et la valeur maximale et minimale de la distribution, ainsi que les valeurs extrêmes qui nous intéressent. Ce graphique est beaucoup plus compact qu’un histogramme, mais ne présente pas autant de détails par rapport à la distribution. On utilise l’histogramme pour la forme et la nature, les Box-Plot pour les caractéristiques de la distribution. Nous allons procéder comme suit à l’aide de SPSS pour représenter les hauteurs de précipitations, ainsi que certains indices : Nous pouvons avoir une idée de la tendance centrale des valeurs de chaque boite en observant la position de la médiane. Si la médiane n’est pas au centre, on peut juger de la symétrie de la distribution (aplatissement et asymétrie). Par la longueur de la boite, il est possible d’estimer la variabilité des précipitations pour une échelle de temps choisie. Enfin, la longueur des « moustaches (Wiskers) » donne une idée de la taille de la queue de la distribution, dont les extrémités sont voisines du premier et 99e centile (0,022 et 0,978 précisément). La figure 23 illustre ce graphique.
[2] Pour préciser le type de liaison pouvant exister entre eux, la nature et l’intensité de cette liaison sont définies à l’aide du rapport de corrélation linéaire. Soient 𝑥 et 𝑦 les moyennes des valeurs prises par les variables X et Y (d’effectif respectif ni et nj), et x, y les écarts-types respectifs. Le rapport de corrélation linéaire r est le coefficient symétrique par rapport aux variables X et Y défini par la relation : Les précipitations sont des phénomènes qui agissent en dépit des facteurs spatio-temporelles. L’utilisation de la statistique mathématique est plus que nécessaire puisque nous travaillons sur un échantillon relativement grand. Effectivement, cette méthode joue le rôle de vérificateurs sur les estimations faites par l’intermédiaire des lois statistiques et des tests. Nous l’utiliserons surtout en analyse des valeurs extrêmes et en analyse de la variabilité spatio-temporelle des précipitations.
La loi normale ou de Gauss
Notons que les phénomènes météorologiques et climatologiques sont des évènements aléatoires. La loi normale dépend de deux paramètre la moyenne 𝑥 et l’écart-type , de ce fait, elle permet de localiser une valeur par rapport à la moyenne en fonction de l’écart-type. Toute distribution de probabilité est proche de cette loi en fonction des coefficients de symétrie et d’aplatissement. Sa représentation est la courbe de la densité de probabilité de la loi normale, la courbe de Gauss qui délimite l’aire représentant toutes les valeurs de l’échantillon. Notons que notre échantillon est considérablement grand (n = 65,5) et les valeurs sont toutes positives, par définition, la précision d’une estimation se repose sur la taille de l’échantillon, plus la taille d’un échantillon est grand (petit) plus elle s’approche (éloigne) d’une loi normale. En théorie de l’estimation des moyennes, le choix conventionnel de n = 30 pour l’échantillon permet d’avoir cette précision en appliquant la loi normale. Ce qui est en effet la justification du choix de la période pour le calcul des normales climatiques qui est égale à 30 ans. Nous utiliserons surtout cette loi pour identifier statistiquement les valeurs extrêmes aux extrémités de la distribution ; plus précisément, les valeurs au-delà de ± 3𝜎 [10] [2] [27] [28]. Une des fonctionnalités de SPSS avec la fonction Explorer est la détection des 5 plus petites (grandes) valeurs au-delà de ± 2.698𝜎 en utilisant cette loi sur les valeurs centrées-réduites. Nous estimerons si les valeurs de la période étudiée présentent ces caractéristiques.