LA THÉORIE DES VALEURS EXTRÊMES UNIVARIÉES
Les valeurs extrêmes sont des valeurs beaucoup plus fortes (ou beaucoup plus faibles) que celles observées autour de la moyenne. L’étude de ces valeurs revient à l’analyse de la plus grande (petite) observation de l’échantillon. Ainsi contrairement à la théorie des statistiques classiques qui est basée principalement sur l’étude de la moyenne d’un échantillon, la TVE est basée sur l’approximation asymptotique des lois des extrema convenablement normalisés des vecteurs aléatoires dont les composantes sont des variables supposées indépendantes identiquement distribuées. Cette théorie a été développée pour l’estimation de la probabilité d’occurrence 1 d’événement extrême, notamment celles de dépassement d’un seuil élevé et l’estimation d’une quantité dont la probabilité d’observation est très faible appelée quantile (voir la définition 12 ). L’utilisation de cette théorie repose sur des propriétés des statistiques d’ordre et sur des méthodes d’extrapolation. Après avoir vu que les distributions des extrêmes convergent vers une loi dégénérée, nous allons voir les deux outils fondamentaux de cette théorie : l’étude du comportement asymptotique des valeurs extrêmes qui donne lieu à trois types de lois appelés les lois des valeurs extrêmes données par le théorème de Fisher et Tippett et unifiées par le théorème de Von Mises et Jen Kinson, et l’étude de la loi conditionnelle des excès donnée par le théorème de Pickands(1975) et Balkema et de Haan (1974). Mais avant de passer à ce dernier, nous parlerons tout d’abord de la caractérisation des trois domaines d’attraction. 1.1 Distributions des valeurs extrêmes La définition suivante est essentielle pour l’étude de cette théorie.
Distributions asymptotiques du maximum
Comme la fonction de répartition obtenue précédemment conduit à une loi dégénérée lorsque n tend vers l’infini, cherchons alors une loi non dégénérée pour le maximum de X. Le théorème de Fisher-Tippett, un des fondements de cette théorie, nous aide à cette détermination. Ce théorème est établi en 1928 par Fisher et Tippett. Avant d’énoncé ce théorème, commençons par voir quelques définitions. Définition 2. (Loi de même type) On dit que deux variables aléatoires X et Y sont de même type s’il existe des constantes réels a > 0 et b ∈ R tels que : Y Loi = aX + b c’est-à-dire si F et G sont les distributions respectives des variables X et Y alors on a F(ax + b) = G(x) Définition 3. (Loi max-stable) La loi Lo est dite max −stable, si ∀n ≥ 2,(X1, X2, …, Xn) étant des variables aléatoires indépendantes de loi Lo, il existe deux suites an > 0 et bn ∈ Rtel que :
Distribution généralisée de valeurs extrêmes
Étant donné qu’il est difficile de travailler avec trois distributions à la fois, Von Mises (1954) et Jen Kinson (1955) ont proposé une famille paramétrique de distribution G(x) = G(ξ, µ, σ)(x) appelée distribution des valeurs extrêmes, en anglais « Generalized Extreme Value » notée GEV qui permet d’unifier les trois types de loi extrêmes ci-dessus. Théorème 2. S’il existe des constantes an > 0 et bn ∈ R et une distribution limite non-dégénérée G telle que : limn→∞ P Mn − bn an ≤ x = G(x) Alors G est de la forme Gξ,µ,σ(x) = exp ( − 1 + ξ( x − µ σ ) + − 1 ξ ) , si ξ 6= 0 exp − exp − (x − µ) σ + , si ξ = 0 (1.5) où x+ = max(0, x) et µ, σ, ξ étant respectivement les paramètres de position, de dispersion et de forme aussi appelé indice de valeurs extrêmes ou indice de queue qui ne dépend que de la loi de X. Plus cet indice est élevé en valeur absolue, plus le poids des extrêmes dans la distribution initiale est important. On parle donc de distribution à « queues épaisses ». Pour simplifier, on prend µ = 0 et σ = 1 et on note : G(x) = Gξ(x) = Gξ,0,1(x) = exp h − (1 + ξx) − 1 ξ i (1.6) si 1 + ξx ≥ 0 ; c’est-à-dire x > − 1 ξ Pour ξ = 0 ; on a G0(x) = exp(− exp(−x)), x ∈ R. Voici quelques lignes indicatrices pour la démonstration du théorème 1 de Fisher et Tippett. Démonstration. Nous avons d’après 1.4 limx→∞ FMn (anx + bn) = G(x) (1.7) C’est à dire limx→∞ F n X (anx + bn) = G(x) (1.8) Soit [t] le plus grand entier inférieur ou égal à t. Pour tout t > 0, nous en déduisons que limn→∞ F [nt] X