Modélisation de champs aléatoires à longue mémoire
Modélisation par filtrage
Soit un bruit blanc (εn)n∈Zd de variance σ 2 admettant la représentation spectrale εn = Z [−π,π] d e idZ(λ), Modélisation de champs aléatoires à longue mémoire 18 Modélisation de champs aléatoires à longue mémoire où la mesure contrôle de Z est de densité constante σ 2/(2π) d sur [−π, π] d . On dit que le champ X est obtenu par filtrage de (εn)n∈Zd à travers le filtre a ∈ L 2 ([−π, π] d ) lorsque Xn = Z [−π,π] d e ia(λ)dZ(λ). (2.1.1) La densité spectrale de X s’écrit alors fX(λ) = σ 2 (2π) d |a(λ)| 2 , ∀λ ∈ [−π, π] d . (2.1.2) En posant (ak)k∈Zd la suite des coefficients de Fourier de a, i.e. ak = 1 (2π) d Z [−π,π] d a(λ)e −idλ, la fonction a se décompose en a(λ) = P k∈Zd ake i, où la convergence de la série a lieu dans L 2 , et on peut réécrire le filtrage (2.1.1) dans le domaine temporel : Xn = X k∈Zd akεn−k. D’après l’expression (2.1.2) de sa densité spectrale, le champ X sera à longue mémoire dès que |a| est non-borné. Avant de nous focaliser sur des classes particulières de filtres (les filtres ARMA et les filtres fractionnaires), nous donnons un exemple de filtrage en dimension d = 2 conduisant à un champ dont la densité spectrale est singulière sur toute une ligne. Exemple 1. Soit un champ aléatoire (Xn1,n2 )(n1,n2)∈Z2 obtenu par filtrage d’un bruit blanc fort par a(λ1, λ2) = |λ1 + θλ2| α où −1/2 < α < 0 et θ ∈ R. Sa densité spectrale, définie sur [−π, π] 2 , est proportionnelle à |λ1 + θλ2| 2α . Le champ est à longue mémoire nonisotrope puisque sa densité spectrale ne vérifie par (1.2.1). De plus le lemme suivant montre que sa fonction de covariance ne vérifie pas (1.2.2). Lemme 1. Soit un champ aléatoire (Xn1,n2 )(n1,n2)∈Z2 dont la densité spectrale, définie sur [−π, π] 2 vaut f(λ1, λ2) = |λ1 + θλ2| 2α , où −1/2 < α < 0 et θ ∈ R. Alors sa fonction de covariance ne vérifie pas (1.2.2). La démonstration est donnée dans la section 2.4.
Les champs ARMA
Les champs ARMA sont obtenus dans le cas particulier où le filtre s’écrit, pour tout λ = (λ1, .. . ,λd) ∈ [−π, π] d , a(λ1, .. . ,λd) = Q P (e iλ1 , .. . ,eiλd ) où P et Q sont des polynômes. Pour plus de lisibilité, nous focalisons notre étude sur les champs autorégressifs c’est à dire lorsque le polynôme Q est identiquement égal à 1. Nous allons montrer que contrairement aux processus autorégressifs en dimension 1, un champ autorégressif peut être fortement dépendant. En nous plaçant dans le domaine 2.1 Modélisation par filtrage 19 spectral, nous donnons auparavant quelques conditions générales d’existence des champs autorégressifs. En notant Lj l’opérateur retard par rapport au j eme indice, c’est à dire LjXn1,…,nd = Xn1,…, nj−1, nj−1, nj+1,…,nd , ou encore dans le domaine spectral, LjXn1,n2…,nd = Z [−π,π] d e ie −iλj dZX(λ), où ZX représente la mesure spectrale aléatoire du champ stationnaire X, on remarque qu’un champ autorégressif est solution de l’équation plus familière : P(L1, .. . ,Ld)Xn1,…,nd = εn1,…,nd . (2.1.3) Nous avons considéré un champ autorégressif comme le filtrage d’un bruit par la fonction P −1 (e iλ1 , .. . ,eiλd ); dès que cette dernière est dans L 2 ([−π, π] d ), nous sommes garantis de la stationnarité de X. Réciproquement, sous quelles conditions la représentation (2.1.3) admet-elle une solution stationnaire ? En dimension d = 1, le résultat est bien connu : il est nécessaire et suffisant que le polynôme P n’ait aucune racine de module 1 (cf par exemple Brockwell et Davis (1991)). Cette équivalence n’est plus vraie en dimension quelconque comme le montre la proposition suivante. Proposition 2. Soit (εn)n∈Zd un bruit blanc de mesure spectrale aléatoire Z. La représentation P(L1, .. . ,Ld)Xn1,…,nd = εn1,…,nd (2.1.4) admet une unique solution stationnaire si et seulement si Z [−π,π] d 1 P(e iλ1 , .. . ,eiλd ) 2 dλ < ∞. (2.1.5) Dans ce cas Xn = Z [−π,π] d 1 P(e iλ1 , .. . ,eiλd ) e idZ(λ). (2.1.6) Démonstration. Supposons X stationnaire. En notant ZX la mesure spectrale aléatoire de X, (2.1.4) s’écrit Z [−π,π] d P(e iλ1 , .. . ,eiλd )e idZX(λ) = Z [−π,π] d e idZ(λ). Ceci prouve que X admet une densité spectrale proportionnelle à 1/P(e iλ1 , .. . ,eiλd ) 2 qui est par définition intégrable sur [−π, π] d . Réciproquement, si (2.1.5) est vérifiée, le champ Z [−π,π] d 1 P(e iλ1 , .. . ,eiλd ) e idZ(λ) est solution de (2.1.4) de façon évidente. Supposons qu’il existe une autre solution stationnaire à (2.1.4), le filtrage de cette dernière par 1/P(e iλ1 , .. . ,eiλd ) montre qu’elle est égale à X. 20 Modélisation de champs aléatoires à longue mémoire Remarque 5. Il est important, en vue d’applications, de savoir sous quelles conditions la solution (2.1.6) admet une écriture sous forme de moyenne mobile causale. Cette question présuppose une relation d’ordre dans Z d . Notre objectif étant juste de souligner l’existence de la forte dépendance dans des champs autorégressifs, nous ne rentrons pas dans ces considérations. On trouve dans Guyon (1993) une description des principales écritures de (2.1.6) selon la relation d’ordre choisie. La condition (2.1.5) est équivalente en dimension d = 1 à l’absence de racines de module 1 pour P. Ce dernier point est suffisant en dimension d ≥ 2 pour garantir (2.1.5) mais pas nécessaire. Il est en effet possible qu’un polynôme P vérifie (2.1.5) et qu’il existe par ailleurs (ν1, .. . ,νd) tel que P(e iν1 , .. . ,eiνd ) = 0. D’après la proposition précédente , la représentation (2.1.4) associée à ce polynôme admet une solution stationnaire dont la densite spectrale est proportionnelle à 1/P(e iλ1 , .. . ,eiλd ) 2 . Cette solution stationnaire sera donc fortement dépendante car sa densité spectrale est non bornée. Nous donnons un exemple simple d’une représentation AR conduisant à un champ fortement dépendant. Exemple 2. En dimension d = 5, la représentation Xn1,…,n5 − 1 5 (Xn1−1,n2,…,n5 + Xn1,n2−1,n3,n4,n5 + · · · + Xn1,…,n4,n5−1) = εn1,…,n5 , où ε est un bruit blanc de variance σ 2 , admet une solution stationnaire de densité spectrale fX(λ) = σ 2 (2π) 5 1 1 − e iλ1+···+e iλ5 5 2 . Elle est singulière à l’origine et X est à longue mémoire. Démonstration. Il suffit de vérifier que Z [−π,π] 5 1 1 − e iλ1+···+e iλ5 5 2 dλ < ∞. Le module à intégrer est inférieur à [1 − (cos(λ1) + · · · + cos(λ5))/5]−2 . Cette expression est majorée par 7π 2 [λ 2 1 + · · · + λ 2 5 ] −2 car pour tout x ∈ [−π, π], cos x ≤ 1 − (2/π)x 2 . Un changement en coordonnées polaires prouve l’intégrabilité recherchée. Remarque 6. Le même exemple, mais en dimension d = 3, est proposé dans Rosenblatt (1985). Mais il n’est pas valide comme le précise le lemme suivant prouvé dans la partie 2.4. Lemme 2. La représentation Xn1,n2,n3 − 1 3 (Xn1−1,n2,n3 + Xn1,n2−1,n3 + Xn1,n2,n3−1) = εn1,n2,n3 n’admet aucune solution stationnaire. 2.1 Modélisation par filtrage 21 2.1.2 Filtrage fractionnaire L’idée du filtrage fractionnaire est la suivante. On considère une écriture AR dont le polynôme autoregressif P admet des racines sur le cercle unité et ne satisfait pas (2.1.5). On élève alors ce polynôme à une certaine puissance α de telle sorte que Z [−π,π] d P −α (e iλ1 , .. . ,eiλd ) 2 dλ < ∞. On appelle filtrage fractionnaire le filtrage d’un bruit blanc par P −α (e iλ1 , .. . ,eiλd ) qui devient dès lors légitime. Par construction, le champ résultant sera stationnaire et il sera à longue mémoire car de densité spectrale non bornée. Cette démarche apparait pour la première fois en dimension 1 dans Granger et Joyeux (1980) et Hosking (1981). Ces auteurs introduisent la classe bien connue des modèles FARIMA (Fractionnal Autoregressive Integrated Moving Average) obtenus en filtrant un bruit blanc par a(x) = (1 − x) α , avec −1/2 < α < 1/2, éventuellement multiplié par un filtre ARMA classique. Les modèles existants en dimension 1 Nous rappelons quelques propriétés des modèles issus du filtrage fractionnaire en dimension 1. Il s’agit d’une part de la classe des processus FARIMA évoqués ci-dessus et des processus GARMA (dont le développement en moyenne mobile infinie fait intervenir les polynômes de Gegenbauer). Nous nous en inspirerons pour proposer quelques modèles en dimension supérieure. Proposition 3. Soit (εn)n∈Z un bruit blanc de variance σ 2 . L’équation ∀n ∈ Z, Xn = (1 − L) α εn, avec −1/2 < α < 1/2 admet une unique solution stationnaire (Xn)n∈Z qui s’écrit Xn = X∞ j=0 ψjεn−j , où ψj = Γ(j − α) Γ(−α)Γ(j + 1) = Y j k=1 k − 1 − α k , j ∈ N. On a de plus ψj ∼ j−α−1 Γ(−α) lorsque j → ∞, P∞ j=0 ψ 2 j < ∞ et P∞ j=0 ψj = ∞. La densité spectrale de Xn s’ecrit ∀λ ∈ [−π, π[, f(λ) = σ 2 2π |1 − e −iλ| 2α ∼ cλ2α en 0, c étant une constante strictement postive. Enfin sa fonction de covariance vaut pour tout k ∈ N r(k) = σ 2 (−1)k Γ(1 + 2α) Γ(k + 1 + α)Γ(1 − k + α) , 22 Modélisation de champs aléatoires à longue mémoire elle est équivalente, lorsque k → ∞, à r(k) ∼ ck−2α−1 c étant une constante strictement positive. Ces propriétés peuvent être trouvées dans Brockwell et Davis (1991). On remarque que le processus X est à longue mémoire dès que −1/2 < α < 0 car sa densité spectrale est singulière en l’origine et la suite de ses covariances est non sommable. Nous focalisons à présent la classe des processus GARMA. Les processus GARMA sont construits en filtrant un bruit blanc par un filtre du type a(x) = (1−2x cos ν +x 2 ) α avec |α| < 1/2 éventuellement multiplié par un filtre ARMA classique. Ce modèle a été proposé par Hosking (1981) et son étude, effectuée par Gray et al. (1989), fait intervenir les polynômes de Gegenbauer dont nous donnons la définition et quelques propriétés.