Grandes déviations et convergence du spectre de
matrices aléatoires
Grandes déviations pour la plus grande valeur propre de matrices aléatoires
Résumé du chapitre Dans ce chapitre, on expose une méthode permettant de démontrer des principes de grandes déviations pour la plus grande valeur propre pour plusieurs modèles de matrices aléatoires : des matrices de Wigner, des matrices de Wishart ainsi que des matrices à prols de variance. Ces résultats, qui s’appliquent dans le cas de coecients indépendants non-gaussiens, reposent néanmoins sur une hypothèse de majoration de la transformée de Laplace. On rappelle dans la section 1.1 le contexte général concernant les matrices de Wigner et de Wishart ainsi que les densités jointes des valeurs propres dans les cas gaussiens. On revient sur les principaux principes de grandes déviations connus dans la littérature, tant pour les mesures empiriques que pour la plus grande valeur propre, qui dérivent de l’expression de ces densités. Dans la section 1.2 on présente les résultats de sections 1.3, 1.4 et 1.5 ainsi qu’un survol de leurs démonstrations. On expose dans la section 1.3 le principal résultat de ce chapitre tiré de [45]. Ce résultat s’applique au cas de matrices de Wigner et Wishart dont les coecients ne sont pas gaussiens mais vérient une borne supérieure sur leurs transformées de Laplace. Cette démonstration repose sur l’étude d’intégrales sphériques du type E[exp(Nθ hXN e, ei)] (où e est un vecteur unitaire indépendant des XN ). Dans la section 1.4 on généralise ce résultat à des matrices à prols de variance et on voit qu’il est alors nécessaire de faire des hypothèses supplémentaires sur ces prols. Cette généralisation est tirée de [54]. Enn dans la section 1.5 on étudie le cas qui se présente lorsque l’hypothèse de domination de la transformée de Laplace n’est plus vériée. Dans ce cas, en étudiant le comportement de l’intégrale sphérique, on peut néanmoins arriver à des résultats de grandes déviations locales, notamment pour de grandes valeurs de la plus grande valeur propre. Les résultats de cette partie sont tirés de [7].
Matrices aléatoires et grandes déviations
Matrices de Wigner et de Wishart
Dans cette section, les modèles de matrices aléatoires dont on étudiera le spectre sont auto-adjoints et donc diagonalisables. Pour capturer le comportement global du spectre de matrices aléatoires, on introduit la notion de mesure empirique : Dénition 1.1.1. Soit M une matrice auto-adjointe n × n. On note λ1(M) ≤ … ≤ λn(M) ses valeurs propres. On appelle mesure empirique de M la mesure de probabilité µM dénie par 7 8 CHAPITRE 1. GRANDES DÉVIATIONS µM := 1 n Xn i=1 δλi . La mesure empirique d’une matrice aléatoire est donc une mesure de probabilité elle-même aléatoire. Un modèle de matrices aléatoires est une suite de variables aléatoires (MN )N∈N telle que MN soit à valeurs dans MuN ,vN (K) ou K = R or C et où uN , vN tendent vers +∞. La théorie des matrices aléatoires s’intéresse au comportement asymptotique des quantités algébriques associées aux MN (valeurs propres, valeurs singulières, vecteurs propres …) quand N tend vers +∞. On va rappeler ici les deux modèles historiques de matrices aléatoires ainsi que les résultats de convergence de mesures empiriques et de plus grandes valeurs propres qui leur sont associés. On dénit tout d’abord les matrices de Wigner qui sont un modèle de matrices auto-adjointes avec le maximum d’indépendance possible sur les coecients : Dénition 1.1.2. Soit (ai,j )i j . On dit que XN est une matrice de Wigner. On peut comprendre la renormalisation en √ N −1 de la manière suivante : on considère le moment d’ordre 2 de la mesure empirique µN = µXN en moyenne, c’est-à-dire E[µN (x 2 )] = N −1E[Tr(X2 N )]. En développant la trace, on a que la renormalisation en √ N −1 est la seule qui donne une limite nie à E[µN (x 2 )]. En d’autres termes c’est la seule renormalisation possible si l’on veut faire apparaître un comportement limite du spectre qui ne soit pas trivial. L’autre principal modèle de matrice aléatoire historiquement étudié est le modèle de Wishart déni comme suit : Dénition 1.1.3. Soit (ai,j )i,j∈N une double suite de variables aléatoires i.i.d. centrées à valeurs dans K . On suppose E[|a1,1| 2 ] = 1. On considère également (M(N))N∈N une suite d’entiers telle que : lim N→∞ M(N) N = α ∈ [1, +∞[ On considère alors la matrice N × M(N), XN dénie par : XN (i, j) = ai,j √ N On dit que WN = XN (XN ) ∗ est une matrice de Wishart. Le résultat fondamental de la théorie des matrices aléatoires porte sur la convergence de la mesure empirique des matrices de Wigner : Théorème 1.1.4 (Théorème de Wigner). Soit (XN )N∈N une suite de matrices de Wigner. On note µN la mesure empirique de XN . µN converge en probabilité vers la mesure semi-circulaire σ dénie sur l’intervalle [−2, 2] par : σ := √ 4 − x 2 2π dx 1.1. MATRICES ALÉATOIRES ET GRANDES DÉVIATIONS 9 La démonstration de ce résultat se fait tout d’abord en se ramenant au cas d’une matrice dont les coecients ont des moments bornés puis par une méthode des moments. En eet la moyenne E[µN (x k )] du k-ième moment est égale à N −1E[TrXk N ]. On peut alors développer cette expression en : N −1E[TrXk N ] := 1 N1+k/2 X i1,…,ik−1∈[1,N] E[ai1,i2 …aik,i1 ] A la limite, les termes prépondérants sont ceux tels que le mot i1, …, ik dénisse une partition paire sans croisement de [1, k] (c’est à dire une partition P de [1, k] en paires telles que pour {a, b}, {c, d} ∈ P, on n’a pas a < c < b < d). On en déduit alors que les moments impairs convergent vers 0 et que les moments pairs convergent vers les nombres de Catalan. On conclut alors à la convergence presque sûre des moments en prouvant que Var(N −1TrXk N ) tend vers 0. Grâce à l’équation sur les nombres de Catalan : CN = N X−1 k=1 CkCN−k−1 on obtient l’équation fonctionnelle suivante sur la transformée de Stieljes G de la mesure limite : G(z) + 1 G(z) = z On a donc G(z) = (z − √ z 2 − 4)/2 et on en déduit que la mesure limite est la mesure semi-circulaire. Avec la même méthode, pour les matrices de Wishart, on a le théorème suivant : Théorème 1.1.5. Soit (WN )N∈N une suite de matrices de Wishart. On note µN la mesure empirique de WN . µN converge en probabilité vers la distribution de Marshenko-Pastur de paramètre α notée MPα dénie par sur l’intervalle [b−, b+] par : MPα := p (x − b−)(b+ − x) 2πx dx où b− = (1 − √ α) 2 et b+ = (1 + √ α) 2 Ces deux résultats contraignent déjà le comportement des valeurs propres dans l’intérieur du support de la mesure limite. En particulier pour α ∈]0, 1[, λbαNc converge vers le quantile de niveau α de σ. Une question naturelle est alors le comportement des valeurs propres extrêmes λ1 et λN , lesquelles peuvent a priori s’éloigner du support de la mesure limite. Dans le cas où les moments des ai,j vérient une inégalité de la forme E[|ai,j | k ] ≤ k Ck, Füredi et Komlòs ont prouvé que cela ne pouvais pas être le cas, c’est à dire que limN λN (XN ) = 2 presque sûrement si XN est une matrice de Wigner (voir [41]). Les hypothèses de ce résultat ont ensuite été relaxées par Bai et Yin dans le cas Wigner puis par Bai et Sylverstein de le cas Wishart en la simple existence d’un moment d’ordre 4 : Théorème 1.1.6. [8] Avec les notations précédentes, si les ai,j et les di ont des lois symétriques et E[a 4 1,2 ] < +∞, on a presque sûrement que λ1(XN ) et λN (XN ) convergent respectivement vers −2 et 2. Théorème 1.1.7. [11] Avec les notations précédentes, si les ai,j ont des lois symétriques et E[a 4 1,1 ] < +∞, on a presque sûrement que λ1(WN ) et λN (WN ) convergent respectivement vers b− et b+. Maintenant que l’on connaît le comportement limite des mesures empiriques et de la plus grande valeur propre, on peut s’interroger sur la probabilité de dévier de ces limites. On va exposer dans la sous-section qui suit le cas des modèles gaussiens ainsi que les principes de grandes déviations qui leur sont liés.
Modèles gaussiens, formules de Weyl et grandes déviations
Un cas particulier de matrices de Wigner pour lequel le comportement des valeurs propres à N xé est entièrement compris (dans le sens ou l’on a une expression explicite de la loi jointe des valeurs propres) est le cas où les ai,j sont des variables gaussiennes. Dans ce cas on dit que les matrices XN appartiennent au GOE (Gaussian Orthogonal Ensemble) dans le cas réel ou au GUE (Gaussian Unitary Ensemble) dans le cas complexe. Dénition 1.1.8. On considère XN une matrice de Wigner 1. Dans le cas réel, si la distribution des ai,j est N (0, 1) et la distribution des di est N (0, 2), on dit que les XN appartiennent au Gaussian Orthogonal Ensemble (GOE). 2. Dans le cas complexe, si la distribution des ai,j est telle que les <(ai,j ) et les =(bi,j ) soient i.i.d. de loi N (0, 1/2) et les di soient de loi N (0, 1) on dit que les XN appartiennent au Gaussian Unitary Ensemble (GUE). L’appellation vient du fait que dans ce cas, la loi des XN est invariante par l’action de conjugaison du groupe orthogonal ON , respectivement du groupe unitaire UN . Une dénition alternative peut être énoncée en donnant la densité de la loi de XN : Proposition 1.1.9. Une matrice aléatoire de SN (resp. HN ) appartient au GOE (resp. au GUE) si et seulement si sa loi µ N a pour densité par rapport à la mesure de Lebesgue sur SN (resp. HN ) : dµN (H) dH = (Z (β) N ) −1 exp .
1 Grandes déviations pour la plus grande valeur propre de matrices aléatoires |