Analyse harmonique et Estimation spectrale sur la
Sphère
Extraction du Fond diffus (séparation de source)
Modèle Fig. 3.4 – Cartes de température mesurées par l’expérience WMAP à cinq longueurs d’onde. [image : WMAP] Revenons au modèle général (3.4). La contribution des avant-plans S ν dans les données, contrairement au bruit instrumental, n’est pas réduite par la multiplication des expériences et l’accroissement de la sensibilité des mesures. Au fil du temps et des progrès technologiques, la contribution des avantplans, vue comme une contamination indésirable de la variable d’intérêt X, prend donc une importance croissante, et doit être traitée avec plus de précision car les résidus de cette contamination dans les cartes du CMB peuvent sérieusement biaiser toute interprétation cosmologique. Dans le paragraphe précédent, on a supposé une soustraction parfaite des avant-plans. Si tel n’est pas le cas, les spectres calculés seraient biaisés (positivement si les avant-plans sont supposés indépendants du Fond diffus). Notons que les techniques basées sur les inter-spectres sont impuissantes au regard des avant55 plans puisque ce sont les mêmes avant-plans qui sont vus par tous les détecteurs (à une fréquence lumineuse donnée). La possibilité de séparer les avant-plans des fluctuations du Fond diffus vient de ce qu’ils n’ont pas, contrairement à ce dernier, un spectre lumineux dérivé de corps noir, et que l’on observe le ciel à plusieurs longueurs d’onde, indexées par ν ∈ {1, . . . , Nf req} (voir l’annexe en fin de chapitre). La figure 3.4 illustre par exemple les cartes mesurées à cinq longueurs d’onde différentes par WMAP. On considère le modèle contaminé et bruité suivant : Yν,p = X(ξp) + S ν(ξp) + σν,pUν,p , 1 ≤ ν ≤ Nf req , 1 ≤ p ≤ Npix (3.14) où pour tout ν les variables X et S ν sont supposées indépendantes, et où les variables de bruit Uν,p sont indépendantes entre elles et des précédentes. On cherche à retrouver X(ξp), par une statistique Xbp des observations des Yν,p. Il s’agit donc d’un problème de séparation de source dans le cas particulier où on ne cherche à isoler qu’une seule source. Principe d’estimation Nous cherchons un estimateur Xbp comme combinaison linéaire des Nf req valeurs mesurées : Xbp(Y,wp) := w T pYp (3.15) pour un certain vecteur de poids [wp,ν]1≤ν≤Nf req . Notons que dans le cas où toutes les variables en lettres capitales ci-dessus sont gaussiennes, l’espérance conditionnelle E h X(ξp) Yp i est de cette forme avec w ∗ p T = RXpYpR −1 Yp où RYp := EYpY T p et RXpYp := E X(ξp)Y T p . Ce vecteur de poids vérifie en outre w ∗ p = argmin w E Xbp(Y,w) − X(ξp) 2 . (3.16) Généralement, en vue de l’utilisation ultérieure de la carte, on impose la décorrélation entre X(ξp) et l’erreur Xbp − X(ξp). Plutôt que de chercher à résoudre (3.16), on cherche donc à estimer les poids de Combinaison Linéaire Interne.
Discussion
Le choix des zones est important et un compromis doit être trouvé quant à leur taille : une taille plus grande améliore l’estimation de RY par RbY , mais elle détériore l’approximation de stationnarité locale du bruit et des avant-plans. Cette approche heuristique a reçu cette année des premiers éléments théoriques d’analyse : l’article de Vio et Andreani [143] ainsi que celui présenté au Chapitre 8 calculent notamment le développement à l’ordre 1 en (RY −RbY ) du biais de l’estimateur (3.22)–(3.21)–(3.23) dans l’asymptotique où RbY → RY , ce qui renseigne quant au choix des zones à faire. Une remarque importante est que tout ce qui précède est transposable au cas où le modèle (3.14) est exprimé non pas dans le domaine direct, mais dans n’importe quelle autre base. L’implémentation dans le domaine direct présente en effet de sérieux inconvénients, qui justifient l’avertissement des auteurs de la carte 3.5 quant à l’utilisation de cette dernière : elle est visuellement agréable car le CMB est estimé sur tout le ciel, mais elle reste contaminée à un niveau important par les avant-plans et par le bruit. En effet, un barycentre des cartes observées est calculé non seulement uniformément en p sur chaque zone, mais également uniformément à travers les fréquences spatiales ℓ. Or les propriétés respectives des avant-plans et du bruit varient beaucoup avec la fréquence angulaire ℓ. Intuitivement, les grandes échelles (ℓ petit) sont peu bruitées mais très contaminées, donc très corrélées à travers les longueurs d’onde (S ν(ξp) et S ν ′(ξp) proviennent des mêmes avant-plans, vus dans des longueurs d’onde différentes). A l’inverse, les petites échelles (ℓ grand), peu contaminées mais très bruitées, sont très peu corrélées à travers les longueurs d’onde (car le bruit est presque blanc). La pertinence d’utiliser des ondelettes, dans ce contexte, a été formulée dès 1998 par Tegmark [138], sans que cela ait été repris depuis sous cette forme précise : “la séparation [des composantes] dans le domaine pixels ne tient pas compte de la différence de douceur [spectrale] entre le CMB et les avant-plans : la corrélation entre pixels voisins est plus forte pour ces derniers que pour le CMB […] il pourrait donc être préférable de faire la séparation dans le domaine de Fourier. [Mais] les coefficients de séparation doivent aussi dépendre de la position, car le niveau de bruit dépend de la position. Suggérons donc une soustraction des avant-plans par l’utilisation de bases relativement bien localisées tant dans le domaine direct que dans celui de Fourier, par exemple des sortes d’ondelettes.” Une première recherche allant dans ce sens fut proposée en 2003 par Tegmark et al. [139] qui définissent des zones spatiales et des “zones” d’échelles et améliorent la carte 3.5 à partir des mêmes données
Autres enjeux statistiques
D’autres défis liés à l’étude du Fond diffus cosmologique ne seront pas discutés par la suite mais méritent d’être mentionnés, tant pour leur importance du point de vue physique que pour leur intérêt du point de vue statistique. Projection sphérique de données temporelles corrélées Certains de ces problèmes ne concernent pas l’analyse de données sphériques. Ce sont, aux deux extrémités de la chaîne d’analyse des données CMB, le traitement des données temporelles collectées 58 par les instruments en vue de fabriquer des cartes sphériques ; et l’estimation des paramètres cosmologiques à partir des spectres de puissance angulaire estimés (et conjointement à partir d’autres observations scientifiques indépendantes du CMB). 3453 3454 3455 3456 3457 −3000 −2000 −1000 0 1000 2000 3000 Ring number Temperature ( µK ) Fig. 3.6 – Simulation d’un segment de 5h de données PLANCK [image : Keihänen et al. 2004] La fabrication de cartes, consiste à estimer Yp,ν,d étant données des observations de la forme Yet,ν,d = XNpix p=1 At,pYp,ν,d + Zt,ν,d , (3.24) 1 ≤ t ≤ Ntod, 1 ≤ ν ≤ Nf req, 1 ≤ d ≤ Ndet. Pour chaque fréquence lumineuse ν et chaque détecteur d dans cette fréquence, Yet,ν,d, 1 ≤ t ≤ Ntod, est la série temporelle des valeur mesurées le temps de l’expérience (“TOD” est mis pour “time-ordered data”). La matrice A, dite de pointage, indique l’indice de la direction observée par le détecteur à l’instant t. Si le bruit Z est décorrélé entre ces différents indices, l’opération se résume à appliquer au vecteur Yeν,d le pseudo inverse de A après avoir pondéré par l’inverse du niveau de bruit, autrement dit à attribuer au point p la valeur moyenne (tenant compte du niveau de bruit) des observations ayant pointé dans cette direction. Notons qu’implicitement cela nécessite d’avoir choisi une pixelisation, en particulier son degré de finesse. Ce dernier résulte d’un compromis à trouver entre la résolution de la carte finale et le niveau de bruit de chaque point. En réalité, une partie du bruit est corrélée entre les détecteurs et entre les instants de mesures. Il s’agit du bruit à basse fréquence dû à l’électronique de l’instrument et à ses fluctuations thermiques. Une simple projection des données sur la sphère comme expliqué ci-dessus provoque alors des stries le long des lignes de balayages du ciel. Estimation des paramètres cosmologiques A l’autre bout de l’analyse et de l’interprétation des données se trouvent la sélection d’un modèle cosmologique et l’estimation des paramètres de ce modèle. Tous les modèles envisagés déterminent une loi jointe de la suite C X ℓ . L’estimation, qui consiste à ajuster un spectre paramétrique sur l’ensemble des spectres estimés, est généralement réalisée à travers des simulations. Séparation de sources Pour ce qui est des problèmes posés par des données sphériques, hormis l’extraction du CMB et l’estimation spectrale, deux font aujourd’hui l’objet d’un travail intense : l’extraction complète de toutes les composantes du rayonnement mesuré (et non pas seulement le CMB comme dans la Section précédent) et les tests de gaussianité et de stationnarité. En ce qui concerne le problème de séparation de composantes, elle s’exprime sous la forme généralisée suivante du modèle (3.14) Yν,p = X(ξp) + N Xcomp i=1 S ν,i(ξp) + σν,pUν,p . (3.25) 59 L’objectif est d’estimer X et les S ν,i (et éventuellement les paramètres du bruit : σ, structure de covariance de U). On peut considérer un modèle plus restrictif : S ν,i = Aν,iS i où A est une matrice, dite de mélange, déterministe, décrivant les spectres lumineux des différentes sources physiques S i . Delabrouille et Cardoso [67] font le tour des méthodes de séparation de sources utilisées actuellement, et Leach, Cardoso et al. [100] présentent les performances respectives de certaines méthodes sur des données simulées en vue de préparer l’analyse des données de l’expérience PLANCK. Test des hypothèses du modèle (stationnarité, gaussianité) Enfin, une grande partie de l’analyse statistique du CMB repose sur l’hypothèse, justifiable physiquement et validée au moins en première approximation par l’observation, de son caractère stationnaire et gaussien. La qualité des cartes augmentant, il est possible de tester ces hypothèses de manière toujours plus fine, à condition bien sûr de disposer des outils statistiques adéquats. Cabella et Marinucci [174, 155] passent en revue, d’un point de vue statistique, les méthodes actuelles.
Introduction et plan |