Optimisation de la commande modale en optique
adaptative
Propriétés et limites de l’Optique Adaptative
Entrons dans le domaine de l’optique adaptative, ce chapitre est là pour nous en ouvrir les portes. Non pas tant les portes magistrales, ouvrant déjà vastement leurs larges battants sur les impeccables perspectives d’ancestrales lois créées par quelques Titans de la turbulence atmosphérique, je n’en ai point l’ambition. Le circuit que je propose dans ce chapitre passe plutôt par les portes dérobées, côté cour ou côté jardin, les coulisses, l’envers du décor. Dans un premier temps, je rappelle quelques propriétés connues de la phase turbulente. Ces notions étant par la suite incessamment citées et utilisées, j’ai voulu en reporter ici une partie, mˆeme si l’on en trouve moult références et rappels dans l’ensemble de la littérature gravitant autour du thème de la turbulence atmosphérique. Ces notions ont pour nom les propriétés de la turbulence de type Kolmogorov. Irrémédiablement associés à celle-ci depuis 1976, j’en parlerai, les polynômes de Zernike entrent dans l’histoire –la nôtre–, et puisque leur nom est mentionné 98 fois dans cette thèse je me devais il me semble d’en faire la présentation; présentation d’eux-mˆemes, comme de leurs propriétés mathématiques et de leurs caractéristiques vis-à-vis des perturbations. Ces notions sont connues, mais je ne pourrai m’empˆecher d’ajouter quelques précisions qui, si elles apparaissent au travers des équations données dans la littérature, peuvent cependant ne pas immédiatement sauter aux yeux du lecteur. Certaines propriétés soulignées pourront paraˆıtre anodines: je m’efforcerai d’en montrer l’importance à travers des exemples. Puis j’exposerai quelques propriétés nouvelles, celles de l’outil de travail “Zernike” face à une turbulence de type marche aléatoire. Pourquoi cette écart soudain, pourquoi faire faux bond à l’option de sécurité, la saine turbulence Kolmogorov ? Parce que notre but est de comprendre avant tout et que l’on sait –au moins par expérience– , que la nature a plus d’un tour dans son sac pour faire faux bond à nos projets. Je ne veux pas attendre d’avoir atteint le chapitre 3 sur les résultats expérimentaux Chapitre 1. Propriétés et limites de l’Optique Adaptative 11 pour m’apercevoir que la turbulence peut ne pas ́ être de type Kolmogorov. Pour être capable de raisonner avec les atouts en main, donnons-nous les outils nécessaires. Enfin il sera temps de glisser l’œil à l’oculaire, je veux dire d’avoir un aperçu de l’image. Thème connu, je ne les aborderai pas différemment des ce sont les auteurs qui l’ont fait avant moi: l’image s’accorde plus aisément dans le plan de Fourier. Quelques brefs rappels sur la FTM, et je passerai à la forme de l’image longue pose dont je donnerai une nouvelle expression approchée. Je terminerai ce paragraphe par le rapport de Strehl, dont l’estimation pose souvent les pires problèmes puisque l’on ne peut en g ́ en ́ eral y avoir accès sans une simulation complète de l’image et donc du processus qui l’a formée. J’en donnerai donc, là encore, une nouvelle expression approch ́ee et j’exposerai quelques caractéristiques de son comportement en fonction de l’erreur de phase puisque c’est cette dernière grandeur que je manie le plus fréquemment ici. Mon but dans cette thèse a été de converger vers une méthode de contrôle du miroir qui puisse être vue comme « étant modale, puis d’optimiser son action. Dans la recherche de ce but, il a ́en ́ n ́necessaire d’analyser les différences entre des me ́ thodes de reconstruction varie ́ees, et en particulier la possibilité de division de la correction en diff ́ rents modes. Les modes de basculement ont immédiatement pris dans cette optique une place particulière, etant donné la disproportion entre leur simplicité apparente et la complexité de reconstruction. Maintenant, le concept de contr ́ le modal autorise facilement le contrôle de n’importe quel mode sur un ou plusieurs miroirs, sépar ́ement ou pas. Cependant, ce n’est pas pour autant qu’il faut renoncer `à comprendre ce que recèle le terme de basculement, pourquoi on ne mesure pas le tilt en mesurant le déplacement de l’image mais plutôt la pente moyenne, laquelle revˆet un caractère modal plus large qu’il n’y paraˆıt. C’est donc une parenthèse sur un des modes les plus basiques qui soit en optique adaptative que je fais dans cette section, et je citerai une application amusante liant le tilt aux mesures du Hartmann. Après cette digression et pour en terminer avec les propriétés spatiales de la phase dans le plan pupille je parlerai du mode ignorée du plus grand nombre en optique adaptative, le mode piston. Non par pitié subite pour le rejeton, mais parce que j’avoue moi aussi l’avoir ignoré jusqu`à rencontrer des problèmes de convergence dans le calcul d’une matrice de covariance de phase. Sachant que ledit calcul sera exposé au chapitre 2, j’ai près ́ ef ́ er ́ de prévenir que guérir, et certaines conclusions sur la phase sans piston, non d ́ enu ́ ees d’int ́ er ̂ et, seront exposées. Je montre par exemple que la variance de phase non corrigée ne peut pas ́ être uniforme sur la pupille. Je termine la section sur la phase par les propri et es temporelles: l’optimisation modale requiert en effet des connaissances dans tous les domaines. Je rappellerai les propri ́et ́es g ́en ́erales telles que l’on peut les trouver dans la litt ́erature, et `à partir de celles-ci je pousserai le d ́eveloppement dans une direction nouvelle, pour les extrapoler aux propri ́et ́es de la mˆeme phase, mais vue `à travers notre analyseur. Ce paragraphe est absolument nécessaire pour interpréter correctement nos données expérimentales
Ce dernier point évoque la transition avec la section suivante, puisque c’est ainsi que s’achève la visite du c ´ ot e noble du plan des microlentilles. A partir de maintenant nous suivons les photons et passons du c´ ot ́e instrumental pour traiter en particulier du bruit de mesure. Comme toujours pour commencer, je parlerai de l´ état de l’art dans le domaine, puis je commenterai en ajoutant des remarques directement puisées dans l’expérience que ComeOnPlus m’a permis d’acquérir. Que le lecteur me pardonne ces digressions: il s’apercevra en lisant le chapitre 2 que ce bruit de mesure `à propos duquel je développe ici tant d’arguments théoriques est dans la pratique ́evalu ́e par une mesure et non grˆace `à l’appui de ces arguments. Pourtant le but de ce paragraphe est triple. C’est d’abord une mise en garde, car il démontre la pr´carit´é des formules classiques d’évaluation du bruit. C’est ensuite un support pour celui qui doit développer un nouveau système: il y a dans ce chapitre matiere à reflexion et j’espère avoir d ́evelopp ́e suffisamment d’arguments pour permettre `à un utilisateur potentiel d’orienter ses investigations dans la bonne direction. C’est enfin une aide, pour comprendre l’influence des diff ́erents paramètres qui conditionnent ce bruit de mesure et savoir les gérer correctement: dans un système d’optique adaptative, dont la performance est intégralement suspendue au bruit de mesure, il ne sert à rien de développer force algorithmes d’optimisation si l’on ne commence pas par optimise les plus simples détails, j’aurai l’occasion d’en reparler. Le bruit de mesure en fait partie, et je le considère comme partie intégrante de l’optimisation modale. Et puisque le bruit entre dans le système, suivons-le. Nous arrivons alors à la matrice de commande, que le bruit traverse en subissant la reconstruction, pour en ressortir finalement sous la forme d’une erreur de phase. Cette matrice de commande, déterminante dans la propagation du bruit, n’est que le reflet de la matrice d’interaction du système. Je parlerai au paragraphe 1.2.4 de la qualité des matrices d’interaction sur les polynômes de Zernike, avec en arrière pensée l’idée de s’en servir pour effectuer des dépouillements a posteriori sur la phase, pour caractériser la turbulence, et sachant que les conclusions que je tire sur ces matrices sont ´également valables pour les matrices d’interaction du système réel. Enfin, je rappellerai les concepts de la propagation du bruit `à travers la matrice de commande elle-mˆeme, en reprenant les id ́ees d ́ejà connues dans un premier temps, puis je comparerai et discuterai la propagation du bruit lorsque varie le nombre de sous-pupilles. Le tout dernier paragraphe de ce chapitre sera d ́ edi ́ e principalement au repliement spatial lors de la reconstruction. Celui-ci est ́ évoqué ́e dans l’article Astronomy & Astrophysics présent ́ e dans la section 2.3, mais sans plus. J’ai jugé utile de le développer ici. Il entre parfaitement dans le champ d’application du contrôle modal, et c’est un problème sous-jacent dans tout système d’optique adaptative. Si son influence n’a pas encore éclaté au grand jour, c’est parce que d’autres problèmes le masquent –le bruit de mesure en particulier. Au fur et à mesure des progrès de l’optique adaptative, c’est ce ph ́enomène qui limitera les performances. Je ne pouvais le passer sous silence ici, d’autant que ce ph ́ enomène est peu citée dans la littérature et que s’il peut Chapitre 1. Propriétés et limites de l’Optique Adaptative 13 rester dans l’ombre pour les petits systèmes, il en sera autrement pour des systèmes plus importants, tel que le VLT. Alors, poussons la porte de l’optique adaptative, essuyons-nous les pieds sur le paillasson avant d’entrer car c’est là un noble domaine, et surtout … attention à la marche.
Propriétés de la phase
Turbulence de type Kolmogorov
Je rappelle dans cette section quelques propriét es connues de la phase turbulente selon Kolmogorov, car ces notions seront par la suite incessamment citées et utilisées. La question de la validité de l’hypothèse Kolmogorov a été maintes fois posée à l’occasion de colloques divers. La réponse est pour certains affirmative sans réserve possible, alors que la prudence inspire à d’autres un ton plus modéré ; trois articles illustrent la discorde qui peut encore régner sur le sujet. Le premier, de T. Stewart Mc Kechnie (Mc Kechnie 1992) paraˆıt dans JOSA en Novembre 1992. Il remet en question quasiment toutes les propriétés bien connues de la phase selon Noll (Noll 1976) et Roddier (Roddier 1981). En Janvier 1993 Tatarskii (Tatarskii & Zavorotny 1993) réagit à ce premier article et oppose à Mc Kechnie une sévère riposte. Mc Kechnie (Mc Kechnie 1993) n’attendra que quelques mois pour contre-attaquer: les deux derniers papiers paraˆıtront dans les mˆemes Communications du JOSA de Novembre 1993, laissant finalement le lecteur dans l’embarras. Voici un bref résumé des lois de la turbulence selon Kolmogorov, dont il vaut mieux ˆetre informé avant d’avoir à faire un choix. L’atmosphère terrestre est le siège de mélanges de masses d’air de vitesses et de températures différentes. L’énergie née de la friction à l’interface de ces masses d’air se dissipe en faisant naˆıtre un écoulement turbulent o`u des tourbillons chaotiques d’air autorisent cette dissipation par scission progressive en tourbillons de taille inférieure. Plusieurs grandeurs caractérisent cet écoulement. En effet, il existe une échelle maximale au-delà de laquelle les tourbillons ne sont plus isotropes ou deviennent inexistants, c’est l’échelle externe, notée L0. A l’inverse, il existe une échelle minimale l0 en dessous de laquelle les tourbillons cessent de se scinder et dissipent leur énergie par viscosité. Entre ces deux limites, Kolmogorov (1941) définit le domaine inertiel dans lequel la turbulence, développée tridimentionellement, est homogène et isotrope, et dans lequel la densité spectrale d’énergie varie en k−11/3, k étant la norme du vecteur tridimensionnel de fréquence spatiale ⃗ k. Il a été démontré que le spectre des fluctuations d’indice de réfraction a de mˆeme un spectre de puissance en k−11/3. Ce spectre n’est pas intégrable sur l’ensemble des fréquences spatiales, il contient une énergie “infinie”. On a alors recours au spectre de Von Karmann Φn(⃗ k) qui permet, outre l’apport d’un palliatif au Chapitre 1. Propriétés et limites de l’Optique Adaptative 14 handicap précedemment cité, d’introduire la limitation physique imposée par l’échelle externe. Son expression est Φn(⃗ k)=0.033 C2 n (k2 + ( 1 2πL0 ) 2 ) −11/6 (1.1) Lorsque (1/L0) tend vers 0 on retrouve le spectre en 0.033C2 nk−11/3. La contrepartie dans l’espace des distances de ce spectre tridimensionnel de l’espace de Fourier est la fonction de structure, tridimensionnelle également, de l’indice de réfraction: Dn(⃗r) = < (n(⃗x) − n(⃗x + ⃗r))2 > = C2 n r2/3 (1.2) On définit également la fonction de covariance par Bn(⃗r) =< n(⃗x)n(⃗x+⃗r) >. L’intérˆet de la fonction de covariance est que le spectre Φn(⃗ k) en est la transformée de Fourier. L’inconvénient est que la plupart du temps Bn(⃗0) n’est pas défini, lorsque ce n’est pas Bn(⃗r) tout entier. On préfère pour cela la fonction de structure de phase, plus physique, qui est définie dans tous les cas, et qui se relie facilement à la fonction de covariance par Dn(⃗r)=2Bn(⃗0) − 2Bn(⃗r). Ainsi, on passera du spectre à la fonction de structure de l’indice par Dn(⃗r)=2 ! espace Φn(⃗ k)(1 − cos(2π⃗ k⃗r)) d3⃗ k = 4 ! espace Φn(⃗ k) sin2 (π⃗ k⃗r) d3⃗ k (1.3) Cette précédente équation, vraie non seulement dans notre cas mais également à chaque fois qu’il s’agit de faire correspondre en général spectre de puissance et fonction de structure, a généralement plus de chances d’ˆetre définie que la relation classique de Fourier; c’est pourquoi on la préfèrera chaque fois que l’occasion se présentera. Mais ces grandeurs tridimensionelles ne sont pas accessibles à l’observateur, qui ne per¸coit d’elles que leurs effets sur le front d’onde après la traversée des couches turbulentes. D’autre part dans ce qui suit on négligera toujours les phénomènes de propagation qui modifient graduellement l’amplitude du front d’onde par diffraction de Fresnel. C’est l’hypothèse de la turbulence proche. La différence de chemin optique subie par un rayon traversant la couche est proportionnelle à l’indice intégré le long du trajet. Le calcul conduit à une fonction de structure bidimensionelle de l’indice intégré qui varie alors en |⃗r| 5/3 et non plus selon une puissance |⃗r| 2/3. On aboutit ainsi à une des fonctions primordiales caractérisant cette turbulence, qui est la fonction de structure de phase dans le plan pupille de l’instrument. C’est la mˆeme fonction de structure après propagation depuis la source de perturbations jusqu’à l’instrument car la fonction de cohérence de l’onde est invariante par diffration de Fresnel. Cette fonction de structure de phase se définit comme la variance de la phase au point ⃗r en prenant pour référence la phase en 0, c’est-à-dire Dφ(⃗r) =< (φ(⃗x) − φ(⃗x + ⃗r))2 > (1.4) Chapitre 1. Propriétés et limites de l’Optique Adaptative 15 Dans l’hypothèse Kolmogorov, qui suppose une turbulence homogène et isotrope la fonction Dφ ne dépend que du module de ⃗r. La densit ́e spectrale de puissance des fluctuations de phase associé ́ee `à cette fonction de structure est appelée spectre de Wiener et de manière g ́en ́erale il est relié ́e à Dφ par la relation Dφ(⃗r)=4 ! plan Φφ(⃗ k) sin2 (π⃗ k⃗r) d2⃗ k (1.5) Dans l’hypothèse d’une turbulence Kolmogorov sans ́échelle externe on a Dφ(⃗r)=6.88 » r r0 #5/3 (1.6) et Φφ(⃗ k) = (0.023/r5/3 0 ) k−11/3 (1.7) Cette fonction Dφ croˆıt indéfiniment, mais elle tend asymptotiquement (et physiquement ‘assez vite’) vers une limite finie (deux fois l’intégrale du spectre de Von Karmann) lorsque l’échelle externe est finie. L’expression de Dφ lorsque 1/L0 ̸= 0 est donnée par Chassat (Thèse 1992). On notera que Dφ(α⃗r) = α5/3Dφ(⃗r). Cette propriété est caractéristique d’une turbulence Kolmogorov. Plus généralement, une fonction de structure o`u une dilatation de l’échelle des distances équivaut à une dilatation de l’amplitude dénote un phénomène à caractéristiques fractales. Ces équations font apparaˆıtre un paramètre clé de la turbulence, qui est la longueur de cohérence r0, introduit par Fried (Fried 1966). C’est le diamètre du télescope (circulaire et non obturé) dont l’intégrale de la FTM (égale à πr2 0 4λ2 ) est égale à l’intégrale de la FTM d’un télescope infini limité par l’atmosphère. Pour conduire ce calcul par rapport aux variables statistiques de la turbulence, il est nécessaire de se donner un modèle pour la fonction de structure de phase. Si cette dernière sature, l’intégrale de la FTM d’un télescope infini limité par l’atmosphère ne converge pas. Il est alors dénué de sens de calculer la valeur de la longueur de cohérence, mais ce handicap est plus lié à la forme mathématique du problème qu’à sa nature physique. En effet le r0 n’est susceptible de caractériser qu’un phénomène de nature entièrement fractale. Or les phénomènes qui nous intéressent sont de l’ordre de grandeur de r0 plutôt que de L0. La présence d’une échelle externe n’affecte que très peu la nature des images à courte longueur d’onde, notre but n’est pas d’avoir un paramètre caractérisant toutes les échelles spatiales de la turbulence mais seulement celles du domaine inertiel. Donc pour calculer r0 il est impératif de baser le calcul sur une turbulence sans ́ échelle externe, quitte `à « prolonger » artificiellement le domaine inertiel au-delà de ses limites réelles. Dans ce cas donc, pour une turbulence pleinement développée, l’expression du r0 en fonction du profil de la turbulence est 0 = $ 0.423 4π2 λ2 (cos(γ)) 1 ! C2 n(z) dz%−3/5 (1.8) ce qui montre que r0 est proportionnel à λ6/5. Chapitre 1. Propriétés et limites de l’Optique Adaptative 16 Je terminerai avec l’expression de la variance des fluctuations de l’angle d’arrivée sur une pupille circulaire de diamètre D. On notera, malgré l’apparition de λ dans la formule, que cette expression est achromatique. < α2 >= 0.17 & λ D ‘2 « D r0 #5/3 (1.9) En présence d’une ´échelle externe non négligeable, Fante (1975) donne < α2 >= 0.17 & λ D ‘2 « D r0 #5/3 $ 1 − 1.49 » D L0 #1/3% (1.10)
Les polynômes de Zernike et la turbulence atmosphérique
Cette section introduit les polynômes de Zernike et leurs propriétés. Pourquoi eux plutôt que d’autres ? Parce qu’ils constituent l’outil de base de l’“opticien adaptatif”, je vais en parler d’ici peu. J’en montrerai la forme et les propriétés déjà connues, j’en montrerai surtout les propriétés vis-à-vis de la turbulence Kolmogorov que nous venons de décrire (section 1.1.1), et qui font leur renommée. Tout cela est connu, mais j’ajouterai de temps à autre quelques remarques propres. J’utiliserai souvent ces concepts dans le reste de cette thèse. Propriétés Principalement depuis 1976, date de la parution de l’article de R.J. Noll, les polynômes de Zernike sont entrés dans le monde de l’optique adaptative pour y tenir une place de choix. On apprécie à la fois leur support circulaire, leurs propriétés d’orthogonalité, l’adéquation des premiers modes avec les principales premières aberrations optiques et la ressemblance des ces premiers modes avec les modes propres de l’atmosphère. On apprécie l’expression analytique déterminée par Noll (1976) donnant les variances et les covariances des coefficients dans le cas d’une turbulence de type Kolmogorov pleinement développée, ainsi que l’expression des dérivées premières de chaque polynôme en fonction des autres. On apprécie enfin l’expression simple de leur transformée de Fourier, de sorte qu’ils servent de base à une multitude de calculs et de simulations sur la turbulence. Utilisés de fa¸con intensive dans le domaine de l’optique adaptative, ils ont alors tendance à ˆetre irrémédiablement associés à l’atmosphère comme s’ils n’existaient que par elle. Je précise bien, non à l’intention de ceux qui connaissent bien ces polynômes mais `à l’intention des astronomes qui se plongent dans le domaine de l’optique adaptative, que l’ensemble des polynômes de Zernike est avant tout un outil mathématique qui n’a pas de rapport avec le ph ́enomène turbulent. Pas plus que la transformée ́ee de Fourier avec le cri des dauphins, mˆeme si cette dernière repr ́esente un outil de prédilection pour l’ ́étudier
Introduction |