La méthode de l’état adjoint
La méthode de l’état adjoint est une méthode générale pour calculer le gradient d’une fonction coût qui dépend de variables d’état solutions d’un problème direct. On introduit alors la notion de variables de l’état adjoint solutions du problème adjoint associé. Ces variables peuvent être vues comme collectant une mesure globale de la perturbation du problème par rapport aux variables d’état [Plessix, 2006]. Numériquement cette approche est très attractive car le calcul du gradient de la fonction coût par rapport aux paramètres du modèle devient alors équivalent à la résolution du problème direct. La méthode de l’état adjoint a été introduite dans la théorie des problèmes inverses par Chavent [1974]. Cette approche venait de la théorie du contrôle [Lions, 1971]. Plusieurs auteurs ont déjà appliqué cette méthode en géophysique, par exemple [Lailly, 1984], [Tarantola, 1984], [Delprat-Jannaud et al., 1992], [Sei and Symes, 1994], [Chavent and Jacewitz, 1995], [Plessix et al., 1999], [Shen et al., 2003] et [Leung and Qian, 2006].
Une formulation par le Lagrangien
Pour développer les formules liées à la méthode de l’état adjoint, nous choisissons de formuler les équations sous une forme continue. Pour un point de tir, la fonction coût des moindres carrés C s’écrit C (v) = 1 2 ΩS t(v, x) − tobs (x) 2 dx , (3.9) définie entre les temps de premières arrivées tobs mesurés à la surface ΩS et les temps calculés t(v) pour un modèle de vitesse v défini sur un ouvert Ω. Par souci de ne pas surcharger les formules, nous n’exprimons plus par la suite la dépendance spatiale des variables, ainsi t(v, x) devient t(v). Il existe une méthode générale [Plessix, 2006] qui permet d’établir systématiquement l’expression du gradient de la fonction coût par rapport aux paramètres du modèle et de l’équation de l’état adjoint dont une solution est la variable de l’état adjoint λ. Cette formulation repose sur la définition du Lagrangien L L t,˜ λ, v ˜ = 1 2 ΩS t ˜− tobs 2 dx − 1 2 Ω λ˜ ∇t ˜ 2 − 1 v2 dx , (3.10) où t ˜ et λ˜ sont deux variables indépendantes de v. L peut être interprété comme le Lagrangien associé au problème de minimisation suivant : trouver le temps de trajet t qui minimise la fonction coût C tout en satisfaisant l’équation eikonale (2.9). Le gradient de la fonction coût C par rapport au modèle de vitesse v est alors donné par ∂ C ∂ v (v) = ∂ L ∂ v t, λ, v , (3.11) l’équation de l’état adjoint sous la forme ∂ L ∂ t ˜ t, λ, v = 0 , (3.12) et l’équation eikonale est donnée par ∂ L ∂ λ˜ t, λ, v = 0 . (3.13) 38 Une nouvelle formulation 3.2.2 Le gradient de la fonction coût Nous détaillons ici le calcul du gradient de la fonction coût C par rapport au modèle de vitesse v donné par (3.11). Nous calculons tout d’abord la dérivée du Lagrangien L par rapport à v ∂ L ∂ v t,˜ λ, v ˜ = − Ω λ˜ v3 dx . (3.14) Nous rappelons que t ˜ et λ˜ sont deux variables indépendantes de v. Pour un temps de trajet donné t et sa variable de l’état adjoint correspondante λ on a ∂ C ∂ v (v) = − Ω λ v3 dx . (3.15) L’équation (3.15) représente la forme continue du gradient de la fonction coût par rapport au modèle de vitesse. L’expression discrète du gradient de la fonction coût dépend de la paramétrisation du modèle choisie. Nous choisissons de discrétiser le modèle de vitesse par une grille cartésienne uniforme, on a alors ∂ C ∂ v (v) = − λ v3 (3.16) L’expression du gradient de la fonction coût par rapport au modèle de vitesse dépend simplement de la variable de l’état adjoint λ et du modèle de vitesse v. Dans le cas où N sources sont considérées, le gradient de la fonction coût par rapport au modèle de vitesse s’écrit ∂ C ∂ v (v) = − 1 v3 N i=1 λi , (3.17) où λi est la variable de l’état adjoint associée à la i eme ` source. Il faut maintenant déterminer λi pour chaque position de source. 3.2.3 L’équation de l’état adjoint Nous présentons les étapes permettant de définir l’équation de l’état adjoint à partir de (3.12). Nous calculons tout d’abord la dérivée du Lagrangien L par rapport à t ˜ ∂ L ∂ t ˜ t,˜ λ, v ˜ = ΩS t ˜− tobs dx − Ω λ˜ ∇t ˜· ∇ dx . (3.18) Ensuite nous intégrons par partie la seconde intégrale ∂ L ∂ t ˜(t,˜ λ, c ˜ ) = ΩS t ˜− tobs dx − ΩS λ˜ n · ∇t ˜ dx + Ω ∇ · λ˜ ∇t ˜ dx = ΩS t ˜− tobs − λ˜ n · ∇t ˜dx + Ω ∇ · λ˜ ∇t ˜ dx , (3.19) 3.2 La méthode de l’état adjoint 39 où n est le vecteur unitaire normal à la surface ΩS. Pour satisfaire la condition (3.12), nous considérons que les deux intégrales définies sur des domaines différents sont nulles. Pour un temps de trajet donné t, on peut alors choisir λ solution de l’équation aux dérivées partielles suivante sur le domaine Ω ∇ · λ ∇t = 0 , (3.20) et à la surface ΩS λ n · ∇t = t − tobs . (3.21) L’équation (3.20) est appelée l’équation de l’état adjoint et l’équation (3.21) représente sa condition limite à la surface ΩS. La résolution de ce système d’équations permet de calculer la variable de l’état adjoint λ et ainsi de déterminer le gradient de la fonction coût par rapport au modèle de vitesse. Dans le cas où plusieurs sources sont considérées, l’équation de l’état adjoint doit être résolue pour chaque position de source pour permettre de calculer la variable de l’état adjoint λi associée à la i eme ` source.
Discussions
Nous abordons dans ce paragraphe quelques points de discussion concernant la méthode de l’état adjoint et sa mise en œuvre pratique. – L’équation de l’état adjoint (3.20) et sa condition limite à la surface (3.21) peuvent être intuitivement interprétées comme la rétropropagation des résidus des temps calculés à la surface en suivant les gradients locaux des temps de première arrivée. Cette formulation est analogue à celle de l’inversion de forme d’onde non-linéaire où le champ d’onde des résidus des données est corrélé avec le champ d’onde direct pour calculer le gradient de la fonction coût associée [Tarantola, 1986], [Noble, 1992]. – La formulation du gradient de la fonction coût linéarisé (3.6) peut être obtenu par la méthode de l’état adjoint en considérant le problème direct t = L s , (3.22) et la fonction coût associée C (s) = 1 2 (L s − tobs) t (L s − tobs) . (3.23) Dans ce cas, la variable de l’état adjoint devient λ = t − tobs . (3.24) – D’un point de vue purement théorique, le schéma numérique utilisé pour déterminer la variable de l’état adjoint λ devrait être défini à partir du schéma numérique utilisé pour calculer les temps de première arrivée t. Cette dérivation peut se révéler être une tâche formidablement complexe [Bennett, 2002]. Par ailleurs, elle ne garantit pas que le schéma numérique adjoint, dérivé du schéma numérique direct, hérite de sa consistance ou de sa précision [Sei and Symes, 1995]. D’un point de vue pratique, nous choisissons donc de discrétiser directement l’équation de l’état adjoint (3.20).