Surface representation by linear forms aimed at a
statistical study applied to cerebral imaging
Motivations pour l’analyse statistique de surfaces
Les surfaces sont les objets idéaux pour modéliser les données tridimensionnelles. Ainsi, en raison du développement croissant des méthodes d’imagerie 3-D, ces objets ont pris une place importante dans la littérature mathématique associée au traitement du signal. Dans cette optique, on a actuellement à traiter, dans de nombreux champs d’application, de grandes quantités de données représentées sous formes de surfaces. Ceci est particulièrement vrai en ce qui concerne le domaine de l’imagerie médicale, où se posent, de fait, des problèmes de nature statistique sur des ensembles de surfaces : définir et déterminer des caractères moyens et/ou des modes de variation, exhiber des régularités, établir des groupes. . .De ces problématiques émerge la première motivation de notre étude : construire un cadre statistique rigoureux adapté à l’analyse de surfaces. Les surfaces sont au cœur du sujet majeur de ce manuscrit ; de ce fait, il est nécessaire de s’accorder de façon précise sur une définition pour cette notion, afin de garantir la cohérence du propos. On prend le parti d’utiliser à ce dessein les sous-variétés différentielles. Définition 1 (Surface). On appelle surface toute variété différentielle de dimension 2 plongée dans R 3 . En d’autres termes, une surface est un sous-ensemble S de R 3 tel que, pour tout x de S, il existe un voisinage W de x dans R 3 , un ouvert U de R 2 et une bijection de classe C 1 reliant U et S ∩ W. En tant que sous-variétés différentielles, les surfaces ne constituent pas un espace vectoriel : on ne dispose pas d’opérateurs de somme interne ni de produit externe ; les calculs de distances, de moyennes, etc. ne font donc a priori pas sens sur ces objets. On ne peut donc pas leur appliquer les méthodes statistiques les plus usuelles, qui reposent en général sur une structure d’espace Euclidien. Il convient alors de développer une méthode innovante, spécifiquement adaptée au cas des surfaces.
Difficultés liées à l’analyse statistique de surfaces, solutions envisagées
Caractère riemannien des surfaces
Les outils usuels de l’analyse statistique, tels que les méthodes d’estimation classiques, paramétriques ou non paramétriques, sont conçus pour être opérants sur des espaces vectoriels. En effet, ils nécessitent de pouvoir définir et calculer des sommes, des différences, des produits par les éléments d’un corps de scalaires ou encore des moyennes… Le cadre idéal pour les mettre en oeuvre étant, bien entendu, un espace normé de type euclidien ou hermitien, sur lequel on dispose d’une distance et d’un produit scalaire. Les échantillons de données expérimentales qui peuvent être traités via ces outils sont ceux que l’on peut modéliser par des éléments de tels espaces ; malheureusement, ce n’est pas le cas des surfaces à première vue. Les surfaces, en effet, sont des variétés riemanniennes différentiables bidimensionnelles de R 3 ; elles ne sont éléments d’aucun espace vectoriel et, par conséquent, ne sont pas analysables au moyen de méthodes statistiques usuelles. Ainsi, l’analyse statistique de surfaces nécessite le développement de réponses spécifiques en matière de représentation de données ou d’algorithmes statistiques. Dans la littérature, il existe de nombreux articles liés à notre thématique principale. De ces ressources, il émerge deux grandes catégories de solutions pour pallier notre problème. La première consiste en le développement de méthodes statistiques spécifiquement adaptées aux variétés riemanniennes . La deuxième repose sur le fait de plonger les surfaces dans un espace euclidien via un procédé de représentation de ces dernières par des éléments d’un espace vectoriel puis de mener une étude indirecte sur les représentants. On opte pour la seconde manière. Pour représenter les surfaces dans un espace vectoriel, on adopte le point de vue initié par J.Glaunès et M.Vaillant en 2005 et prolongé, deux ans plus tard, par S.Durrleman [10, 9] : associer aux surfaces discrétisées des courants sur un espace fonctionnel de type Hilbert. On développe ensuite une approche statistique originale dans ce cadre. Suivant une démarche analogue, étant donné un ensemble de surfaces continument différentiables Θ et un espace de Hilbert V , on représentera une surface S ∈ Θ par une forme linéaire s sur V . Sous des hypothèses raisonnables, S est un élément du dual topologique V ∗ de V . On représente ainsi les surfaces par des éléments d’un espace de Hilbert de dimension infinie. On étendra cette représentation par formes linéaires aux surfaces discrètes, à partir du modèle continu.
Représentation aléatoire des formes linéaires
Pour établir un cadre statistique avec un modèle d’observation, il faudra prendre en compte les variations aléatoires des surfaces en les rendant visibles à travers leurs représentants. Ces représentants étant des courants, i.e. des formes linéaires continues sur un espace de Hilbert, il est particulièrement difficile d’en établir une modélisation probabiliste. On surmontera cette difficulté en utilisant des formes linéaires aléatoires, 13 concept défini à partir d’éléments empruntés à la théorie des processus stochastiques généralisés, telle que développée par Itô [20, 21], Fernique [12] et surtout Gel’fand et Vilenkin [15] ou Yaglom [35]. Sur ce cadre aléatoire, il deviendra possible d’attribuer de manière rigoureuse des lois de probabilité aux représentants des surfaces, construire un modèle d’observation décrivant ces derniers, puis appliquer des outils statistiques usuels, afin de construire des estimateurs pour le représentant moyen ainsi que pour les principaux modes de variation d’un échantillon.
Traitement de la dimension infinie
Comme il a été mentionné plus haut, on représente les surfaces, lisses ou discrétisées, par des éléments d’un espace de dimension infinie. Les représentants dépendent donc d’une infinité de paramètres. Il est donc nécessaire, pour pouvoir effectuer sur ces derniers des calculs numériques, de mettre en place une procédure d’approximation. Pour ce faire, on utilisera un sous-espace vectoriel de dimension finie de l’espace des représentants et on approximera toute forme linéaire par sa projection orthogonale sur ce sous-espace ; on obtiendra ainsi des représentants approximés dépendant d’un nombre de paramètres fini et fixé. Ce point constitue une autre originalité par rapport aux travaux de Glaunès, dans lesquels les approximations dépendent de la discrétisation des surfaces.
I Cadre consistant pour l’analyse statistique de surfaces représentées par des courants |