Optimisation avec représentation des structures
De nombreux travaux utilisent des modélisations par graphes pour guider la reconnaissance, comme par exemple dans Colliot et al. (2006); Mangin et al. (1996); Deruyver et al. (2009). Certains de ces travaux utilisent un processus de segmentation séquentielle. Ce type de processus permet de diviser un problème de segmentation globale en sous-problèmes, et d’ordonner la résolution de ces sous-problèmes, le principe étant de commencer par les problèmes les plus « simples », pour aller vers les plus « difficiles ». Pour la segmentation des structures cérébrales, la difficulté de segmentation d’une structure particulière est liée aux caractéristiques de la structure elle-même, comme sa forme, ou à la quantité d’information disponible sur son entourage immédiat : la structure sera plus simple à segmenter si toutes les structures avoisinantes sont déjà segmentées. Nous avons décrit au chapitre 3 comment nous pouvons créer un modèle à partir des connaissances anatomiques sur un graphe spatial. Le processus de segmentation séquentielle nécessite d’avoir plusieurs objets à segmenter évidemment, mais également de pouvoir utiliser de l’information issue des objets segmentés pour permettre ou faciliter la segmentation des autres structures. Le modèle décrit dans le chapitre 3 est donc bien adapté à un processus de segmentation séquentielle. Le domaine d’application, la segmentation des structures cérébrales, est également bien adapté à ce type de processus car il y a de nombreuses structures à segmenter et les relations entre les structures sont décrites dans des ouvrages neuro-anatomiques comme celui de Waxman (2000). Parmi les travaux cités, nous nous intéresserons particulièrement aux travaux décrits par Colliot et al. (2006) qui proposent d’utiliser les relations spatiales pour segmenter et reconnaître les structures cérébrales de manière progressive, en utilisant un modèle similaire au modèle décrit au chapitre 3. À chaque itération, une structure est segmentée, et sa segmentation est guidée par les relations spatiales existant entre cette structure et les structures précédemment segmentées. Toute la connaissance générique est représentée en utilisant un graphe. Une structure particulière (les ventricules latéraux) est utilisée comme structure de référence, c’est-à-dire comme point de départ de la segmentation. Enfin, une séquence ad-hoc de segmentation des structures, à partir de la structure de référence, permet de ne segmenter les structures les plus compliquées qu’une fois que suffisamment d’information est disponible. La figure 4.1 présente des résultats de segmentation obtenus grâce à ce cadre de segmentation, et avec une séquence définie de manière ad-hoc et empirique. L’objet de ce chapitre est de proposer des raisonnements permettant de remplacer la séquence de segmentation ad-hoc par une séquence de segmentation optimale par rapport à la connaissance disponible, au modèle et aux données utilisées. Une séquence de segmentation correspond ici à un chemin dans un graphe et répond donc au problème suivant : à partir d’une structure de référence, Optimisation avec représentation des structures quelles sont les segmentations successives à effectuer pour segmenter au mieux une structure objectif ? FIG. 4.1 – Les résultats de segmentation présentés par Colliot et al. (2006). L’imprécision intrinsèque des relations spatiales leur confère une grande stabilité qui permet de prendre en compte la variabilité anatomique existant dans les structures cérébrales. Mais lorsqu’un cas comportant une pathologie se présente, alors la variabilité peut devenir trop importante pour pouvoir être prise en compte de cette manière. En effet, des structures peuvent être déformées, déplacées et même éventuellement disparaître. Dans ce dernier cas, la structure même de l’image est altérée. Dans ce chapitre et le suivant, nous proposons différentes méthodes permettant de déterminer une séquence de segmentation qui ne soit plus ad-hoc, mais qui soit adaptée en fonction des connaissances qui sont disponibles et des pathologies éventuelles. Dans une première partie, nous allons présenter une approche utilisant une représentation de la forme de chaque structure, pour inférer le chemin de segmentation optimal en fonction du modèle fourni et de la connaissance a priori sur les structures utilisées. L’utilisation d’une connaissance a priori nous permet de définir un chemin complet avant de commencer à effectuer des segmentations. En revanche l’approche est dépendante de la connaissance a priori pour les formes de chaque structure, et est donc moins susceptible de s’adapter aux cas pathologiques (qui entraînent des modifications morphologiques). Dans une deuxième partie, nous présentons donc une manière de modifier la méthode qui permet de prendre en compte les cas pathologiques. Nous considérons dans ce cas que la pathologie est connue, c’est-à-dire dans notre cas que le type de tumeur cérébrale (sa classe et ses caractéristiques) est connu. Tous les raisonnements présentés dans les deux premières parties de ce chapitre effectuent une optimisation qui peut être qualifiée de locale, dans le sens où ils attribuent à chaque arc une mesure de manière indépendante, utilisée ensuite pour inférer le chemin. Dans une troisième partie, nous présentons une méthode permettant d’effectuer une estimation globale de la pertinence d’un chemin, c’est-à-dire permettant de faire la sélection du chemin complet à partir d’un unique critère évaluant sa pertinence.
Raisonnement avec représentation de la forme des structures
Dans cette première partie, nous proposons une méthode permettant de déterminer une séquence optimale de segmentation entre une structure de référence et une structure cible. Cette méthode utilise, pour chaque structure contenue dans le modèle, une représentation de la forme de cette structure. Nous distinguons deux cas différents. Pour commencer, le cas normal, dans le cas de la segmentation des structures cérébrales, correspond à une image sans pathologie, le cas dit 83 « sain ». Dans un deuxième temps, nous présentons une adaptation de cette méthode pour les cas qui présentent une pathologie.
Raisonnement dans le cas « sain »
Notre objectif est donc de proposer un raisonnement qui permette la sélection du « meilleur » chemin entre une structure de référence, qui sera segmentée au préalable, et une structure que nous souhaitons segmenter et reconnaître, dans une image donnée. Nous utilisons le modèle présenté dans le chapitre 3, à savoir un graphe spatial où les nœuds correspondent aux structures cérébrales et les arcs portent les relations spatiales existant entre des structures. Un chemin correspond donc à une séquence de structures à segmenter, et doit permettre de conduire à la meilleure segmentation possible de la structure objectif, en fonction de nos connaissances de la scène. La notion de « meilleur » chemin est relative aux contraintes du processus de segmentation. Dans cette première approche, notre raisonnement doit être apte, dans le cadre du processus de segmentation séquentielle présenté par Colliot et al. (2006), d’être à même de remplacer le chemin de segmentation ad-hoc utilisé, le processus lui-même restant inchangé. Les contraintes du processus portent donc sur la possibilité de segmenter une structure en utilisant les relations spatiales issues des structures segmentées pour guider la segmentation des structures restantes. Notons que nous ne définissons pas, pour une structure donnée, un minimum de relations spatiales qui seraient nécessaires à sa segmentation. Cette information, plutôt empirique, pourrait être incorporée sur chaque nœud du graphe. Dans cette approche, nous ne tenons pas non plus compte de la difficulté intrinsèque de la segmentation de chacune des structures. Dans ce cas, nous considérons des chemins simples et sans boucle et donc le nombre de chemins est borné. Ce nombre peut néanmoins être très élevé, et le problème de l’extraction d’un chemin peut rapidement devenir trop complexe pour être calculé. Mais dans notre cas, nous nous limitons à un petit nombre de nœuds, et nous évitons donc ces problèmes. Néanmoins, l’utilisation de cette méthode avec un graphe plus grand nécessiterait de résoudre cette problématique. Nous avons donc un modèle qui porte une connaissance générique composée d’objets (des structures cérébrales) et de relations spatiales décrites de manière textuelle. Pour déterminer la meilleure séquence de segmentation, nous proposons de munir chaque relation spatiale présente dans le modèle d’une mesure de sa pertinence. Cette mesure évalue l’adéquation avec laquelle cette relation spatiale décrit l’agencement spatial entre les deux structures : la référence et la cible de la relation. Cette évaluation n’est possible qu’à partir du moment où nous avons choisi un formalisme de représentation des relations spatiales, car la comparaison va porter sur la représentation de la relation spatiale et non pas sur la relation elle-même. Nous avons décrit dans la partie 3.3 le formalisme flou utilisé pour représenter les relations spatiales. La méthode utilisée pour représenter une relation spatiale répond à la question suivante : pour une structure de référence, quels sont les lieux de l’espace où cette relation est satisfaite. Cette méthode nous permet d’obtenir une représentation dans l’espace de l’image d’une relation spatiale où chaque point de la représentation correspond à la mesure de satisfaction de la relation en ce point. Notre critère d’évaluation va donc comparer pour chaque relation un ensemble flou et une structure « cible ». Cette mesure, qui sera décrite dans la partie suivante, sera ensuite utilisée pour définir un poids sur les arcs du graphe, et également comme critère pour l’optimisation du chemin en utilisant des algorithmes dérivés de notions classiques de la théorie des graphes présentés dans la partie 4.1.3.
Évaluation de la pertinence d’un arc
Nous proposons ici deux critères permettant d’évaluer la pertinence d’un arc comme une mesure de l’adéquation entre un ensemble flou représentant la relation spatiale portée par cet arc, et de la structure cible de l’arc. Les représentations des relations spatiales sont effectuées dans l’espace de l’image. Les notations que nous utilisons pour les graphes et pour désigner les ensembles flous ont été introduites dans le chapitre 3 dans la première partie. Nous nous contenterons ici de rappeler les notations les plus utilisées. Par la suite, nous utilisons la notation G = (V, E) pour désigner un graphe relationnel attribué, avec V désignant l’ensemble des nœuds et E l’ensemble des arcs. Un interpréteur d’arc associe à chaque arc e un ensemble flou µRel, défini dans le domaine spatial, et représentant l’ensemble (éventuellement singleton) des relations spatiales portées par cet arc, et calculé par rapport à une structure de référence qui est le nœud source de l’arc, tel que défini par Bloch (1999). De la même manière, un ensemble flou µObj est porté par chaque nœud et correspond à la représentation de la structure cérébrale portée par le nœud. L’ensemble flou µObj représente la structure cible. Cette représentation peut être une simple segmentation issue de la base d’apprentissage, sous forme de carte binaire de la structure, éventuellement rendue floue à l’aide d’une dilatation floue par exemple pour accroître la prise en compte de la variabilité. Cette représentation peut également provenir d’un atlas. Il est important que les données utilisées pour calculer les représentations des relations spatiales et les représentations des structures proviennent de la même source afin que leur comparaison soit effective. Dans tous les cas, l’information provient d’une image déjà segmentée et non pas de l’image qui doit être segmentée. Critère de pertinence La pertinence d’une relation spatiale doit donc représenter l’adéquation entre µRel et µObj , c’est-à-dire le degré avec lequel les ensembles flous représentant des relations spatiales ayant une même structure pour cible donnent une localisation précise de cette structure. Si la structure cible est représentée sous forme d’un ensemble flou, alors nous avons deux ensembles flous, définis dans l’espace de l’image, et donc aisément comparables. La pertinence des relations spatiales, dans le cadre du formalisme flou de représentation choisi, nous permet de déduire deux critères de pertinence : 85 – la localisation de la relation, – la précision de la relation. Une relation spatiale fournit une indication sur la position de la structure cible par rapport à la structure de référence, la position exacte étant donnée par la connaissance a priori. Si la relation spatiale fournit une bonne localisation, alors en chaque point de la structure cible, la relation spatiale doit avoir un degré de satisfaction maximal. Plus spécifiquement, si nous comparons des ensembles flous, il est nécessaire que l’ensemble des points de la structure cible soient situés dans le noyau de la relation spatiale (c’est-à-dire un degré de satisfaction de 1). Une bonne localisation, telle qu’elle vient d’être définie, permet de s’assurer que la relation est pleinement satisfaite à l’emplacement de l’objet. Mais ce critère n’est pas suffisant, car la taille du support de la relation spatiale n’est pas prise en compte. Le support de la relation spatiale, représentée dans l’espace de l’image, correspond à l’ensemble des points pour lesquels le degré de satisfaction de la relation n’est pas nul. Par exemple, dans un cas extrême, tous les points de l’ensemble flou peuvent satisfaire entièrement la relation. Dans ce cas, la localisation sera toujours correcte. Il est donc nécessaire de tenir compte d’un autre critère qui estime la précision de la relation. Nous la définissons comme le rapport entre la taille de l’objet et la taille du support de la relation étudiée. Nous pouvons trouver un cadre formel approprié pour comparer des ensembles flous dans (Bouchon-Meunier et al. (1996)), où les auteurs proposent des mesures de comparaison ainsi qu’une classification de ces mesures. Deux mesures permettant d’estimer les critères de pertinence décrits ont été étudiées : Mesure de satisfaction : Le premier critère est une mesure de satisfaction (« M-measure of satisfiability (Bouchon-Meunier et al. (1996)) ») définie ainsi : fs(Rel, Obj) = P x∈S min(µRel(x), µObj (x)) P x∈S µObj (x) , (4.1) où S désigne l’espace de l’image. Ce critère mesure la précision de la position de la structure dans la région où la relation est satisfaite, et sera maximale si la structure est entièrement située dans le noyau de µRel. Cependant la taille de la région où la relation est satisfaite n’est pas prise en compte. Dans le cas extrême (mais improbable) où le support de la relation correspondrait au domaine de l’image, la relation serait alors maximale avec n’importe quel objet. Si la représentation de la structure n’est pas floue, alors cette mesure est réduite à : fscrisp (Rel, Obj) = P x∈Obj µRel(x) |Obj| . (4.2) Mesure de ressemblance : Le deuxième critère est une mesure de ressemblance (« M-measure of resemblance (Bouchon-Meunier et al. (1996)) ») définie comme : fr(Rel, Obj) = P x∈S min(µRel(x), µObj (x)) P x∈S max(µRel(x), µObj (x)) . (4.3) Ce critère mesure l’adéquation entre la structure dans la région de l’espace où la relation est satisfaite, le maximum étant atteint si l’objet et la relation sont identiques. Cette mesure permet d’évaluer en même temps le positionnement mais aussi la précision de la relation. Il s’agit donc d’un taux de recouvrement entre µRel et µObj .