Sélection de caractéristiques stables pour la segmentation d’images histologiques par calcul haute performance

Sélection de caractéristiques stables pour la
segmentation d’images histologiques par calcul haute performance

Système nerveux central et la maladie d’Alzheimer

 La biologie est la science de l’étude du vivant. Bien que le concept de vie soit discuté par les biologistes épistémologiques [Jacob, 1970], leur objet d’étude s’étend des molécules aux écosystèmes en passant par la cellule. Le système nerveux central (SNC), composé de l’encéphale et de la moelle spinale, ainsi que la maladie d’Alzheimer seront au cœur du présent chapitre. 

 Tissu nerveux 

Le tissu nerveux est commun aux organismes vivants du sous-règne bilateria. Il s’organise en plusieurs systèmes et intègrent deux familles cellulaires : les neurones et les cellules gliales. Les neurones assurent la transmission de l’influx nerveux. Ils sont composés d’un corps cellulaire, le soma ou péricaryon, et d’une structure arborescente servant aux connexions nerveuses dont les prolongements cytoplasmiques sont appelés neurites. Le soma peut prendre une grande diversité de forme et de taille. Les neurites se décomposent en deux catégories : 1) l’axone, qui peut atteindre un mètre de longueur et voie de sortie de l’influx nerveux, est souvent entouré d’une gaine de myéline qui accélère la transmission de l’influx nerveux ; 2) l’arbre dendritique, voie d’entrée de l’influx nerveux, il comporte des dentrites et permet les connexions avec de nombreux axones issus d’autres neurones via les synapses. Les synapses peuvent être tripartites voire quadripartites [Schafer et al., 2013][Rudy et al., 2015]. Dans ces cas, les cellules gliales interstitielles participent à l’activité synaptique en la régulant. Les neurones et les cellules gliales forment ainsi un réseau discret permettant la transmission et le traitement de l’information. Les neurones ne sont cependant pas les seules cellules composant le tissu nerveux du système nerveux central, les cellules gliales représentent quant à elles plus de la moitié des cellules du cerveau humain [Azevedo et al., 2009][Squire et al., 2012]. Il est estimé que le corps cellulaire d’un neurone a un rayon compris entre 2,5 et 15 μm [Andersen et al., 2016]. Ce sont les neurones qui vont nous intéresser dans ce manuscrit. Les astrocytes sont des cellules étoilées étroitement connectées aux neurones et qui forment l’essentiel du tissu extraneuronal. Elles participent au maintien de la barrière hématoencéphalique, régulent l’apport en nutriments aux neurones, contribuent à la communication interneurones et maintiennent l’homéostasie de l’encéphale. Elles jouent également un rôle immunitaire et réparateur en cas d’atteinte des neurones, participant à la création des cicatrices gliales. Les cellules microgliales ont une fonction similaire à celle des macrophages dans le reste du corps. Une fois activées, elles forment la principale défense immunitaire du système nerveux et ont pour rôle de détecter et phagocyter les débris neuronaux et les agents infectieux présents dans le cerveau. Non activées, ces cellules participent aussi à la maturation des synapses au sein des synapses quadripartites [Schafer et al., 2013]. Les oligodendrocytes forment les gaines de myéline qui entourent les axones dans le SNC (ce rôle est joué par les cellules de Schwann dans le système nerveux périphérique [Squire et al., 2012]). Ces gaines accélèrent la vitesse de transmission de l’influx nerveux dans les axones. 

Anatomie et fonction du système nerveux central

 Le tissu nerveux est organisé en deux structures principales pour les organismes vivants de l’embranchement des chordés : l’encéphale et la moelle spinale. L’encéphale est organisé en plusieurs sous-structures appelées régions. Six régions principales sont définies sur la base du développement nerveux à partir du tube neural, le système nerveux primitif des embryons des chordés [Kandel et al., 2000] (Figure 1). Ces régions sont elles-mêmes décomposées en sousrégions, présentant un certain degré de corrélation anatomo-fonctionnelle. Néanmoins, nous n’irons pas à ce niveau de détails dans ce manuscrit, ces corrélations étant encore débattues [Rakic, 1988][Zilles et al., 1997].Le télencéphale est la structure nerveuse la plus développée chez les mammifères. Il regroupe l’intégralité du cortex cérébral qui est lui-même divisé en zones anatomiques comme le sulci ou le gyri ou en zones fonctionnelles assurant une fonction précise. Les fonctions principales sont les fonctions sensorielles, motrices et associatives [Dictionnaire de l’Académie de médecine, 2018]. Le diencéphale est la structure cérébrale contribuant à la régulation de l’activité du système nerveux autonome (système nerveux responsable des fonctions non soumises au contrôle volontaire), du système hormonal et du sommeil. Le diencéphale est lui-même composé du thalamus, de l’hypothalamus, de l’épithalamus et du sous-thalamus [Dictionnaire de l’Académie de médecine, 2018]. Le cervelet contribue à la coordination et la synchronisation des gestes et à la précision des mouvements. Il régule aussi l’inhibition comportementale en société [Jaber, 2017][Dictionnaire de l’Académie de médecine, 2018] Le mésencéphale régit les fonctions élémentaires comme l’attention, le sommeil, le réveil et les mouvements de la tête et du cou [Dictionnaire de l’Académie de médecine, 2018]. Le pont relie le cervelet au mésencéphale. Il est impliqué dans les processus de vigilance, d’éveil et de sommeil [Dictionnaire de l’Académie de médecine, 2018]. Enfin, le myélencéphale (appelé bulbe rachidien) est la région reliant l’encéphale et la moelle spinale. Il régule les fonctions vitales végétatives comme le rythme cardiaque, la respiration et la pression artérielle [Llewellyn-Smith et al., 2011]. 

Maladie d’Alzheimer et recherche préclinique 

La maladie d’Alzheimer, décrite par Alois Alzheimer en 1906 [Berrios, 1990], est la maladie neurodégénérative la plus répandue dans le monde avec une prévalence de 5% à 8% pour les plus de 60 ans en 2017 [Witthaus et al., 1999][World Health Organisation, 2017]. Elle est aussi une des maladie les plus coûteuses pour la société dans les pays développés [Hay et al., 1987]. Les symptômes de la maladie évoluent au cours du temps [Förstl et al., 1999]. Les stades précoces impliquent des difficultés à entreprendre des tâches complexes et la perte de la mémoire à court terme. Avec le temps, les troubles de la mémoire s’aggravent et les patients deviennent de plus en plus grabataires. L’aphasie (impossibilité de parler), l’apraxie (impossibilité de bouger) et l’agnosie (perte de la reconnaissance des stimuli sensoriels) s’ajoutent à la liste des symptômes. Dans le dernier stade de la maladie, le patient ne peut plus quitter son lit sans aide et se trouve dans un état d’apathie et de fatigue constante. Bien que la maladie d’Alzheimer soit terminale, la cause de la mort est souvent externe (pneumonie, infection liée aux escarres) [Förstl et as. 1999]. Cette maladie est caractérisée à l’échelle du tissu par deux lésions : Les plaques amyloïdes sont des accumulations extracellulaires de la 𝛽-amyloïde, forme clivée de la protéine précurseur de l’amyloïde (APP). Ces accumulations entraînent un dysfonctionnement des neurones environnants, puis la mort neuronale par apoptose5 ou par nécrose6 [Yankner et al., 1990][Turner et al., 2003][Priller et al., 2006]. Bien que les causes de la formation de ces plaques restent inconnues, une hypothèse étudiée est celle de la propagationagrégation, mécanisme similaire à celui de la maladie de Creutzfeldt-Jakob [Laurén et al., 2009]. Une des hypothèses les plus récentes est la théorie de la clearance, expliquant le surplus de 𝛽- amyloïde par un manque de sommeil entraînant un mauvais renouvellement du liquide cérébrospinal, ce procédé étant indispensable au nettoyage des milieux extracellulaires [Xie et al., 2013] La dégénérescence neuro-fibrillaire : la protéine Tau est une macromolécule essentielle à la stabilité de la tubuline, protéine constituant majoritairement l’assemblage des microtubules qui forment le cytosquelette des axones. Les protéines tau se positionnent perpendiculairement à l’axone et assurent la rigidité des microtubules et le bon transport axonal. La dégénérescence neuro-fibrillaire est le détachement par hyperphosphorylation de ces protéines Tau de la tubuline vers le milieu intracellulaire. L’activité axonale s’en trouve extrêmement dégradée, empêchant le fonctionnement normal du neurone [Hernández et Avila, 2007]. Ces deux lésions provoquent au niveau de l’encéphale une atrophie et une inflammation du tissu nerveux. C’est cette atrophie qui induit la majorité des symptômes de la maladie [Yankner et al., 1990][Turner et al., 2003][Priller et al., 2006][Hernández & Avila, 2007]. Dans la recherche translationnelle, la recherche préclinique se positionne entre la recherche biologique fondamentale à l’échelle des cellules et la recherche clinique consacrée au diagnostic et à l’étude de nouveaux traitements pour l’homme [Jucker, 2010]. Les objets d’étude principaux en recherche préclinique sont les modèles animaux. Un modèle animal est un animal non humain ayant développé, par modification génétique, par provocation sous la forme de lésions ou naturellement, un état similaire à un état pathologique humain. L’enjeu scientifique de l’expérimentation sur les modèles animaux est de comprendre les mécanismes en jeux et de développer des thérapies pour améliorer leur condition. Une fois validée sur les modèles animaux, une thérapie est ensuite testée en recherche clinique. Les rongeurs et les lapins font partie des espèces les plus utilisées en tant que modèle animal à hauteur de 80% [Report from the commission to the council and the european parliament, 2010]. À MIRCen, les modèles animaux utilisés sont les rongeurs (souris et rats) et les primates non-humains (microcèbes et macaques). Toutes les expérimentations sont soumises aux normes et législations européennes visant la réduction du nombre d’animaux sacrifiés à but de recherche (Directive 2010/63/EU).

Table des matières

Introduction
I Contexte
1. Système nerveux central (SNC)
1.2. Anatomie et fonction du SNC
1.3. Maladie d’Alzheimer et recherche préclinique
2. Imagerie cérébrale
2.1. Imagerie in-vivo
2.1.1. TEP
2.1.2. IRM
2.2. Imagerie post-mortem
2.2.1. Protocoles de production des tissus
2.2.2. Imagerie de sections histologiques entières
2.3. Quantité de données numérisées
3. Problématique
II Etat de l’art
4. Quantification des marqueurs histologiques
4.1. Stratégie de quantification du tissu marqué
4.2. Méthodes de quantification des données d’histologie
4.2.1. Méthodes de quantification manuelles
4.2.2. Méthodes de quantification semi-automatiques
4.2.3. Méthodes de quantification automatiques
5. Méthodes d’apprentissage automatique supervisée
5.1. Evaluation et validation d’une segmentation
5.2. Méthodes d’apprentissage automatique classiques en histologie
5.2.1. Machine à support de vecteur
5.2.2. Modèle de mélange de gaussiennes
5.2.3. Forêt aléatoire
5.2.4. Apprentissage profond (Deep Learning)
5.3. Définition des caractéristiques
5.3.1. Espaces colorimétriques
5.3.2. Espaces décrivant la texture
5.3.3. Complexité algorithmique
6. Réduction de dimensionnalité
6.1. Réduction de dimensionnalité et problème de stabilité
6.2. Familles de méthodes de sélection de caractéristiques
6.2.1. Méthodes à filtres
6.2.2. Méthodes incluses
6.2.3. Méthodes intégrées
6.3. Objectifs et difficultés de la méthode de sélection souhaitée
III Extraction et sélection de caractéristiques
7. Bases de données biologiques
7.1. Cadre éthique de l’étude
7.2. Étude du marqueur NeuN
7.2.1. Production des données histologiques NeuN
7.2.2. Segmentations manuelles de NeuN
7.3. Étude du marqueur anti-Phox2B
7.3.1. Production des données histologiques anti-Phox2B
7.3.2. Segmentations manuelles d’anti-Phox2B
7.4. Vecteur initial de caractéristiques utilisé pour NeuN et anti-Phox2B
8. Développements logiciel réalisés
8.1. Matériel informatique utilisé
8.2. Environnement logiciel BrainVISA
8.3. Algorithmes de segmentation
8.3.1. BioVision
8.3.2. Multi-seuillage
8.3.3. Forêt aléatoire
8.4. Extraction de caractéristiques
9. Exploration des espaces de caractéristiques par Force Brute
9.1. Principe et objectifs de l’exploration par Force Brute
9.2. Méthode de sélection des familles de caractéristiques
9.2.1. Définition d’une famille de caractéristiques
9.2.2. Critères de sélection des familles
9.2.3. Sélection des meilleures familles de caractéristiques
10. Sélection de caractéristiques par Force Brute
10.1. Principe et objectifs de la sélection par Force Brute
10.2. Méthode de sélection des caractéristiques
10.2.1. Algorigramme de la méthode proposée
10.2.2. Critères de sélection de caractéristiques
IV Mise en œuvre et validation de la méthode
11. Comparaison des méthodes de segmentation
11.1. Résultats obtenus avec un marqueur spécifique : NeuN
11.2. Résultats obtenus avec un marqueur non-spécifique : anti-Phox2B
12. Sélection de caractéristiques pour le marqueur spécifique NeuN
12.1. Rappel de l’objectif de la segmentation
12.2. Sélection basée sur la Force Brute
12.2.1. Familles sélectionnées pour NeuN
12.2.2. Vecteur de caractéristiques stables
12.3. Gain computationnel
13. Sélection de caractéristiques pour un marqueur non-spécifique : anti-Phox2B
13.1. Rappel de l’objectif de la segmentation
13.2. Sélection basée sur la Force Brute
13.2.1. Familles sélectionnées pour anti-Phox2B
13.2.2. Vecteur de caractéristiques stables
13.3. Gain computationnel
Discussion et Perspectives
Annexes :
Annexe 1 : Régions sélectionnées pour la base NeuN
Annexe 2 : Tableaux des familles triées par les VMeP et VMoP
Annexe 3 : Publications
Références bibliographiques
Résumé et Abstrac

projet fin d'etude

Télécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *