La maladie d’Alzheimer (MA) affecte de plus en plus de personnes, puisque le pourcentage de la population âgé ne cesse d’augmenter d’année en année (Alzheimer’s Association, 2018). Les patients atteints de cette maladie ont de la difficulté à effectuer leurs activités quotidiennes sans une assistance directe et donc il devient difficile et coûteux de s’occuper d’eux. Il est donc crucial de diagnostiquer cette maladie dégénérative de plus tôt possible afin de leur offrir les meilleurs outils pour ralentir sa progression. La littérature propose de plus en plus des solutions assistées par ordinateur afin d’offrir des méthodes de diagnostic moins invasives pour les patients et moins coûteuses pour l’État. Par exemple, certains chercheurs ont tenté d’analyser des transcriptions d’entrevue avec des patients dans le cadre du test de description d’image du Cookie Theft (Hernández-Dominguez et al., 2018; Fraser et al., 2016; Kavé et al., 2003) .
Maladie d’Alzheimer
La maladie d’Alzheimer (MA) est une forme de démence qui affecte principalement les fonctions cognitives et qui se caractérise par une accumulation de plaques de la protéine 𝛃- Amyloïde dans certaines parties du cerveau (Smith et Bondi, 2013). Trois stades généraux ont été déterminés afin de distinguer l’évolution de la maladie. Le premier est la maladie d’Alzheimer préclinique, où des transformations au cerveau commencent à être perçues, mais les symptômes ne sont pas encore apparents. Ensuite vient le stade de la déficience cognitive légère (DCL) dû à la maladie d’Alzheimer, caractérisée par la transformation du cerveau et les symptômes de dégénérescences cérébrales visibles, mais qui n’affecte pas l’exécution des tâches quotidiennes des patients. Finalement, le stade de la démence, dû à la maladie d’Alzheimer, est le dernier stade, où les patients ne sont plus en mesure d’accomplir la majorité de leurs activités quotidiennes de manière autonome. De plus, la perte de mémoire et la confusion deviennent de plus en plus fréquentes et apparentes. Éventuellement, leur fonction motrice qui leur permet d’avaler devient défectueuse, qui en soi, est la cause principale de décès dû à la maladie (Alzheimer’s Association, 2018). Les différents stades de la maladie sont caractérisés par l’augmentation des zones affectées dans le cerveau .
Actuellement, différentes méthodes permettent de diagnostiquer la maladie. Par exemple, les médecins tentent d’analyser l’historique médical du patient et de sa famille (Alzheimer’s Association, 2018). Pour l’instant, aucune preuve n’a pu démontrer qu’il y a une cause génétique absolue de la maladie. Toutefois, certains gènes seraient susceptibles ou auraient un lien de causalité avec le développement de la maladie d’Alzheimer. Entre autres, la protéine précurseur de l’amyloïde (APP) sur le chromosome 21 pourrait être en cause malgré que ces gènes ne représentent que 5% des cas répertoriés (Smith et Bondi, 2013). Ensuite, les médecins s’informent auprès des proches des patients pour déterminer quels changements sont perceptibles dans leurs quotidiens. En parallèle, des tests cognitifs et physiques, tel qu’un test de description d’image, permettent de mieux comprendre comment la maladie se développe chez le patient. Finalement, une série de tests sanguins et d’imageries médicales permettent d’approfondir l’analyse scientifique à la source (Alzheimer’s Association, 2018). Malheureusement, ces méthodes sont actuellement coûteuses et invasives, ce qui fait en sorte qu’elles ne sont pas préconisées dans le domaine de la santé. De plus, puisqu’elles sont utilisées de manière exceptionnelle et conséquemment, ne permettent pas de suivre l’évolution de la maladie dans le temps.
Impact sur la société
En 2019, Alzheimer’s Disease International a recensé près de 50 millions de personnes vivant avec la maladie d’Alzheimer dans le monde. Selon eux, d’ici 2050, près de 152 millions de personnes seront affectées par la maladie (Alzheimer’s Association, 2019). Ceci est principalement causé par l’augmentation de l’espérance de vie, ce qui augmente le pourcentage de la population âgée. En effet, au Canada, l’espérance de vie a augmenté, en moyenne, d’environ 11 ans, de 1950 à 2002 (Beaudet et al., 2005). De plus, la proportion des personnes âgées de plus de 65 ans est passé de 8% à 14%, de 1960 à 2009.
Les coûts associés aux soins accordés aux patients sont très élevés. Lorsqu’une personne atteint le stade de la démence d’Alzheimer, elle n’est plus en mesure de vivre de manière autonome. Des soins personnels sont donc nécessaires. En 2018, il a été estimé que près de 18.4 milliards d’heures ont été nécessaires en assistance non payée pour aider les patients, ce qui représente 232.1 milliards de dollars (Alzheimer’s Association 2018). De plus, les techniques actuelles pour diagnostiquer les patients sont très coûteuses. Il faut donc trouver une solution à ce problème, car ces chiffres risquent d’augmenter dans les années à venir.
Afin de remédier aux limitations actuelles des méthodes médicales utilisées pour détecter la maladie d’Alzheimer, plusieurs recherches récentes ont proposé des approches basées sur des méthodes d’apprentissage machine. Parmi celles-ci, le développement d’un modèle prédictif à l’aide de mesures évaluant les fonctions linguistiques des patients a su démontrer une avenue intéressante. En effet, les fonctions linguistiques sont généralement altérées par le développement de la maladie, car l’accumulation de la protéine 𝛃-Amyloïde entraîne des dégradations dans certaines parties du cerveau. Il a été prouvé que les signes d’altération du langage commencent à être visibles dès les premiers stades de la maladie (Szatloczki, Hoffmann, Vincze, Kalman et Pakaski, 2015). Des techniques assistées par ordinateur peuvent donc accélérer le processus de diagnostic. En effet, grâce à ce type de méthode, nous serons éventuellement en mesure d’aider les médecins à détecter les symptômes de la maladie d’Alzheimer plus tôt et ainsi ils pourront diagnostiquer les patients à risque et adopter des mesures préventives.
Hernández-Domínguez et al.
Dans le cadre de sa thèse de doctorat, Hernández-Domínguez a présenté plusieurs études sur la caractérisation de l’altération du langage à travers l’évolution de la maladie d’Alzheimer. Ses travaux ont permis de démontrer l’intérêt de l’analyse des fonctions linguistiques basé sur des techniques informatiques. Afin d’effectuer ces analyses, l’auteure a évalué les performances de différents groupes de patients à l’aide de transcriptions obtenues dans le cadre d’entrevues médicales. Elle a donc extrait des caractéristiques de ces transcriptions à l’aide d’outils de traitements automatiques de la langue naturelle (TALN) pour ensuite développer des modèles prédictifs pour supporter les médecins dans la détection et la prévention de la maladie.
Dans sa première étude, l’auteure évalue la performance de patients ayant des déficiences cognitives légères. Ensuite, elle évalue celle de patients étant atteints par la maladie d’Alzheimer durant une tâche de description d’image. Pour ce faire, elle a utilisé le Pitt corpus (Becker et al., 1994) provenant de la base de données DementiaBank. Ce corpus contient des enregistrements audio et des transcriptions de patients effectuant le test de description d’image Cookie Theft (Goodglass et Kaplan, 1983). Elle a étudié 74 patients en santé, 43 patients ayant une déficience cognitive légère (DCL) et 169 patients ayant possiblement ou probablement la maladie d’Alzheimer, pour un total de 517 transcriptions et audio. Afin de focaliser ses efforts sur la classification de ces trois catégories, l’auteure a mis de côté les autres diagnostics du corpus.
Afin d’évaluer la performance des participants, l’auteure s’est basée sur certaines caractéristiques linguistiques et phonétiques et a proposé une mesure de couverture d’information. Pour la couverture d’information, elle utilise des unités de contenu d’information pour évaluer l’informativité et la pertinence des transcriptions. Les études actuelles utilisent une liste d’unité de contenu d’information (UCI) (Kavé et al., 2003; Fraser et al., 2016) proposé par (Croisile et al., 1996). Toutefois, Hernández Domínguez a remarqué qu’il y avait un manque d’objectivité dans la tâche de création de cette liste, et que souvent, cette liste était trop spécifique à un type d’échantillon. Elle a donc proposé la création automatique d’une liste de référents en utilisant un bassin de 25 répondants sains parmi le corpus qu’elle a sélectionné. Ensuite, elle a extrait une série de caractéristiques linguistiques des transcriptions, qui ont été fortement corrélées avec la maladie dans des études précédentes (pour la liste complète des références, voir Hernández-Domínguez, 2018, page 39). Finalement, l’auteure a extrait certaines caractéristiques des segments audio du corpus, telles que la moyenne et la variance des 13 premiers Mel Frequency Cepstral Coefficients (MFCCs).
INTRODUCTION |