Analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé

Analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé

Nous avons souligné la nécessité de prendre en considération les capacités de communication impactées par le trouble de parole dans le cadre de l’évaluation clinique. Bien que la parole spontanée soit le mode de production le plus proche de la parole « quotidienne » des sujets, peu d’études ont porté sur l’analyse automatique de ce type de parole, hormis une étude qui a cherché à identifier automatiquement la parole après cancer de la cavité buccale comparativement à la parole de sujets sains par analyse de la parole spontanée (Halpern et al., 2020). Des analyses automatiques menées sur de la parole spontanée permettraient de s’affranchir des limites de l’évaluation perceptive. Elles fourniraient également des éléments complémentaires à l’évaluation à l’oreille nue, conduisant à une mesure plus fine des conséquences communicationnelles du trouble de parole. extraits de la parole spontanée par des analyses automatiques après traitement d’un cancer de la cavité buccale ou de l’oropharynx.  d’analyses automatiques du signal de parole spontanée utilisables dans l’étude des différents niveaux linguistiques. Pour cela, nous avons cherché quels outils étaient disponibles à l’heure actuelle, puis nous les avons mis en œuvre sur les échantillons de parole de notre corpus. Certains de ces outils ont nécessité quelques adaptations, que nous détaillerons. Une réflexion complémentaire est également proposée pour certains, en vue d’en choisir le paramétrage le plus adapté. Dans un second temps, nous aborderons le processus de sélection ayant abouti à retenir les paramètres les plus pertinents.

Recherche et extraction des paramètres

Dans cette partie, j’ai extrait des paramètres issus de multiples outils d’analyse automatique nécessitant parfois d’être adaptés au contexte d’étude de la parole spontanée pathologique. Pour rappel, cette parole spontanée correspond à l’enregistrement de l’entretien semi-dirigé entre le sujet et l’examinateur lors de la complétion de la version « examinateur » de l’ECVB (voir section 2.5.1). sommes basés sur le modèle psycholinguistique de Caron (Devevey & Kunz, 2018; François & Nespoulous, 2011). Nous intéressant à la production de parole, nous avons cherché à extraire des paramètres dans les trois grandes dimensions de production de ce modèle : conceptuelle, catégorielle et articulatoire. Nous avons également cherché à étudier le signal de parole, support de l’échange oral dans le cadre de la communication linguistique. Le niveau articulatoire concernera, dans sa composante de phonétique articulatoire, les mesures temporelles telles que la durée de parole ou le débit de parole et d’articulation, mais aussi l’étude de segments vocaliques et non vocaliques. Dans sa composante phonologique, les mesures phonémiques seront prises en compte, avec l’étude de la reconnaissance des phonèmes dans la parole des sujets (inventaire phonémique, classes phonétiques). Le niveau catégoriel sera envisagé selon deux volets. Le premier étudiera le niveau lexical, via l’inventaire des mots reconnus par un système de reconnaissance automatique, et les caractéristiques associées (longueur et fréquence des mots, diversité et densité lexicale). Le second envisagera le niveau grammatical par l’étude des classes grammaticales des mots reconnus.

Enfin, le niveau conceptuel sera étudié. Les thématiques abordées seront analysées par l’étude des sorties du système de reconnaissance au moyen d’une classification hiérarchique descendante. Le sentiment général issu du contenu de l’entretien sera également étudié. Pour leur traitement, les fichiers audios ont été rééchantillonnés en 16 kHz avec une résolution en 16 bits, toujours en mono, en vue des analyses acoustiques de parole et de l’utilisation de systèmes de reconnaissance de la parole selon le format habituellement utilisé pour la transcription automatique de la parole (Milenkovic et al., 2020). entretien semi-dirigé entre examinateur et sujet, une segmentation préalable des fichiers a été nécessaire. Les segments de parole du sujet ont été déterminés, tout comme les segments « non utiles » correspondant aux pauses ou aux segments de parole de l’examinateur (se caractérisant par une faible énergie grâce à l’utilisation du micro serre-tête). Si cette détermination des segments de parole du sujet est parfois automatiquement gérée par certains outils d’analyses automatiques qui excluent automatiquement les zones de faible énergie, d’autres outils ne procèdent pas de la même manière, et nécessitent en entrée uniquement la parole du patient. La prise en considération du signal acoustique de parole est importante. En effet, en contexte cancérologique, la tumeur ou le traitement entrepris vont modifier la capacité de déformation et la souplesse des cavités de résonance et des articulateurs. Ces altérations conduiront à une modification du signal acoustique véhiculant la parole.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *