Généralités sur la voix pathologique

Détection et classification de la voix pathologique par approche hybride dans le traitement du signal de la parole

 Appareil phonatoire

La parole, très souvent considérée comme activité propre de l’homme, elle présente un moyen d’expression de l’instinct, des sentiments et des idées. C’est à travers ce signal que nous pouvons communiquer, convaincre, et se défendre. La chose qui traduit la complexité du signal de la parole. Parce qu’il n’y a pas un organe responsable de la parole, sa production met en jeu plusieurs organes, en quelque sorte c’est une collaboration entre ces organes. Ce système est appelé souvent appareil phonatoire. Cette dernière se compose de trois parties essentielles : les poumons, le larynx et les trois cavités résonantes. Nous présentons dans ce qui suit brièvement le rôle de chaque partie : 1.2.1 Poumons Appelés aussi soufflerie, le rôle principal du poumon est d’assurer l’air suffisant pour vibrer les cordes vocales. Lors de l’inspiration les poumons se remplissent suite aux mouvements des muscles intercostaux et du diaphragme et que par conséquent la cage thoracique est écartée. Ensuite, L’air est chassé du poumon lorsque les muscles mentionnés auparavant se relâchent, c’est en cour de cette opération ; connue par l’expiration , que nous pouvons produire de la parole. La figure 1.1 nous montre une vue shématique des poumons extrait du livre du gray 1918 [H.Gray 1918]

Appareil phonatoire 

Figure 1.1 – Vue shématique des poumons [H.Gray 1918] 1.2.2 Larynx Le larynx est un tube rigide constitué par une armature cartilagineuse solide, à l’intérieur de laquelle se trouvent les organes mobiles qui vont permettre au larynx d’assurer ses différentes fonctions, toutes basées sur la possibilité de mouvements, d’ouverture et de fermeture. Nous connaissons au larynx trois fonctions essentielles : • Une fonction phonatoire par l’émission des sons. • Une fonction de protection des voies aériennes inférieures lors de la déglutition. • Enfin un rôle actif dans la respiration. Figure 1.2 – Vue de face du larynx [H.Gray 1918]  Les organes mobiles du larynx sont les cordes vocales qui sont présentées par la figure 1.3 : Figure 1.3 – Cordes vocles [H.Gray 1918] Le mouvement des cordes vocales est assuré par le contrôle des muscles et du cartilage qui constituent le larynx. Le plus important est le cartilage thyroïde qui forme le relief de la pomme d’Adam. Ces muscles sont illustrés dans la figure 1.4. Figure 1.4 – Vue shématique des muscles formants le larynx [H.Gray 1918] 

Appareil phonatoire

Conduit vocal

Le conduit vocal s’étend du larynx jusqu’a l’ouverture bucco-nasale. Son rôle principal consistera à amplifier les sons produits par les plis vocaux. Par ailleurs, grâce aux différentes cavités résonantes qui le constituent. Ces cavités sont : • Le pharynx : Le mot pharynx vient du grec ancien qui veut dire gorge. Situé entre la cavité buccale et le larynx. Ce conduit musculaire et membraneux joue le rôle d’un carrefour aéro-digestif qui sépare les voies aériennes et les voies digestives. En d’autres mots, le pharynx intervient dans l’opération de déglutition dont il permet aux aliments de passer de la bouche vers l’osophage et éviter ce qu’on appelle fausse route (passage des aliments à la trachée). Comme il participe dans l’opération de respiration par laisser l’air de passer dans le larynx. Il joue aussi un rôle crucial dans la phonation, c’est l’espace où les sons produits par la glotte sont modifiés. • La cavité buccale : En plus de sa fonction biologique dans le système digestif, la cavité buccale joue un rôle important dans la production de la parole. Sa forme change grâce aux mouvements de la langue, les mâchoires et le voile du palais. Elle intervient dans l’étape de l’articulation. • La cavité nasale : Les cavités nasales ou fosses nasales sont deux espaces creux de volume fixe. L’aire expiré pendant la phonation s’oriente grâce à la position du voile du palais. Pendant la prononciation des voyelles orales le voile est relevé, l’air passe uniquement par la bouche. Quand il s’agit d’une voyelle nasale, le voile du palais est partiellement abaissé, l’air passe par la bouche et le nez. Le dernier cas concerne les occlusives nasales où le voile est complétement abaissé. L’air s’échappe totalement à travers le nez comme dans le son /on/.

Production de la parole

La parole est produite lorsque l’air des poumons est chassé à travers la trachée grâce aux mouvements des muscles intercostaux et du diaphragme. L’air expulsé alimente l’organe principal de la phonation qui est le larynx qui contient les cordes vocales. Ces dernières peuvent être en deux positions étendues ou relâchées. Dans la première position, les cordes vocales se mettent en vibration et un train d’impulsion est généré. Ces impulsions sont périodiques de période T, ces périodes sont appelées aussi cycles glottiques. L’inverse de T (1/T) définit la fréquence fondamentale F0 du signal de la parole. Les cordes vocales peuvent vibrer à une fréquence de 400 Hz. Ces types de sons , qui font intervenir les cordes vocales sont dits les sons voisés. Le deuxième type de sons est dit non voisé. L’onde sonore générée au niveau de la glotte (espace entre les cordes vocales) est connue sous le nom source glottique ou excitation passe par les cavités résonnantes. Comme leur nom l’indique un résonateur vibre lorsqu’il est excité. L’ors du passage de cette onde, les parois de ces résonateurs entrent en vibration et que par conséquent la fourniture glottique est modifiée. Sa forme exacte dépend de la position des articulateurs que sont les lèvres, les dents, la mâchoire, la langue et le voile du palais. Des formes distinctes du conduit vocal modifient le champ sonore qui s’y propage, produisant ainsi les différents sons de parole. L’appareil phonatoire est présenté dans la figure 1.5. Cette figure est tirée de la thèse de [H.Thomas 2009]. 1.4 Pathologies du larynx Comme tout système biologique, l’appareil phonatoire peut être atteint de nombreuses maladies. L’étude des pathologies de cet l’appareil est un domaine très large, il est pratiquement impossible d’aborder ce sujet dans son intégralité dans le cadre de cette thèse. Selon l’origine de la maladie, nous pouvons distingué trois types de maladies : 1.4. Pathologies du larynx 13 Figure 1.5 – Vue shématique de l’appareil phonatoire 

Les pathologies organiques

Ces maladies sont dues essentiellement aux changements de structure et de la morphologie de l’organe. Du point de vue étiologique, les causes de ces pathologies sont multiples. La famille la plus courante est la famille connue par les atteintes inflammatoires telles que la laryngite. Il s’agit d’une infection aigue du larynx, d’origine virale ou bactérienne, comme elle peut être d’origine allergique. En conséquence, cette inflammation empêche les plis vocaux à vibrer librement. Parler devient douloureux et la voix produite est rauque, il peut aller progressivement à l’extinction totale. Les polypes et les nodules sont parmi les pathologies les plus fréquentes dans la société. Ce sont des petites excroissances charnus, Sessile ou pédicule, à la surface des cordes vocales. Ces pathologies modifient les caractéristiques des cordes vocales et empêchent leur vibrations et leur rapprochements. Dans le cas des polypes et des nodules, la voix est altérée dans ses trois paramètres : • Hauteur : La présence du nodule, en déformant le bord libre, gène l’accolement des cordes et diminue l’efficacité du geste vocal. La personne va dans un premier temps tenter d’améliorer l’accolement en augmentant la surface de contact entre les deux cordes, c’est à dire en passant en mécanisme lourd, d’où l’aggravation du fondamental. • Timbre : éraillé, soufflé, Le caractère soufflé du timbre est lié au mauvais accolement des cordes, entraînant une fuite d’air permanente au cours du cycle vibratoire, très facilement audible par l’oreille. D’autre part, la déformation du bord libre par le nodule modifie le contact entre les deux cordes qui ne peuvent plus avoir des mouvements parfaitement symétriques au cours du cycle vibratoire : elles se comportent donc non plus comme un seul mais deux sources vibratoires, avec 2 F0 audibles, d’où l’éraillement. • Intensité : elle augmente, surtout à l’attaque. En augmentant la force d’accolement des cordes, le patient améliore, du moins transitoirement, l’accolement des bords libres et réduit le souffle de son timbre. Mais l’augmentation de la pression d’accolement augmente la pression sous glottique nécessaire au main- 1.4. Pathologies du larynx 15 tien du cycle vibratoire : l’amplitude vibratoire augmente d’où l’augmentation de l’intensité. Un exemple d’un polype et un exemple d’un nodule sont illustré dans la figure 1.6 et 1.7. Figure 1.6 – Exemple d’une pathologie organique : polype Figure 1.7 – Exemple d’une pathologie organique :nodule Nous présentons dans la figure 1.8 un exemple d’une cas pathologie organique (laryngite)

Les pathologies fonctionnelles

Dans ce groupe de pathologies, appelées aussi non organique, le larynx est anatomiquement normal. Il s’agit d’une perturbation du geste vocal qui peut être d’origine respiratoire, psychologique. Généralement, les patients souffrent d’un débit sous glottique insuffisant pour faire vibrer les cordes vocales, il existera une fuite d’air à la phonation, source de fa- 16 Chapitre 1. Généralités sur la voix pathologique 0 0.5 1 1.5 2 2.5 3 −1 −0.5 0 0.5 1 amplitude Temp (s) Cas normal 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 −1 −0.5 0 0.5 amplitude Temp (s) Laryngite homme 54 ans Figure 1.8 – Exemple du signal de parole : Cas normal(homme agé de 54), Cas pathologique (homme agé 52 ans) tigue vocale et de baisse de l’intensité vocale ou de difficulté à l’augmenter. La voix produite est dite voilée ou soufflée. Nous trouvons également l’appellation voix hypokinétiques. La compensation de cette faiblesse s’accomplit par le forçage vocale, effort supplémentaire fournit pour élever la voix. Cet effort peut se résumer en : • Une prise d’air importante. • Une vibration des plis supplémentaires (bandes ventriculaires). Tout forçage vocale est suivi par une fatigue vocale. Dans le langage des cliniciens ce cercle est appelé cercle vicieux fatigue-forçage vocale. L’apparition de lésions organiques conséquences d’une perturbation fonctionnelle du comportement phonatoire est fréquente.

Table des matières

Introduction générale
0.1 Contexte et motivation
0.2 Contributions
0.3 Organisation du manuscrit
1 Généralités sur la voix pathologique
1.1 Introduction
1.2 Appareil phonatoire
1.2.1 Poumons
1.2.2 Larynx
1.2.3 Conduit vocal
1.3 Production de la parole
1.4.1 Les pathologies organiques
1.4.2 Les pathologies fonctionnelles
1.4.3 Les pathologies neurologiques
1.5 Troubles de la voix
1.5.1 Vibrations non modales
1.5.2 Jitter et shimmer
1.5.3 Tremblement vocal
1.5.4 Bruit de turbulence
1.5.5 Vibration de structure
1.6 Différentes méthodes d’évaluation
1.6.1 Evaluation perceptive
1.6.2 Evaluation instrumentale
1.7 Conclusion
xiv Table des matières
2 Etat de l’art : reconnaissance de la voix pathologique à partir du signal de la parole
2.1 Introduction
2.2 Etat de l’art : travaux selon les paramètres
2.2.1 Paramètres du domaine temporel
2.2.2 Paramètres cepstraux
2.2.3 Mesures de bruit
2.2.4 Paramètres calculés en utilisant le logiciel MDVP et PRAAT
2.3 Etat de l’art : travaux selon l’approche de classification
2.3.1 Modèle à mélange de gaussiennes (GMM)
2.3.2 Séparateurs à vaste marge (SVM)
2.3.3 Modèle de markov caché (HMM)
2.3.4 Les réseaux de neurones artificiels (ANN)
2.3.5 Autres classificateurs
2.3.6 Les systèmes hybrides
2.4 Conclusion
3 Système de détection automatique de la voix pathologique
3.1 Introduction
3.2 Architecture générale d’un système de détection
3.2.1 Base de données
3.2.2 Pré-traitement
3.2.3 Extraction des paramètres
3.2.4 Modélisation
3.3 Critères d’évaluation
3.4 Conclusion
4 Méthodologie et expérimentation du classificateurs GMM et SVM
4.2 Méthodologie
4.2.1 Corpus de données
4.2.2 Pré-traitement
4.2.3 Extraction des paramètres
4.3 Résultats et discussion
4.4 Conclusion
5 Méthodologie et expérimentation du système hybride GMM-SVM.
5.1 Introduction
5.2 Fusion GMM-SVM
5.3 Noyaux entre vecteurs
5.3.1 Noyaux linéaire
5.3.2 Noyaux Radiaux
5.4 Noyaux entre densité de probabilité
5.4.1 Noyaux de produit de probabilité
5.4.2 Noyaux à partir de divergence
5.4.3 Noyaux dérivées de métriques Hilbertiennes
5.5 Distances utilisées
5.5.1 Kullback-Leibler
5.5.2 Bhattacharyya
5.5.3 Impact de l’inégalité triangulaire
5.5.4 Nouvelles versions
5.5.5 Adaptation avec les GMM
5.6 Approches hybrides GMM-SVM proposées
5.6.1 Protocole expérimental
5.6.2 Premiére approche
5.6.3 Deuxième approche
5.7 Conclusion
Conclusion générale
Bibliographie

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *