Proposition d’approches phénoménologiques pour la modélisation de la réponse des SAW à un mélange

Télécharger le fichier original (Mémoire de fin d’études)

Bilan du chapitre

Dans ce chapitre, les principales approches multiparamétriques proposées dans la littérature ont été présentées. Bien que certaines d’entre elles soient particulièrement utilisées dans le cadre de l’identification de signatures chi-miques, chacune a su trouver son intérêt dans un domaine particulier.
Les réseaux de neurones font partie des algorithmes les plus répandus mal-gré le fait que leur entraînement et que la recherche de leur architecture soient particulièrement coûteux en temps de calcul. Toutefois, le récent dévelop-pement d’architectures de calcul spécialisées tend à limiter cet inconvénient [Vainbrand et Ginosar, 2010]. Ces architectures permettent également d’em-barquer des réseaux de neurones dans des systèmes mobiles.
Les SVM et les approches à base de voisinage sont également très employés bien que ces dernières requièrent de stocker en mémoire la base d’apprentissage intégralement. Bien qu’étant plus marginales, les approches à base de règles et celles basées sur des techniques de modélisation du signal ont tout de même été appliquées avec succès [Frenois et al., 2014].

Positionnement par rapport à l’état de l’art

Évaluation et analyse des performances des techniques de l’état de l’art

Protocole d’évaluation

Les résultats présentés dans cette partie ont été obtenus en sélectionnant les hyperparamètres des diﬀérents algorithmes en eﬀectuant une recherche sur une grille : des noyaux linéaire, quadratique, cubique et Gaussien ont été considérés pour les SVM ; les performances des réseaux de type MLP ont été obtenues en évaluant des architectures comprenant 1 ou 2 couches ayant entre 1 et 25 neurones ; et une recherche sur une grille allant de 1 à 25 a été utilisée pour évaluer les performances des approches à base de voisinage. L’algorithme de rétropropagation du gradient avec un terme de régularisation a été utilisé pour apprendre les diﬀérents paramètres des réseaux de neurones tout en évitant le phénomène de surapprentissage. Les descripteurs ont été normalisés entre 0 et
1. La dimension des descripteurs a été réduite de telle sorte qu’avec la PCA, 90% de la variance soit expliquée, et avec les autoencodeurs, de telle sorte que l’erreur de reconstruction soit 90% de celle obtenue avec un seul neurone dans la couche cachée.
Les résultats donnés dans les tables 3.1 et 3.3 représentent la moyenne des performances en classification des diﬀérentes méthodes tandis que les tables 3.2 et 3.4 représentent l’écart-type de ces dernières. Dans le cas de la base de données constituée des toxiques chimiques, les performances en classification sont définies comme étant le ratio des exemples correctement classés sur le nombre total d’exemples, tandis que dans le cas de celle constituée des capsules de café, les performances en classification sont définies comme étant le ratio de
vrais positifs. Cette même métrique sera également utilisée dans la suite de de document pour évaluer les performances des algorithmes proposés sur la base de données contenant le DMMP et le 4-NT. Ces résultats ont été obtenus lors d’un processus de validation croisée à 5 plis [Geman et Doursat, 1992].
Le processus de validation croisée consiste en la division de la base d’ap-prentissage en k sous-ensembles de tailles similaires. k − 1 sous-ensembles sont utilisés pour apprendre le modèle tandis que le dernier est utilisé pour estimer ses performances. Ce processus est réitéré k fois de telle sorte que chacun des diﬀérents sous-ensembles ait été utilisé pour estimer les performances. Cette méthode de validation permet d’obtenir des résultats plus robustes puisqu’un classifieur peut avoir de bonnes performances sur un jeu de données particu-lier et en avoir de mauvaises sur un autre. Les résultats décrits dans la section suivante ont été obtenus avec k = 5. Ceux-ci sont compris entre 0 et 1. Un score de 1 signifie que tous les exemples ont été correctement classés tandis qu’un score de 0 signifie qu’ils ont tous été mal classés.
Le meilleur résultat obtenu pour chaque couple de technique de prétraite-ment et d’algorithme d’apprentissage supervisé est indiqué en gras. Dans le cas des tables 3.1 et 3.3 présentant les performances en classification, il s’agit du score le plus élevé. Tandis que dans le cas des tables 3.2 et 3.4, il s’agit du score le plus faible.

Table des matières

Remerciements
Glossaire
Notations
Introduction générale
I Contexte de l’étude et positionnement des travaux
1 Multicapteurs à ondes acoustiques de surface pour l’identification de signatures chimiques
1.1 Capteur SAW et fonctionnalisation diamant
1.1.1 Principe de fonctionnement des capteurs SAWpour l’identification de signatures chimiques
1.1.2 Couche sensible en diamant fonctionnalisé
1.1.3 Approche multicapteurs
1.2 Protocoles expérimentaux
1.2.1 Présentation du dispositif utilisé
1.2.2 Environnement de laboratoire : toxiques chimiques
1.2.3 Environnement partiellement contrôlé : capsules de café commerciales
1.2.4 Environnement non contrôlé : DMMP et 4-NT en sac à dos
1.2.5 Répétabilité des protocoles expérimentaux
2 Approches multiparamétriques pour l’identification de signatures chimiques
2.1 Extraction des descripteurs
2.1.1 Descripteurs directement issus de la réponse des capteurs
2.1.2 Descripteurs issus de la modélisation de la réponse des capteurs
2.2 Changement de représentation et réduction de dimension
2.2.1 Analyse en composantes principales
2.2.2 Autoencodeurs
2.2.3 Réduction de dimension
2.3 Apprentissage supervisé pour l’identification de signatures chimiques
2.3.1 Classifieurs linéaires
2.3.2 Approches connexionnistes
2.3.3 Approches à base de voisinages
2.3.4 Approches à base de règles
2.3.5 Approches basées sur la modélisation des signaux
3 Positionnement par rapport à l’état de l’art
3.1 Évaluation et analyse des performances des techniques de l’état de l’art
3.1.1 Protocole d’évaluation
3.1.2 Analyse des résultats du benchmark
3.2 Proposition d’une nouvelle approche pour l’identification de signatures chimiques
II Identification de signatures chimiques
4 Estimation des paramètres des contributions massique et viscoélastique
4.1 Justification du modèle utilisé
4.2 Formulation du problème d’optimisation
4.3 Comparaison de métaheuristiques pour la résolution du problème
5 Application à l’identification de signatures chimiques et à l’estimation
de leur concentration
5.1 Application à l’identification de composés chimiques
5.1.1 Impact des performances du processus d’optimisation sur le taux de classification
5.1.2 Fusion des descripteurs
5.2 Application à l’estimation du profil de concentration
5.2.1 Déconvolution
5.2.2 Techniques de régression non paramétrique
6 Méthode de sélection des fonctionnalisations des capteurs
6.1 Définition d’un critère de séparabilité
6.2 Proposition d’un algorithme glouton pour la sélection de capteurs
6.2.1 Formulation du problème sous la forme d’un problème d’optimisation
6.2.2 Algorithme glouton
6.2.3 Analyse de l’algorithme
6.3 Résultats expérimentaux
III Vers l’identification des composés d’un mélange
de composés chimiques
7 Problématiques liées à l’identification des mélanges de composés chimiques
7.1 Typologie des problèmes et des approches pour l’identification de mélanges
7.1.1 Exhaustivité de la base d’apprentissage
7.1.2 Connaissance a priori du nombre de composés du mélange106
7.1.3 Problèmes et approches pour l’identification des mélanges106
7.1.4 Résultats expérimentaux
7.2 Proposition d’approches phénoménologiques pour la modélisation de la réponse des SAW à un mélange
7.2.1 Proposition de modèles empiriques
7.2.2 Validation expérimentale des modèles
8 Estimation du nombre de composés dans un mélange et application
à l’identification des mélanges
8.1 Estimation du nombre de constituants d’un mélange
8.1.1 Extension du modèle de type somme pondérée
8.1.2 Formulation et résolution d’un problème de régression linéaire
8.2 Résultats expérimentaux
8.3 Application à l’identification de mélanges
Conclusion générale
A Processus linéaires temps invariant et réponse impulsionnelle129
A.1 Processus linéaires temps invariant
A.2 Réponse impulsionnelle
A.3 Réponse impulsionnelle et processus linéaires temps invariant
B Définition et propriétés des fonctions génératices
B.1 Fonctions génératrices
B.2 Produit de convolution
B.3 Approximation numérique
C Métaheuristiques d’optimisation
C.1 Recuit simulé
C.2 Stratégie d’évolution + μ
C.3 Optimisation par essaim particulaire
C.4 Optimisation sous contraintes
C.5 Critères d’arrêt
C.6 Optimisation de l’implémentation
D Linéarisation de la réponse des SAW à un mélange
Bibliographie