Application des méthodes chimiométriques à un échantillon de la cathédrale de Metz

Télécharger le fichier original (Mémoire de fin d’études)

Prétraitements

Les variations d’intensité des spectres caractérisent la zone analysée. Ces variations contiennent à la fois l’information souhaitée (physique, chimique) mais aussi du « bruit ». Ce bruit peut être ou non parasite à l’analyse de la mesure. C’est pourquoi il faut développer une méthode d’extraction de l’information avant d’explorer les données avec les outils chimiométriques choisis.
Le prétraitement du signal inclus souvent deux étapes : le lissage des spectres et la correction de ligne de base. En addition à ces prétraitements, un prétraitement des données : la normalisation peut être effectuée.
Les prétraitements cités ci-dessus sont présentés dans les paragraphes suivants.

Lissage des spectres

Le lissage de spectres consiste en l’extraction de l’information et en la suppression du « bruit ». Parmi les nombreuses méthodes existantes, on peut citer : l’algorithme de Savitsky-Golay [74] et la « décomposition-recomposition » par Analyse en Composantes Principales (ACP) [75].
La méthode de Savitsky & Golay permet de « fitter » un spectre à l’aide de deux paramètres : une taille de fenêtre glissante et un degré de polynôme. Dans la taille de fenêtre choisie, la méthode des moindres carrés est appliquée avec le degré de polynôme choisi. La fenêtre, parcourant l’ensemble du spectre, permet d’obtenir un lissage progressif du spectre.
La méthode de « décomposition-recomposition » par ACP consiste dans un premier temps à faire l’ACP sur le jeu de données. Les premières composantes contiennent les informations majoritaires tandis que les suivantes expriment le bruit du jeu de données. La reconstitution d’un jeu de données ne contenant que les composantes les plus significatives permet de filtrer ce bruit.

Correction de ligne de base

Les signaux physico-chimiques peuvent être vus comme la somme d’une ligne de base et d’un signal d’intérêt. Plusieurs méthodes peuvent être utilisées : la soustraction simple d’une droite, les transformées de Fourier ou encore la technique des moindres carrés successifs [76]. Toutes ces méthodes nécessitent de fixer des paramètres initiaux qui restent les mêmes tout au long de la correction malgré les disparités des spectres au sein d’un même jeu de données.
L’Asymmetric Least Squares (AsLS) est une méthode rapide s’adaptant facilement aux données spectroscopiques [77, 78]. Deux paramètres, p et λ, sont à fixer. Généralement le paramètre p est compris dans l’intervalle [0,001 ; 0,1] et corrige l’asymétrie tandis que λ est compris dans l’intervalle [102 ; 109] et correspond au paramètre de lissage. Cet algorithme est utilisé dans de récentes études spectroscopiques (Raman, moyen infrarouge) [79-81]. Le choix en est justifié car le fond à soustraire est étendu spectralement par rapport aux informations (pics fins) de la technique utilisée.

Normalisation

Les spectres ont des intensités variables lors de l’acquisition. Pour que chaque spectre ait la même importance lors du traitement statistique et pour pouvoir les comparer entre eux, il peut être choisi de diviser chaque spectre par une grandeur choisie (maximum, moyenne ou encore aire du spectre) [72, 80].
La normalisation dépend des données à traiter. Si on veut éviter que des fluctuations trop importantes emportent l’information contenues dans les données et effectuer une remise à l’échelle des données, la normalisation unitaire peut être appliquée. Cette normalisation consiste à diviser

Méthodes chimiométriques

Cette partie présente le principe de fonctionnement de trois algorithmes chimiométriques. L’analyse en Composantes Principales (ACP) qui permet l’exploration des données. La MCR-ALS qui permet l’extraction de profils spectraux purs ainsi que les concentrations associées. Enfin, l’ACOM qui permet de relier les informations entre plusieurs jeux de données.
Analyse en Composantes Principales (ACP)
L’Analyse en Composantes Principales (ACP) permet de remplacer les variables d’origine par des variables synthétiques. Les composantes principales C sont non corrélées entre elles [75] puisqu’elle sont orthogonales. Ces composantes principales s’appellent aussi axes factoriels ou variables latentes.
Les composantes principales du tableau de données X sont calculées de manière à exprimer le plus de variance possible en optimisant le critère suivant :
Max(Variance(XX’)) sous la contrainte VV’=I
Avec I la matrice identité de taille N x N.
Le calcul des composantes principales est basé sur la diagonalisation de la matrice de variance-covariance D = XX’. La diagonalisation de D revient à la décomposer en une matrice de vecteurs propres V et une matrice de valeurs propres Λ (Figure 14). Les vecteurs propres V, appelés « loadings » en anglais, sont les coefficients de la combinaison linéaire. Ils sont utilisés pour calculer les composantes principales appelées « scores » en anglais à partir du tableau C = XV.
Les valeurs propres Λ sont reliées au pourcentage de variance décrite par les composantes. Pour chaque composante k, la variance associée s’exprime comme étant 100 x (λk / trace(Λ)). Les composantes sont rangées selon un ordre décroissant de variance. Les premières composantes révèlent ainsi l‘information majoritaire des données tandis que les dernières décrivent le bruit.
Pour des données spectrales, on appelle « profils spectraux » l’ensemble des vecteurs propres représentés sous forme de courbe. Ce sont ces profils qui permettent l’interprétation des composantes en termes de spectroscopies [82].
Pour comparer l’information contenue dans les spectres, il est possible de tracer des cartes factorielles à partir des valeurs des composantes. Ces cartes permettent de montrer des tendances dans le jeu de données visibles par des groupes de points (Figure 14)
Si on le souhaite, comme mentionné dans le paragraphe Lissage des spectres ci-dessus, la reconstitution des données est possible. Il est alors possible de ne choisir qu’un nombre limité de composantes pour extraire l’information pertinente et supprimer le bruit des données. La matrice reconstituée n’est autre que le produit de la matrice C par V avec V de taille S x Δ et C de taille N x Δ. Δ étant le nombre de composantes choisi.
L’ACP est une technique multivariée souvent utilisées pour décrire des données de manière exploratoire [83, 84].

Multivariate Curve Resolution – Alternative Least Squares (MCR-ALS)

L’algorithme Multivariate Curve Resolution – Alternating Least Squares (MCR-ALS) permet d’extraire des composantes pures dans des systèmes où les informations sont mélangées [85, 86].
La MCR-ALS décompose la matrice de données X en une matrice de contributions C, de composantes spectrales ST et d’une matrice de résidu E d’après le modèle bilinéaire : X = CST + E. Cet algorithme s’applique à des données de type tableaux à deux entrées. Les images hyperspectrales doivent donc être dépliées pour pouvoir être traitées par MCR-ALS [71].
Voici de manière succincte le fonctionnement de la MCR-ALS. Cet algorithme suit les étapes suivantes :
(1) Déterminer le nombre de composants/constituants présents dans les données
(2) Choisir les pixels purs (SIMPLISMA) [87] comme estimations initiale ST
(3) Calculer C sous contrainte(s) en ayant X et ST
(4) Calculer ST sous contrainte(s) en ayant X et C
(5) Reconstituer X en multipliant C par ST
(6) Recommencer depuis l’étape 3 jusqu’à ce que la convergence soit atteinte.
La Figure 15 résume de façon schématique les différentes étapes de l’algorithme MCR-ALS.
Une décomposition en valeur singulière (Singular Value Decomposition, SVD) [75] est effectuée pour déterminer le nombre de composante dans le système. Cette étape donne une idée du nombre de constituants majoritaires. Si les spectres de références sont connus, il est possible de les charger en tant qu’estimations initiales pour la matrice ST. Si les références ne sont pas accessibles, il est possible d’utiliser un outils chimiométrique sélectionnant les pixels purs présents dans les données (SIMPLISMA) [87].
MCR-ALS permet d’inclure des contraintes sur les matrices C et ST. Il est possible d’imposer la non-négativité des spectres et/ou des contributions, l’unimodalité ou encore de contraindre le système à un modèle prédictif.

Table des matières

Introduction
Chapitre 1 : Synthèse bibliographique
1. Contextes de l’étude
a) Etude du patrimoine culturel
b) Entreposage et stockage des déchets radioactifs
2. Corrosion atmosphérique
a) Milieu d’exposition
b) Caractéristiques des couches de produits de corrosion
c) Influence des éléments mineurs sur la réactivité des couches
3. Chimiométrie
a) Spectres et images hyperspectrales
b) Prétraitements
c) Méthodes chimiométriques
d) Utilisation de la chimiométrie
4. Problématique : couplage d’images hyperspectrales pour la compréhension de la corrosion sur
long terme
Chapitre 2 : Méthodologie
1. Méthodologie adoptée
2. Protocole analytique
a) Corpus
b) Techniques expérimentales
3. Stratégie de prétraitements des données spectrales et de mises en oeuvres des traitements
a) Logiciel
b) Prétraitements
c) Appariement des données
d) Paramétrage des algorithmes chimiométriques utilisés
Chapitre 3 : Analyses multivariées de données structurales et élémentaires de produits de corrosion
1. Analyse exploratoire des données de structure cristalline
a) ACP appliquée sur les données Raman
b) MCR-ALS appliquée sur les données structurales Raman
2. Analyse exploratoire des données de composition élémentaire
a) ACP appliquée sur les données EDS
b) MCR-ALS appliquée sur données de composition élémentaire EDS
3. Bilan des analyses multivariées
Chapitre 4 : Analyses multiblocs de données élémentaires et structurales de produits de corrosion
1. Etude de la concaténation des données spectrales
a) CPCA
b) MCR-ALS
c) ACOM
2. Etude de la concaténation des données réduites Raman et EDS
a) CPCA
b) ACOM
Chapitre 5 : Discussion
1. Mise en oeuvre des étapes de prétraitement
a) Prétraitements des données
b) Choix des gammes spectrales pour les spectroscopies Raman et EDS
c) Obtention des données réduites
2. Etude et comparaison des résultats
a) Etude des données spectrales Raman et EDS séparément
b) Etude des données structurales et élémentaire ensemble
c) Application à un autre type de données (XRF)
d) Application des méthodes chimiométriques à un échantillon de la cathédrale de Metz
3. Description des faciès de corrosion
a) L’akaganéite.
b) La ferrihydrite
c) La lépidocrocite
d) Goethite
e) Magnétite et hématite
Conclusion
Bibliographie
Annexes
Annexe 1 : Etude MCR-ALS de données structurales Raman
Annexe 2 : Analyse XRF de la zoneGx400 de l’échantillon AmXIVE
Annexe 3 : Analyse de zone « surf7 » de l’échantillon de Metz

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *