Traitement des données HRMS logiciel open source XCMS
Préparation des échantillons et des contrôles qualité (QC)
Préparation des échantillons Pour cette étude, nous avons choisi d’élargir la variabilité matricielle de nos échantillons. Nous avons donc sélectionné 3 groupes différents de coquillages (moules Mytilus edulis, huîtres Crassostrea gigas et coquilles St-Jacques Pecten maximus) composés chacun de quatre échantillons différents (Tableau 30). L’ensemble des échantillons a été extrait selon le même protocole décrit précédemment (I.4). Quatre solutions ont été préparées à partir de chacun des extraits : un échantillon contrôle (N0) et 3 échantillons dopés à 3 niveaux (4, 8 et 16 ng/mL) (Tableau 31) par un mix de solutions étalons de toxines (GYM, SPX1, PnTX-A et AZA1) (Tableau 32). La PTX2 n’a pas été retenue pour cette étude car il a fallu faire un choix en matière de toxines en raison du coût associé au dopage des matrices plus nombreuses dans cette étude-ci. De plus, le pouvoir discriminant du test statistique a montré que la PTX2 n’est identifiable qu’à partir de 12 ng/mL avec les logiciels constructeurs. Même si un autre logiciel est prévu pour l’exploitation des données générées dans cette partie, nous avons préféré ne pas prendre de risque et passer à côté de deux des trois niveaux de dopage prévus. Préparation des contrôles qualité (QC) ▪ QC 1 est composé de 50 µL de solution étalon de boscalid (10 ng/µL) utilisé comme étalon interne (EI) complété avec 450 µL de MeOH. Il est injecté en début de séquence d’analyse pour vérifier l’état du système analytique. ▪ QC 2 est composé de 50 µL de la solution étalon de boscalid et 450 µL de l’extrait correspondant au contrôle réactif (blanc de procédure obtenu en procédant à l’ensemble de la méthode d’extraction mais sans échantillon, l’objectif étant d’identifier les ions apportés par les solvants et autres réactifs utilisés). ▪ QC 3 ou QC pool correspond à un extrait représentatif de la totalité des échantillons de la série d’analyse. Pour réaliser le QC pool, il est nécessaire de prélever le même volume (50 µL) de chaque échantillon (« dopés » et « contrôles »). La totalité des volumes prélevés est regroupée, mélangée et répartie dans plusieurs vials d’injection.
Conditions d’analyse par LC-HRMS
Les analyses ont été menées par LC-HRMS en mode d’ionisation positif utilisant les mêmes conditions chromatographiques et paramètres de masses que ceux décrits pour l’étude précédente (I.5). Les échantillons ont été analysés de manière aléatoire. Pour cela, le séquençage des échantillons a été randomisé grâce au logiciel R (fonction « rand »). L’ordre d’injection des échantillons est un paramètre important à prendre en compte lors de la préparation de la séquence d’injection pour réduire l’effet de la variabilité du signal sur les résultats. La séquence commence toujours par plusieurs injections de QC standard et de solvant afin de s’assurer de la stabilité du système 143 analytique, puis de deux injections de QC2 suivie des QC pool (Figure 40). Les échantillons sont ensuite insérés dans la séquence en intercalant un QC3 tous les 5 échantillons.
Traitement des données
Conversion des données
Avant de procéder au traitement des données par les logiciels open source, les données brutes au format constructeur (.raw) ont été converties dans le format mzXML, qui est un format libre, à l’aide de la commande msconvert du logiciel ProteoWizard disponible gratuitement sur Internet (http://proteowizard.sourceforge.net/).
Traitement des données brutes
Le traitement des données brutes a été réalisé avec les packages XCMS et CAMERA du logiciel RStudio, tous deux disponibles sur la plateforme Galaxy « Work4metabolomics » (http://workflow4metabolomics.org/the-galaxy-environment). Les détails des fonctions (utilisées sous R) ainsi que les paramètres XCMS utilisés sont répertoriés en Annexe 4. Les étapes de traitement sont présentées ci-dessous : 1- Extraction des pics : Cette étape réalisée avec l’algorithme « Centerwave » consiste en la sélection des signaux analytiques présents dans les données brutes acquises correspondant à l’ensemble des ions détectés dans l’ensemble des échantillons (fonction, « xmsSet ») 2- Alignement des empreintes et correction des temps de rétention (Tr) : le logiciel détermine quelles sont les variables qui correspondent à la détection d’un même signal dans différents échantillons. Cela revient à créer des groupes de variables alignées selon un m/z et un temps 144 de rétention proche (fonctions « group »). Une fois les échantillons alignés, avec la fonction « rector », les légers décalages en temps de rétention sont corrigés. 3- Complétion des données manquantes : il est très fréquent que les variables soient détectées dans certains échantillons et absentes dans d’autres. Pour chaque variable l’étape de complétion des données va déterminer des limites de temps de rétention et de m/z basées sur les différents échantillons dans lesquels celle-ci est présente, puis va intégrer le signal présent dans cette plage de temps de rétention et m/z dans les échantillons où la variable étudiée est absente (fonction « fillpeaks »). 4- Création d’une table de données : avec le package CAMERA une matrice est créé comportant l’ensemble des « variables » avec création pour chacun les EIC (Extracted Ion chromatogram) et boxplots correspondants.