Dynamique spatio-temporelle des communautés phytoplanctoniques côtières et de leurs caractéristiques intrinsèques
Comparaison des méthodes d’analyse
Inter-comparaison de trois cytomètres automatisés Cette section fait l’objet d’une publication en co-auteur re-soumise après révision à Limnology and Oceanography : Methods dont les auteurs sont Reinhoud de Blok, Machteld Rijkeboer, Elisabeth Debusschere, Jonas Mortelamans, Koen Sabbe, Klaas Deneudt, Luis Felipe Artigas et Wim Vyverman. L’utilisation de la cytométrie automatisée de type « pulse shape-recording » (CytoSense/CytoSub) en tant que méthode innovative a été largement documentée pour le suivi des communautés phytoplanctoniques (Bonato et al., 2016, 2015; Thyssen et al., 2008b, 2008a), pour déterminer les propriétés optiques des particules dans l’eau (Agagliate et al., 2018; Moutier et al., 2017) ou encore l’étude des caractéristiques individuelles (Fontana et al., 2018, 2016, 2014; Pomati et al., 2013) ou communautaires (Breton et al., 2017; Fragoso et al., 2019) du phytoplancton. Etant une méthode innovante, plusieurs comparaisons avec des techniques d’observation et de suivis de référence ont été réalisées. Ainsi des intercomparaisons ont eu lieu avec la cytométrie conventionnelle (Thyssen et al., 2014b) et avec la microscopie (Haraguchi et al., 2017). S’imposant comme une méthode fiable et robuste pour les analyses in vivo à petites échelles, la cytométrie automatisée a aussi permis de caractériser les groupes phytoplanctoniques responsables des anomalies de rayonnement détectés par mesures satellitaires via l’algorithme PHYSAT (Thyssen et al., 2015). Néanmoins, les résultats provenant de la cytométrie de type « pulse shape-recording » demeurent dépendants de la configuration des capteurs et des protocoles de mesure (Artigas et al., 2019). Par conséquent, les comparaisons de résultats, entre et au sein des campagnes, nécessitent des connaissances approfondies pour comprendre les effets des différentes configurations et protocoles dans la détection des groupes phytoplanctoniques. Une intercomparaison entre trois cytomètres en flux automatisés (VLIZ, RWS, CNRS-LOG) de type « pulse shape-recording » a été réalisée pour déterminer l’effet des paramètres appliqués aux mesures en continu lors d’une campagne 79 océanographique (LifeWatch-VLIZ, 08 au 12 mai 2017). Ce travail d’intercomparaison a été mené par Reinhoud de Blok (Analyses statistiques, discussions Université de Gand, Institut Flamand pour la Mer), Machteld Rijkeboer (analyses sur le terrain, discussions, gating, Rijkswaterstaat) et Arnaud Louchart (analyses sur le terrain, discussions) et est en cours de resoumission après une première révision. Les trois cytomètres embarqués lors de la campagne LifeWatch-VLIZ présentent des configurations différentes en terme du nombre de lasers, de leur bande d’émission et de leur puissance (Tab. 1-3). Ils sont tous équipés d’un laser à 488nm (Sapphire, Coherent Inc.) qui excite la chlorophylle a par résonance. Le CytoSense du VLIZ possède un second laser (635nm, Coherent Inc.) pour exciter dans le second pic de la chlorophylle a. Le CytoSense du RWS possède, en revanche, un second laser (552nm, Coherent Inc.) pour exciter la phycoérythrine et la phycocyanine. Chaque expert utilise ensuite son propre protocole couramment utilisé lors de campagnes océanographiques sur le site d’étude. Les seuils de détection et d’enregistrement sont établis selon la taille (RWS, VLIZ ; e.g. Moutier et al., 2017; Pomati et al., 2011) ou selon le niveau de fluorescence rouge (CNRS-LOG ; Bonato et al., 2015; Thyssen et al., 2014b). A ce seuil de détection sur la taille qui permet de limiter le bruit mécanique, le RWS et le VLIZ utilisent un « smart trigger » (trigger automatisé) pour séparer le phytoplancton des particules non fluorescentes. Le seuil de détection sur la fluorescence rouge permet de discriminer les particules non fluorescentes du phytoplancton. Le « smart trigger » n’influence pas les mesures sur les signaux. Il permet uniquement de fixer un seuil à partir duquel les particules sont enregistrées. Les fichiers sont premièrement nettoyés pour éliminer les particules non-fluorescentes restantes du phytoplancton via le logiciel CytoClus 3. Les échantillons sont ensuite classifiés avec le logiciel Easyclus (Thomas Rutten Projects, Pays-Bas) par le même expert (Machteld Rijkeboer) afin d’éviter les biais de « l’opérateur-dépendance » du gating manuel (chapitre 2, partie 4.4.2). 80 Cinq groupes phytoplanctoniques sont caractérisés pour chaque cytomètre et correspondent aux principaux groupes caractérisés en cytométrie en flux : Pico-Red, Pico-Synecho, Nano-Red, Nano-Crypto et Micro-Red dont la nomenclature SeatDataNet9 est respectivement picophytoplancton eucaryote, Synechococcus, nanophytoplancton eucaryote, Cryptophytes et Microphytoplancton. La comparaison entre cytomètres montre une détection similaire pour le Pico-Red, Nano-Red et Micro-Red (Figure 28). Les coefficients des rangs de Spearman (Tableau 4) montrent également cette tendance. En effet, les corrélations sont très élevées et significatives pour ces quatre groupes (ρ = 0,82, p < 0,001 à ρ =0,96, p < 0,001). A l’inverse, les abondances détectées par les trois cytomètres sont très différentes pour les groupes PicoSynecho et Nano-Crypto. Ces observations sont corroborées par le rang de Spearman dont les valeurs sont plus faibles que pour les autres groupes (ρ = 0,60, p < 0,001 à ρ = 0,92, p < 0,001).
Inter-comparaison des méthodologies de classification (manuelle vs. automatisée)
Cette section fait l’objet d’une publication en second auteur en cours de rédaction par Guillaume Wacquet (classification automatisée) avec la participation de Mélilotus Thyssen (échantillon Méditerranée), Véronique Créach (échantillon Mer du Nord) Comme vu précédemment, la cytométrie en flux permet, entre autres, de dénombrer les groupes et de caractériser rapidement les communautés phytoplanctoniques. La cytométrie en flux de type « pulse shape-recording » permet d’enregistrer le profil optique des particules mesurant de 1 µm à plusieurs millimètres de long et donc, de cibler la quasi- totalité du spectre de taille du phytoplancton (Beardall et al., 2009; Sieburth et al., 1978). L’utilisation automatisée de ce capteur à bord de navires scientifiques et/ou d’opportunité et/ou de bouées permet habituellement d’enregistrer en continu à une fréquence de mesure variant de 6 fois à 1 fois par heure (soit 144 à 24 échantillons par jour) pendant plusieurs jours voire semaines en utilisant l’assistant de programmation. Cet assistant de programmation facilite le lancement d’un 85 protocole en mode automatisé. Il permet de sélectionner un échantillonnage selon les jours de la semaine et la fréquence horaire (par heure et par tranche de 10 minutes). Ainsi, la meilleure résolution temporelle avec ce processus est une mesure toutes les 10 minutes. C’est la programmation utilisée pour le CytoSense du CNRS-LOG. En revanche, le CytoSense du RWS et le CytoSense du VLIZ, utilisent un protocole lancé cycliquement. Dans les deux cas, la durée d’analyse est programmée en amont. Dans le prélèvement automatisé, une fois la mesure terminée, la suivante démarrera selon la programmation effectuée en l’occurence au minimum toutes les 10 minutes alors que dans le prélèvement cyclique, il n’y a pas de temps de pause entre deux analyses. Ces différents protocoles d’analyse sont l’explication de la différence entre les temps d’analyse du CytoSense du CNRS-LOG et des CytoSense du VLIZ et RWS. Quoi qu’il en soit, l’utilisation de l’assistant de programmation et le prélèvement cyclique peuvent entraîner la génération de larges jeux de données sans intervention d’un opérateur. Dans ce sens, l’analyse des données via la méthode manuelle de gating peut se révéler fastidieuse et coûteuse en temps et ne semble pas adaptée à ces jeux de données en plus d’être « opérateurdépendante ». L’utilisation de méthodes de classification automatisée pourrait permettre de s’affranchir de ces problèmes (Culverhouse, 2007). Dans le cadre de JERICO-NEXT, différents partenaires ont réalisé une comparaison de leurs méthodes de gating et clusterisation automatisée. Un premier travail porte sur la comparaison d’échantillons discrets collectés dans différentes zones d’études dont le but est de montrer « l’opérateur-dépendance » lors du gating. Ainsi des échantillons de Méditerranée (MED), de Mer du Nord (NS), de Manche orientale (EEC), Mer Baltique (BAL) et Golfe de Gascogne (BOB) ont été utilisés. La procédure de classification automatisée utilisée est la classification supervisée. Un set d’apprentissage propre à chaque zone a été déterminé par l’expert de chacune des zones à partir d’échantillons indépendants des échantillons à classifier dans lequel les profils optiques obtenus manuellement pour chaque groupe servent de prototypes. L’algorithme 86 utilisé est le « random forest » (Breiman, 2001; Fernández-Delgado et al., 2014). Dans l’ensemble de nos analyses, nous nous sommes focalisés sur les groupes fonctionnels phytoplanctoniques. Cinq groupes fonctionnels phytoplanctoniques ont pu être mis en évidence lors de cet exercice dont la correspondance avec les groupes de l’exercice d’intercomparaison décrit précédemment est donnée entre parenthèse : Prochlorococcus, Synechococcus (Pico-Synecho), picoeucaryotes (Pico-Red), nanoeucaryotes (Nano-Red + Nano-Crypto) et microphytoplancton (Micro-Red). La figure 30 montre une forte similarité dans la caractérisation des groupes cytométriques caractérisés par les expérimentateurs (Synechococcus, picoeucaryotes, nanoeucaryotes et microphytoplancton) à partir des total SWS et du total FLR. Ces combinaisons d’axes ont été choisies arbitrairement mais permettent toutefois de caractériser les groupes considérés ici. Bien que la caractérisation soit similaire, il a une variabilité dans la délimitation des groupes. Cette délimitation est, par exemple, exprimée par une définition plus large des picoeucaryotes par le CNRS-LOG que par les autres participants. Pour le microphytoplancton, le CEFAS caractérise le groupe par des particules de plus petite taille (i.e. FWS plus faible) que les autres participants. Par conséquent, les pourcentages de zones communes pour ces groupes sont les plus faibles (picoeucaryotes : CEFAS = 56% ; CNRS-LOG = 68% et classification automatisée = 63% ; microphytoplancton : CEFAS = 32%). Les comparaisons deux à deux par matrice de Rand montrent une variation entre 2 et 68%. Cette première tâche montre ainsi que le gating est très fortement dépendant des performances intrinsèques à l’expérimentateur tel que le niveau d’expertise, la connaissance de la zone d’étude, la fatigue (Evans, 1989; Culverhouse, 2007) ainsi que la difficulté de l’expérimentateur à intégrer les informations de plusieurs profils optiques. La figure 30 permet d’observer la fiabilité et la reproductibilité de la classification automatisée par apprentissage machine par rapport à des classifications manuelles réalisées par des experts en cytométrie en flux. Les résultats montrent que la classification automatisée se 87 rapproche très fortement des résultats trouvés en classification manuelle. Ainsi, la classification automatisée se révèle être un élément robuste pour la classification en cytométrie en flux puisqu’elle offre des performances similaires à celle de l’analyste. Bien que la classification automatisée par apprentissage machine nécessite des prototypes fournis par l’expert, elle permet toutefois de réduire le biais entre les échantillons qui auraient pu être introduits par l’expert lors d’un gating manuel. Une précédente étude avait déjà fait état de cette observation entre l’Homme et l’apprentissage machine sur la microscopie (Culverhouse et al., 2003).
Chapitre I : Introduction |