Comparaison des outils sur le plan paramétrique et fonctionnel

Comparaison des outils sur le plan paramétrique et fonctionnel

Dans le cadre de mon diplôme, il a été question d’apprendre une toute nouvelle discipline, liée à la fois à mes désirs de maîtrise des techniques de pointe, et aux besoins analytiques de l’unité pour répondre à des missions de service public. Ma curiosité scientifique m’a permis d’apprendre, dès début 2018, la terminologie adaptée à la bio-informatique, à travers une lecture bibliographique approfondie (Pightling et al., 2018), (Vincent et al., 2018), etc.). A partir d’octobre 2018, une collègue bio- informaticienne m’a formée à l’utilisation des outils SeqSphere+, iVARCall2 et Enterobase. Suite à cela, fin 2018 et en 2019, j’ai réalisé les analyses bio-informatiques, et rapports d’analyses associés aux alertes sanitaires et aux demandes clients liées à Salmonella et Listeria monocytogenes. En fin d’année 2019, j’ai été nommée Responsable Technique WGS. Dans ce cadre, il m’a été confié des projets d’attribution de source, ou encore la gestion globale d’une vingtaine d’alertes sanitaires en lien direct avec les autorités compétentes. Ma participation à des séminaires internes et externes, dont la conférence « Joint Conference Food Safety WGS » de mars 2019, m’ont permis de me tenir à jour de l’actualité bio-informatique dans le domaine de la sécurité sanitaire des aliments. Par ailleurs, j’ai eu l’opportunité de présenter mes travaux lors de réunions thématiques avec certains laboratoires partenaires ou tutelles, dont une présentation pour les DDPP d’Ile de France en janvier 2020. Deux présentations devant des collectifs de laboratoires vétérinaires sont prévus en septembre et en novembre 2020.

La réponse aux alertes produits et aux alertes sanitaires françaises et européenne est au cœur de nos missions de laboratoires de référence, mais est surtout un enjeu majeur pour la santé publique. Les évolutions technologiques et techniques de ces dix dernières années nous ont permis de donner une nouvelle dimension aux analyses réalisées dans ce cadre. Les analyses standardisées utilisées par le passé (PFGE, MLVA) sont délaissées progressivement au profit des analyses de séquençage complet du génome. De nombreuses études ont démontré l’intérêt de cette transition (Moura et al., 2017) afin d’obtenir des données plus discriminantes. Cette transition, évaluée stratégiquement au sein de chaque laboratoire, est également accompagnée par les agences nationales ou européennes (ECDC- EFSA, 2019). Accompagnée d’une équipe de bio-informaticiens chevronnés, l’unité SEL a été capable d’enclencher ce changement technique majeur, avec l’abandon progressif, courant 2019, des méthodes de typage moléculaire conventionnel. Grâce aux données et aux souches collectées dans le cadre de nos activités de surveillance, nous sommes en mesure de répondre de plus en plus rapidement aux sollicitations de nos tutelles en cas d’alerte sanitaires. En effet, la mise en routine des analyses génomique, permet la collecte de génomes utilisables pour répondre aux investigations sanitaires. Toutefois, confronté à la multitude d’analyses possibles, il a été nécessaire de faire le point sur nos possibilités analytiques.

J’ai recherché les évènements de recombinaison des génomes étudiés à l’aide de l’outil ClonalFrameML. Les deux panels étudiés présentent très peu de recombinaisons, uniquement sur de très courtes séquences. Les calculs effectués ne mettent pas en évidence d’impact réel sur la topologie des arbres phylogénétiques. : je n’ai pas observé de remaniement majeur des embranchements ou de la longueur des branches. Les panels étudiés semblent assez clonaux, tout en démontrant bien une large diversité génomique représentative du sérovar ou du CC dans l’environnement (nombre de SNP allant de 0 à plus de 70 pour Listeria et de 0 à 137 pour Salmonella). Les résultats obtenus étant du même ordre de grandeur entre les deux méthodes, cela permet de mettre en avant une cohérence entre les résultats obtenus sur les deux panels exploités. La plupart des gènes recherchés selon les schémas cgMLST sont considérés comme des gènes à évolution lente (Jagadeesan et al., 2019). Ces observations sont cohérentes avec la littérature (Chen et al., 2016), qui montre que le cgMLST est suffisamment discriminant, dans le cadre d’alertes sanitaires, pour définir les souches appartenant au cluster épidémique. Par contre, l’analyse de SNP calling permet de mieux apprécier le lien évolutif entre les souches, identifiées avec plus de précision les clusters et sous- clusters et intégrer une vision statistique sur la robustesse des branches via les bootstraps. Pour Salmonella, j’ai calculé trois SNP de différence entre les souches 2018LSAL00986 et 2018LSAL00988 prélevées dans un laps de deux mois (alerte de 2017-2018). Cependant, j’ai observé que les souches 2017LSAL04598 et 2018LSAL00593 ne présentent aucun SNP de différence alors qu’elles ont été prélevées le même jour et séquencées sur la même flowcell. De la même façon, pour Listeria, j’ai retrouvé trois SNP de différence sur les souches A4-02-LmUB3PA et CL369-S2-LmUB3PA, prélevées dans la même usine à deux ans d’intervalle. Des erreurs de séquençage Illumina ont été reportées dans la littérature à hauteur de 0,1% des reads bruts. Les différences en SNP observées sur les souches d’un même cluster pourraient être dues à des erreurs de séquençage. Toutefois, nous ne pouvons pas exclure une réelle mutation.

Par ailleurs, en faisant le parallèle avec l’analyse ClonalFrameML, j’ai mis en évidence trois homoplasies sur des régions conservées, pouvant également expliquer les variations de SNP. J’ai pu mettre en évident un lien phylogénétique très fort entre les souches des deux alertes à S. Agona, qui présentent seulement en moyenne 5 SNP de différence. A la lumière de ces éléments, il est possible que la souche à l’origine de la TIAC de 2005 soit persistante dans l’usine. Les souches de S. Agona ont été précédemment décrites comme capables de former des biofilms (Corcoran et al., 2013, Gonzalez-Machado et al., 2018). Il n’y a en moyenne que 35 SNP de différence sur l’ensemble du panel S. Agona alors que les souches sélectionnées sont issues de matrices très diversifiées, prélevées sur tout le territoire et sur une période de treize ans. Toutefois, certaines souches issues de pays étrangers présentent jusqu’à plus de 130 SNP d’écart avec les souches Françaises. Il serait intéressant de caractériser de façon approfondie la souche 2012LSAL01803 issue d’un prélèvement de crevettes Indiennes (commercialisées en France). Parmi les 5 530 souches analysées de notre base PFGE, 51% des souches de S. Agona (38/75) sont représentées par quatre pulsotypes majoritaires. Le nombre de souches de L. monocytogenes du CC204 ne représente qu’environ 2% des souches analysées par PFGE par notre laboratoire.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *