Inhibition de la synthèse de l’acide folique
Les sulfamides ont une structure proche de l’acide para-aminobenzoïque qui est utilisé par les bactéries pour produire de la vitamine B9 ou acide folique. Ils entrent en compétition avec la molécule utile – acide para-aminobenzoïque – ce qui entraine la mort de la bactérie à cause d’une carence en vitamine B9 impliquée dans la synthèse de la sérine, de la glycine et des bases puriques (adénine et guanine). Ils ont un indice thérapeutique élevé parce que les êtres humains ne peuvent pas synthétiser l’acide folique et doivent le trouver dans leur nourriture. La plupart des bactéries pathogènes synthétisent leur propre acide folique, et sont de ce fait, sensibles aux inhibiteurs de son métabolisme. Cependant, les sulfamides peuvent provoquer des allergies chez le patient.
En dernier lieu, les antibiotiques qui agissent sur la paroi bactérienne seront discutés. Les betalactamines, les glycopeptides et les bacitracines agissent sur la synthèse de la paroi bactérienne
tandis que les polymixines ont un effet détergent sur cette dernière.
Inhibition de la synthèse de la paroi bactérienne
La paroi bactérienne appelée peptidoglycane est une structure qui enveloppe la cellule bactérienne (membrane cytoplasmique, cytoplasme et organelles). Elle est formée de plusieurs couches de polysaccarides (N-acétyl-glucosamine (NAG) et l’acide N-acétyl-muramique (NAM) liées par des ponts peptidiques (D-alanine, L-alanine, acide glutamique, L-lysine, acide diaminopimélique) au niveau de l’acide NAM. Cette structure est propre aux bactéries qui assure l’intégrité cellulaire face aux conditions extrêmes du milieu extérieur. Chez les bactéries à Gram positives, on observe une épaisse couche de peptidoglycane. Par contre, chez les bactéries à Gram négatives, le peptidoglycane est plus fin et se trouve dans l’espace périplasmique entre une membrane externe faite de sucres et de lipides – le lipopolysaccharide – et la membrane cytoplasmique.
Altération de la structure de la paroi bactérienne
Les polymyxines forment un groupe de 5 polypeptides cationiques (Polymyxines A-E) dont les polymyxines B et les polymyxines sont les seules à avoir une utilisation clinique(Gupta et al., 2009). Les polymyxines interagissent avec la membrane externe chargée négativement (lipopolysaccharide) des bactéries à Gram négatives. Les cations (calcium Ca 2+ et magnesium Mg 2+) de la membrane se déplacent en présence de la charge positive apportée par lespolymyxines conduisant à une instabilité membranaire qui se traduit par une augmentation dela perméabilité membranaire, la fuite des composants cellulaires et ultimement la mort de lacellule(Gupta et al., 2009).
Mécanismes de résistances aux antibiotiques
Il existe 4 grands mécanismes de résistance, à savoir le mécanisme enzymatique, la modification de la cible, l’imperméabilisation et les systèmes de pompes à efflux.
Il est cependant important de rappeler qu’il existe des bactéries naturellement résistantes à certaines familles d’antibiotiques. Les bactéries à Gram négatives sont naturellement résistantes aux glycopeptides car le lipopolysaccharide empêche ces molécules lipophobes de passer dans le périplasme. Les polymyxines ne peuvent pas interagir avec le peptidoglycane des bactéries à Gram positives. Les bactéries anaérobies sont résistantes aux aminosides car elles ne permettent pas la pénétration de ces molécules. Le genre Klebsiella est naturellement résistante aux amoxicillines, ticarcilline, pipéracilline grâce à la présence de pénicillinase (Yarlagadda et al., 2016).
La communauté médicale redoute surtout les résistances acquises parce qu’elles rendent les bactéries multirésistantes. L’acquisition des gènes de résistances comprend la mutation de gènes de régulation et de gènes de ménage. Elle peut également se faire suite à l’intégration de gènes ou l’acquisition de gènes médiés par des plasmides.
Résistance aux quinolones
La résistance aux quinolones se compose de 3 mécanismes. Le mécanisme le plus efficace est la mutation par substitution d’acide aminé de la région du site actif de l’ADN gyrase et de la topoisomérase IV diminuant l’affinité entre les quinolones et les enzymes(Jacoby, 2005).
L’altération de la cible est souvent corrélée avec le mécanisme d’efflux(Jacoby, 2005). Les membranes bactériennes possèdent de nombreuses protéines qui peuvent activement rejeter des particules vers le milieu extérieur. Seulement, ces pompes sont soumises à des gènes de régulation dont la mutation (acrR, marR) entraîne une augmentation de leur activité et ainsi la diminution de la concentration de quinolone donc, la résistance. Finalement, la résistance aux quinolones peut être médié par les plasmides qui transportent souvent des bêtalactamases par la même occasion. Les gènes dits qnr, portés par la plasmide, codent pour un pentapeptide capable de se lier à l’ADN gyrase et la topoisomérase IV, et les protègent de l’inhibition des quinolones.
Résistance aux bêtalactamines
La production d’enzymes capables d’hydrolyser les bêtalactamines est un problème majeur pour les cliniciens, parce que ces enzymes sont très actives, 10 molécules de pénicilline hydrolysées par seconde, tandis que les gènes responsables de leur synthèse sont transférablesgrâce aux plasmides (Walsh, 2003).
Les bêtalactamases hydrolysent les bêtalactamines au niveau de la fonction amide entrainant l’ouverture du cycle et la désactivation de la molécule.
ARG-ANNOT
Comme énoncé dans l’introduction, ARG-ANNOT est une collection de gènes de résistance constituée par l’URMITE comptant 1808 gènes enregistrés dans un fichier FASTA (version mars 2017). Cette base de données est plus concise que celles évoquées précédemment sans pour autant perdre de la sensibilité. En effet, ARG-ANNOT détecte significativement plus de gènes (50% de plus) que ResFinder lors d’analyse de génomes. Une sensibilité supérieure est dû au fait que les bases de données citées plus haut sont créées pour détecter la résistance acquise où le gène doit avoir plus de 90% de similarité avec les gènes connus. ARG-ANNOT par contre peut détecter des gènes avec seulement 50% de similarité et peut trouver des gènes à partir de séquences partielles.
Les gènes ont été sélectionnés à partir des données bibliographiques : Lahey Clinic website, ARGO, MvirDB, ARDB, et Resfinder, puis ces séquences ont été récupérées sur GenBank/EMBL avant d’être nettoyées et vérifiées pour une nomenclature codifiée. ARG-ANNOT compte 16 classes d’antibiotiques qui sont listées dans l’annexe 2 de ce travail.
Les entêtes des gènes commencent par les noms de la classe ou les noms de l’antibiotique entre parenthèses. Ensuite, le nom du gène en question séparé par un « : » du numéro d’accession surGenBank. Les deux derniers éléments informent de la position du gène dans un chromosome et de sa taille.
NRPUR
NRPUR est un projet développé par le Dr Vicky MERHEJ visant à créer une base de données de NRPS/PKS vérifié in vitro et dont l’annotation est rigoureusement revérifiée.
NRPS/PKS
Les NRPS/PKS ou nonribosomial peptide synthétase/Polyketide synthétase sont des protéines multienzymatiques portant de nombreux domaines capables de synthétiser des peptides nonribosomiales. Ces peptides sont des métabolites secondaires qui ont un intérêt pharmaceutique du fait de leur forte activité biologique notamment leur propriété antibactérienne, antitumorale, antifongique et antiparasitaire. (Ansari et al., 2004)
Ces mégaenzymes font partie des structures les plus complexes présentes dans la nature. Les différents domaines qui les constituent se plie indépendamment et s’organisent en modules. Demanière générale, le cycle de catalytique des NRPS commence par une activation des acidesaminés grâce à l’adénylase suivi d’une phase de condensation, d’élongation puisd’épimérisation. (Weissman, 2015)
Reconnaissance au MALDI-TOF
Le MALDI-TOF MS (Matrix Assisted-Laser Desorption/Ionization-Time Of Flight Mass Spectrometry) est une technique de spectrométrie de masse se basant sur l’utilisation d’une matrice et d’un laser pour analyser les protéines contenues dans un échantillon. Depuis 2000, le MALDI-TOF est utilisé en microbiologie clinique comme outil d’identification de routine avec une précision supérieure à celle des identifications biochimiques et moléculaires(Seng et al., 2010). L’URMITE a créé une base de données des spectres des bactéries de la CSUR pour permettre une identification rapide. Les spectres des bactéries résistantes ont été récupérés etrendus disponibles sur le MediCA²C.
Principe
Le MALDI-TOF MS est une technique issue de la combinaison de deux principes : le MALDI et le TOF MS (Jurinke, Oeth et van den Boom, 2004). MALDI est un nouveau procédé d’ionisation de particules faisant suite à l’ionisation chimique et électronique. Ces procédés dénaturant totalement les particules, elles ont été abandonnées pour une méthode plus douce grâce à l’utilisation d’une matrice qui est un liquide cristallin absorbant les UV (longueur d’onde à 337nm) comme le alphacyano-4-hydroxycinnamic acide (HCCA or CHCA) ou le 2,5-dihydroxybenzoic acide (DBA). Les échantillons sont mélangés avec cette matrice qui lorsque frappée par le laser, entraîne les particules avec elle et se retrouvent à l’état d’ion.
Les ions se retrouvent dans un champ électromagnétique, et se déplacent vers les plaques de lecture. Les ions avec un rapport masse-charge le plus faible, donc les ions les plus légers et fortement chargés, se déplacent plus vite. Le temps que l’ion met pour atteindre la plaque de lecture est calculé et est utilisé pour la caractériser. Il s’agit du temps de vol en spectrométriede masse (TOF MS).
Mode opératoire
Une colonie est prélevée sur une gélose puis étalée sur deux puits d’une plaque, de cette manière l’identification sera significative. La matrice est préparée dans un Eppendorf dont 10 microlitres sont prélevés pour les déposer sur les puits contenant les échantillons. Ensuite, la plaque est amenée au Microflex (machine effectuant la lecture) configuré pour la reconnaissance de bactéries. L’identification se fait en quelques heures et les résultats sont lus et réécrits dans un fichier excel. Les fichiers générés par le Microflex sont compressés au format zippuis le chemin vers ce dernier est également enregistré sur le fichier excel.
Le schéma récapitulatif du mode opératoire et du principe du MALDI-TOF sont représentés par la figure 7.
PCR standard
Les produits de l’amplification sont révélés sur gel d’agarose par électrophorèse. La vitesse de migration des produits d’amplification est fonction de la taille du produit. Le produit d’amplification correspondant à la taille du témoin positif est la preuve de la présence du gène recherché.
Mode opératoire
Par rapport à l’exemple de la souche contenant une carbapénémase cité plus haut, les gènes codant pour des carbapénémases sont testés : OXA-23, OXA-24, OXA-48. L’ADN bactérien est extrait en utilisant le kit QIAGEN et cet ADN est utilisé pour la PCR standard et celle en temps réel.
PCR standard
Dans une plaque du Thermoc ycleur BioRad 25 microlitres du mélange réactionnel (décrit dans le tableau 5) sont déposés dans chaque puits, cette plaque est ensuite introduite dans lethermocycleur.
Conception logicielle
Conception orientée objet
Le classeur excel constitue la source de données d’initialisation du système. Cependant, les données doivent être harmonisées et structurées. 6 semaines ont été nécessaires pour élaborer la conception orientée objet du système. Ce concept permet de factoriser les ressources et les traitements en modules dont la maintenance prend peu de temps par rapport à une structure en couche. De plus, le projet a vocation à communiquer via des web services avec d’autres langages et des applications futures. Les objets peuvent ainsi être transférés d’une application à une autre.
Base de données PostgreSQL
Toutes les données générées par les expérimentations sont systématiquement enregistrées dans un tableur Excel. Et à mesure que la taille des données augmente, leur gestion et leur intégritédevient complexe. De plus, le partage d’informations avec des logiciels externes doit être soumis à des règles tout en garantissant une vitesse élevée du temps de réponse. En conséquence, l’adoption d’un système de gestion de bases de données est nécessaire en vue de faire face à ces contraintes qu’un tableur Excel ne peut adresser facilement.
Le site db-engines.com recense 334 systèmes de gestion de base de données dans le monde.
Les systèmes propriétaires et souvent payants dominent le marché avec 53,8% de popularité chez les développeurs. Parmi ce groupe on peut citer les 5 premiers qui sont : Oracle, Microsoft SQL Server, DB2, Microsoft Access et Teradata.
Clusterisation ou groupement de séquences
Clusterisation d’ARG-ANNOT
La sensibilité de l’ensemble des promoteurs et des sondes pour les PCR de gènes de résistance utilisés à l’URMITE ont été retestés. Certains promoteurs ciblent une famille de gène tandis que d’autres ciblent spécifiquement une espèce de gènes. MediCA²C doit être capable de mettre en relation les différentes familles de gènes. Dans un premier temps, les séquences des gènes ont été divisées selon les 30 noms de familles déjà présents dans ARG-ANNOT. Dans un deuxième temps, chaque groupe de séquences est regroupé avec l’outils cd-hit qui se base sur la similarité par paire de séquences pour construire un groupe, la séquence la plus longue étantla représentante.
Clusterisation de NRPS/PKS
La problématique à résoudre en ce qui concerne la base de données protéique NRPS/PKS est d’accélérer le temps d’exécution de la requête tout en augmentant la précision et le sens biologique d’un alignement. La meilleure méthode pour réaliser cela est le RPS-BLAST (Reversed Position Specific BLAST) qui utilise une matrice de position PSSM (Position Specific weigt Score Matrix) au lieu de la matrice de score usuel (BLOSUM62 ou PFAM) utilisé pour un BLAST protéique. Cette méthode permet de détecter les protéines homologues distantes via les motifs et les domaines protéiques conservés.
Afin de réaliser un RPS-BLAST, il faut générer une matrice PSSM à partir de la base de données NRPS/PKS. Cette génération sera réalisée par le PSI-BLAST (Position Specific Iterative BLAST) qui demande un MSA (Multiple Sequence Alignment) en entrée. Aligner 16 000 séquences est un processus long et fastidieux pour un ordinateur qui n’est pas dédié à l’analyse de données. De ce fait, une clusterisation de la base de données a été faite puis chaque cluster est aligné avec le logiciel MAFFT (Multiple Alignment using Fast Fourier Transform).
Alignement et construction des arbres d’ARG-ANNOT
Les alignements des séquences d’une famille de gènes se font avec le logiciel MAFFT. Chaque cluster provenant de cd-hit dont la taille excède 10 séquences est directement aligné tandis que les plus petits clusters sont regroupés dans un seul grand cluster avant d’être à leur tour alignés.
Discussion
Les collections de souches actuelles ne permettent pas de commander des souches résistantes répondant à des critères spécifiques. La navigation dans les interfaces de ces collections est souvent difficile du fait du manque d’information sur le microorganisme et son phénotype ou de l’excès d’informations non relatives à la résistance aux antibiotiques.
Ce projet de Master constitue le début de la construction d’une collection de souches résistantes qui répond à des besoins de facilité dans l’utilisation : d’une part, permettre de voir la corrélation entre le phénotype et le génotype pour les chercheurs. Et d’autre part, mettre en place un système d’information qui rassemble les bonnes pratiques, dans le cadre d’une étude de la résistance et faisant les interprétations et les analyses nécessaires pour accélérer le travail des chercheurs.
Etant donné les spécificités de ces demandes, il n’existe pas encore de projet open source disponible utilisable comme base de ce projet. De plus, les logiciels de création de site web ne peuvent pas répondre à des besoins aussi spécifiques. Ainsi, le projet a été entièrement écrit de la base de données jusqu’à l’interface web.
A noter que, MediCA²C n’est pas suffisamment optimisé pour supporter des appels concourants au niveau mondial. Plus de temps de développement est nécessaire pour que le système puisse réponde aux grandes charges de travail notamment, l’assemblage et l’annotation de plusieursgénomes.
A part l’aspect informatique, les mécanismes de résistances présentent encore des inconnues notamment dans le fait que des souches perdent leur résistance. Effectivement, au cours de cette étude des souches résistantes étaient sélectionnées mais sont redevenues sensible après quelques repiquages. Il est donc nécessaire de mettre en place des tests de répétabilité afin que la collection soit la plus fiable possible et que les phénotypes persistent dans le temps.
Par ailleurs, il a été constaté qu’au sein d’une même souche, il apparaissait des clones n’ayant pas la même apparence que les cellules mères, ce qui constitue un défi de taille pour que lacollection soit homogène et que les descriptions correspondent aux attentes.
Il y a lieu également de remarquer que le temps pour réaliser une étude est relativement long car elle passe par différentes étapes : culture, MALDI-TOF, PCRs. Il serait intéressant de considérer l’utilisation du séquençage génomique directement et de réaliser les analyses bioinformatiques avec les bases de données déjà disponibles à l’URMITE par l’intermédiaire de MediCA²C.
Table des matières
I. Introduction
II. Synthèse bibliographique
II.1 Antibiotiques et mécanisme d’action
II.1.1 Inhibition de la synthèse de l’ADN
II.1.2 Synthèse de l’ARN
II.1.3 Inhibition de la synthèse protéique
II.1.4 Inhibition de la synthèse de l’acide folique
II.1.5 Inhibition de la synthèse de la paroi bactérienne
II.1.6 Altération de la structure de la paroi bactérienne
II.2 Mécanismes de résistances aux antibiotiques
II.2.1 Résistance aux quinolones
II.2.2 Résistance aux bêtalactamines
II.2.3 Résistance aux polymyxines (colistine)
II.3 Collections de souches
II.4 Bases de données de gènes
II.5 ARG-ANNOT
II.6 NRPUR
II.6.1 NRPS/PKS
II.6.2 NRPUR, la base de données de l’URMITE
III. Matériels et méthodes
III.1 Matériels
III.2 Méthodes
III.2.1 Sélection des bactéries
III.2.2 Etude des bactéries
III.2.3 Antibiogramme
III.2.4 PCR standard et qPCR
III.2.5 Conception logicielle
III.2.6 Bioinformatique
IV. Résultats et interprétations
IV.1 Statistiques
IV.2 Conception
IV.2.1 Diagramme des processus
IV.2.2 Diagramme des cas d’utilisation
IV.3 Site web
IV.4 Système d’information
IV.5 Outils d’alignement
V. Discussion
VI. Conclusion
VII. Références bibliographiques
VIII. Annexes
VIII.1 Dispositions des disques d’antibiotiques
VIII.2 Familles d’antibiotiques présents dans ARG-ANNOT
VIII.3 Evolution de la résistance aux antibiotiques au cours du temps