LE COMPLEXE D’ESPECES CHEZ RALSTONIA SOLANACEARUM

Télécharger le fichier original (Mémoire de fin d’études)

EPIDEMIOLOGIE MOLECULAIRE

En pathologie végétale, une épidémie désigne une maladie infectieuse déclenchée par un agent pathogène, qui se manifeste sous forme de poussées soudaines et inhabituelles et se propage rapidement dans une région ou population végétale donnée pendant une période donnée (Rapilly 1991). Elle touche alors une part importante de la production et l’incidence de la maladie augmente de manière significative par rapport à la situation sanitaire habituelle, entraînant des conséquences phytosanitaires dramatiques. Il peut arriver qu’une épidémie disparaisse pendant très longtemps. Dans le cas où la maladie est présente en permanence et dont l’incidence apparaît de façon constante dans une population donnée ou une région précise (foyers infectieux), on a une endémie. Cet état est souvent associé à une coévolution de l’agent pathogène et son hôte sur de longues périodes de temps. Un déséquilibre du système épidémiologique peut induire une endémie à un état d’épidémie. Enfin, une épidémie est qualifiée de pandémie lorsqu’elle touche une très large population sur un vaste territoire géographique, généralement à l’échelle mondiale.
Le concept du ‘tétraèdre épidémiologique’ rend compte que différents facteurs contribuent dans le développement d’une épidémie :• Des facteurs liés à l’agent pathogène comme la diversité intra et inter-populations, évolution naturelle de l’agent pathogène par mutation ou sélection naturelle, le pouvoir pathogène, la densité d’inoculum, le potentiel invasif, etc.• Des facteurs liés à l’hôte comme un pool génétique homogène, le degré de résistance, l’âge de la plante et son état physiologique, etc.
• Des facteurs liés à l’environnement comme la température, l’humidité, l’eau, les caractéristiques du sol, les vecteurs biologiques, etc.• Des facteurs anthropiques comme les pratiques agricoles, échange et commerce de matériel végétal infecté, etc. qui favorisent souvent la dispersion de l’agent pathogène (Agrios 2005 ; Lepoivre 2003).
En épidémiologie, on recherche à comprendre l’histoire de la maladie, notamment en apportant un éclairage sur• la nature de l’agent pathogène responsable de l’épidémie ;• les sources et réservoirs possibles d’inoculum ;• les modes et mécanismes de dispersion de l’agent pathogène, et• la prévalence des types particuliers d’une espèce d’agent pathogènes. Dans cette optique, l’épidémiologie repose en premier lieu sur la caractérisation de la diversité de l’agent pathogène qui constitue le premier maillon du système épidémiologique. En effet, la diversité génétique des agents pathogènes a toujours constitué un des importants facteurs compromettant tout succès de lutte génétique. Leur capacité à contourner la résistance des plantes hôtes, leur faculté d’adaptation et de dispersion rapide témoignent, parmi d’autres, leur diversité génétique. Dans ce concept de diversité génétique, il faut porter également notre regard sur la structure de ses populations. Certes dans le milieu naturel, les individus se développement en populations. Chaque population est caractérisée par un patrimoine génétique et possède une dynamique évolutive propre. Les populations sont susceptibles d’interagir entre elles au cours du temps, le plus souvent par des échanges génétiques. Leur capacité de développement et leur diversification sont conditionnées par différents mécanismes d’évolution menant à leur structuration et leur permettant de maintenir ou de créer une variation génétique qui leurs sont utiles pour s’adapter aux conditions du milieu. La dynamique d’une épidémie (progression de la maladie et son organisation spatiale) est alors associée avec la dynamique des populations d’agents pathogènes. La connaissance de la structure des populations de l’agent pathogène conditionne toute stratégie d’intervention pour le contrôle d’une épidémie.
Depuis que les outils de biologie moléculaire et de séquençage sont accessibles, le problème de diversité génétique des agents pathogènes est facilement appréhendé par le recours à la technique du génotypage, devenue aujourd’hui incontournable comme moyen d’investigation rapide pour mieux appréhender les maladies infectieuses dans ses multiples facettes. On parle alors d’épidémiologie moléculaire. Grâce aux marqueurs moléculaires, l’analyse du polymorphisme génétique permet de rendre compte des aspects de la diversité génétique d’un agent pathogène responsable d’une maladie infectieuse, de définir le profil de la structure des populations impliquées dans l’infection, d’étudier leur interactions avec l’hôte, d’expliquer l’occurrence d’une épidémie en un lieu donné, et de suivre son évolution dans le temps et dans l’espace avec les diverses pressions sélectives exercés par l’environnement difficiles auparavant à appréhender.

GENOTYPAGE BACTERIEN

Chaque individu est caractérisé par une composition génétique qui lui est propre, appelée génotype. Le génotype désigne l’ensemble des gènes d’un individu à un ou plusieurs locus particuliers qui peut comporter différentes formes alléliques conduisant au polymorphisme génétique dans un groupe d’individus. En interaction avec l’environnement, le génotype agit sur l’ensemble des caractères observables ou détectables d’un individu – désignés comme étant le phénotype (Hartl et al. 1997 ; Lepoivre 2003).
Le génotypage consiste en l’identification des caractères génétiques communs à l’espèce mais qui présentent des variations au sein de cette espèce, permettant ensuite de différencier les individus entre eux. La méthode de génotypage la plus aboutie et la plus fidèle reste le séquençage et la comparaison de génomes complets, mais elle est onéreuse et surtout encore difficile de mise en œuvre (en tout cas dans le domaine de la recherche agronomique) pour étudier de grands effectifs de souches impliquées dans des épidémies (Field et al. 2004). Ceci a nécessité de développer des méthodes réalisables en routine : plus simples et rapides. Les méthodes de génotypage utilisées actuellement sont basées sur l’analyse de séquences spécifiques du génome bactérien, appelées ‘marqueurs moléculaires’. Il s’agit d’objets génomiques d’intérêts, car stables et recrutés pour être indépendants des variations environnementales. Le génotypage permet d’attribuer un profil génétique à un individu donné et de mettre en évidence les relations génétiques entre souches pathogènes de la même espèce.

MARQUEURS MOLECULAIRES COMME OUTIL D’INVESTIGATION

Un marqueur moléculaire correspond à un fragment d’ADN ou locus déterminé sur le génome et partagé par des individus d’une même espèce, et qui a la vocation d’être transmis de génération en génération. En se basant sur la définition d’un marqueur moléculaire idéal, avancé par de Vienne (1998) et Maheswaran (2004) ; un bon marqueur moléculaire pour le génotypage bactérien devrait être• suffisamment polymorphe i.e. qui présente plusieurs allèles (multiallélique) et varie d’un génome à l’autre (plusieurs variants à un locus donné) permettant de différencier des individus très proches ;• non épistatique i.e. le génotype en un locus est indépendant du génotype à d’autres loci ;• réparti régulièrement dans l’ensemble du génome physique ;• neutre (différents allèles ne doivent pas avoir d’effet sur le phénotype de l’individu) ;• détectable sur un grand nombre d’individus étudiés.
De nombreux marqueurs moléculaires ont été développés avec des applications diverses allant de la cartographie du génome et des gènes, l’étiquetage génétique, la sélection assistée par marqueurs, à l’analyse de diversité génétique, la biologie et génétique des populations et études d’évolution, d’épidémiologie, etc. (Maheswaran 2004 ; Schlotterer 2004b). Le choix des marqueurs dépend de ce fait de l’objectif scientifique précis assigné. Le pouvoir de résolution d’un marqueur réside dans sa vitesse de mutation : plus elle est rapide (horloge moléculaire rapide), plus la capacité du marqueur à différencier des types génétiques est forte. Le Tableau 1 donne un résumé de l’évolution chronologique du développement de marqueurs moléculaires.

TECHNIQUE DE GENOTYPAGE

Avec l’avènement des marqueurs moléculaires, une multitude de méthodes de génotypage sont aujourd’hui disponibles pour différencier les souches et les populations au sein d’une espèce bactérienne donnée. L’objectif d’une méthode de génotypage est de mettre en évidence les caractères variables au sein d’une espèce cible. On peut classer ces méthodes en trois catégories, basées sur la restriction enzymatique, l’amplification génique par polymérisation en chaîne ou PCR, le séquençage de l’ADN (Bidet & Bingen 2012 ; Li et al. 2009 ; van Belkum et al. 2007).
Les méthodes basées sur la restriction enzymatique consistent en la digestion des acides nucléiques (ADN, ARN) par une ou plusieurs enzymes de restriction qui découpent les gènes en fragments de taille différentes aux niveaux des sites de reconnaissance spécifiques. Dans cette catégorie, on distingue :
• la méthode d’analyse du polymorphisme de longueur des fragments de restriction (RFLP) où les fragments séparés après électrophorèse sont hybridés avec une sonde ADN (technique de Southern) (Southern 1975) ;• le ribotypage utilisant des gènes codant pour les ARN ribosomaux (ARNr) comme sondes (Bingen et al. 1994),• et la technique d’électrophorèse en champ pulsé (PFGE) qui est une variante de la méthode RFLP. (Herschleb et al. 2007).
Les méthodes basées sur l’amplification génique utilisent la technique d’amplification par polymérisation en chaîne ou PCR, qui consiste à dupliquer en grand nombre (un facteur d’un milliard) un segment de matériel génétique (à partir d’une faible quantité de l’ordre du picogrammes). On distingue :
• l’amplification aléatoire d’ADN polymorphe (RAPD) basée sur l’amplification d’une matrice génomique par une amorce unique choisie aléatoirement (Williams et al. 1990), une méthode qui n’est pratiquement plus utilisée aujourd’hui ;• la méthode d’analyse du polymorphisme de longueur des fragments amplifiés (AFLP) (Vos et al. 1995) ;• la méthode PCR-RFLP basée sur la digestion du produit PCR par une ou des enzymes de restriction ;• les méthodes PCR de séquences répétées (Rep-PCR) dont le principe est basé sur l’amplification des zones à répétitions (REP, ERIC, BOX) qui sont dispersées dans le génome (Gilson et al. 1984 ; Hulton et al. 1991 ; Koeuth et al. 1995 ; Lupski & Weinstock 1992 ; Stern et al. 1984 ; Versalovic et al. 1991) ;• et la méthode MLVA basée sur l’amplification de plusieurs locus de séquences répétées en tandem (VNTR).
Les méthodes basées sur le séquençage de l’ADN concernent généralement le séquençage partiel d’un ou plusieurs gènes conservés et polymorphes. L’étude concerne donc l’analyse des variations nucléotidiques au niveau des loci cibles. Les marqueurs couramment utilisés sont :• les gènes de la région ITS : ARNr 16S et 16S-23S qui sont présents chez les bactéries ;• les gènes de ménages non soumis à pression de sélection et dont les produits assurent les fonctions indispensables à la survie des cellules ;• les gènes associées à la virulence qui sont assez polymorphes (Li et al. 2009 ; Yıldırım et al. 2011).
La valeur de chaque méthode dépend des performances attendues, de sa praticabilité et des domaines d’application pour lesquels elle a été développée (Sabat et al. 2013 ; Schlotterer 2004 ; Struelens 1996 ; van Belkum et al. 2007).
Critères de performance
1. La typabilité : c’est la capacité à attribuer un génotype à toutes les souches typées. C’est le pourcentage de souches assignées à un génotype sur le nombre total de souches testées.
2. Le pouvoir discriminant : c’est la capacité d’une méthode à attribuer un génotype différent à deux souches n’ayant aucun lien épidémiologique, choisies au hasard au sein d’une population d’une espèce donnée. C’est une qualité importante recherchée pour un système de génotypage. Il est exprimé par l’indice de discrimination de Simpson (Simpson 1949) modifiée par Hunter et Gaston (Hunter & Gaston 1988):= 1− 1 ∑ ( − 1), où N représente le nombre total de souches du panel ( −1) = 1 d’échantillons, S est le nombre total de génotypes décrits, nj indique le nombre de souches appartenant au jème génotype. Une valeur de HGDI proche de 1 indique un fort pouvoir discriminant du système de génotypage.
3. La reproductibilité : c’est la capacité de la méthode à attribuer le même génotype à un isolat testé lors d’essais indépendants intra- et inter-laboratoires. Dans ce cas, il faut tenir compte de l’influence des différentes étapes impliquées dans le génotypage d’une souche par une méthode donnée comme dans la préparation du matériel génétique (par exemple, la variation du milieu de culture des souches ou de la méthode d’extraction de l’ADN) ; dans l’utilisation de différents ou même réactifs et équipements ; dans l’observation, l’enregistrement et l’interprétation des résultats. A ce propos, il faut disposer d’un protocole standardisé visant à fournir une méthode de génotypage fiable.
4. La stabilité : c’est la capacité à reconnaître la relation clonale des isolats dérivés d’une souche ancestrale commune, en dépit des variations qui peuvent survenir au cours de la conservation et de la réplication.
5. La concordance épidémiologique : c’est la capacité de faire des groupes de parenté et d’établir un niveau de parenté en accord avec le profil épidémiologique connu.
6. La concordance avec d’autres méthodes de génotypage. Il est intéressant d’évaluer pour les méthodes de génotypage utilisées, si les souches fortement similaires sont regroupées ou présentent une relation clonale avec d’autres méthodes.
Critères de praticabilité
7. La flexibilité de la méthode de typage pour une gamme d’espèces bactériennes, i.e. que le principe et les aptitudes et les équipements requis sont identiques même avec des modifications mineures du protocole.
8. La rapidité : le génotypage doit idéalement être effectué en ‘temps réel’ avec des résultats disponibles dans un laps de temps le plus court possible.
9. L’accessibilité qui dépend fortement sur la disponibilité des réactifs et des équipements, ainsi que les compétences requises.
10. La facilité d’emploi qui fait référence à la simplicité des manipulations, à l’adéquation à traiter un nombre élevé d’échantillons, à la facilité d’interprétation et au coût de la méthode, à la possibilité de lancer des analyses informatisées à partir des résultats obtenus de génotypage et de les stocker dans une banque de données informatique. Cette banque de données permet ensuite la mise en place de systèmes de génotypage automatisés et standardisés utiles dans la mise en place de systèmes de surveillance épidémiologique.

APPROCHES MLSA/MLST, MLVA

Les techniques de génotypage appropriées pour des études épidémiologiques ont été développées par des cliniciens. Elles exploitent des marqueurs stables à fort pouvoir discriminant pour différencier les souches au sein de la population. Plus les marqueurs ont une vitesse d’évolution rapide plus ils sont appropriés pour des études épidémiologiques locales sur du court terme et à des échelles fines. Comme pour la phylogénie, les marqueurs qui évoluent lentement sont plus appropriés pour des études épidémiologiques retraçant le passé évolutif ancien, donc sur du long terme et concerne une échelle globale. Aujourd’hui, la méthode de typage et d’analyse par séquençage multi-locus (MLSA/MLST) et la méthode d’analyse du polymorphisme de plusieurs locus de séquences répétées en tandem (MLVA) sont les plus couramment utilisées comme outil épidémiologique.
La méthode MLSA/MLST est considérée comme la méthode de référence chez bon nombre de bactéries comme Neisseria meningitidis, Streptococcus pneumoniae, Escherichia coli, Staphylococcus aureus, Haemophilus influenza, etc. (Maiden 2006 ; Maiden et al. 1998 ; Pérez-Losada et al. 2013 ; Roumagnac et al. 2006 ; Urwin & Maiden 2003). C’est une technique hautement reproductible basée sur des séquences d’ADN pour une caractérisation non ambiguë des souches bactériennes. La méthode utilise au moins sept gènes (ou fragment de gènes) qui présentent des variations intraspécifïques pour caractériser les souches bactériennes et se base sur l’analyse du polymorphisme nucléotidique des gènes à partir d’un échantillonnage. La méthode MLST diffère de la méthode MLSA dans la façon dont les données sont analysées. Le MLST consiste à analyser les profils alléliques générés après alignement des séquences nucléotidiques. Chaque locus d’intérêt est séquencé puis chaque allèle identifié est associé à un caractère numérique. Une série de nombres ou code numérique correspondant au numéro allélique à chaque locus constitue ainsi le profil allélique de la souche typée (Figure 6A). La méthode MLSA utilise en outre la concaténation de séquence à la place du profil allélique pour déterminer la séquence-type (Figure 6B). Basés sur la séquence de gènes relativement conservées, ces deux méthodes sont largement utilisées pour déterminer les relations de parenté entre les séquences et permet de réaliser des études d’épidémiologie globale (ou macro-épidémiologie) (Glaeser & Kämpfer 2015 ; Maiden 2006 ; Maiden et al. 1998 ; Turner & Feil 2007). Dans de nombreuses études, l’approche MLSA a permis une meilleure approche pour la classification phylogénétique et une étude cohérente de l’histoire évolutive d’un individu au sein de l’espèce étudiée (phylogénie) par la reconstruction d’arbres phylogénétiques (Azevedo et al. 2015 ; Castillo & Greenberg 2007 ; Martens et al. 2008 ; Vinuesa 2010 ; Wicker et al. 2012).
La méthode MLVA permet de discriminer des souches bactériennes comme Salmonella Enteritidis, Raltsonia solanacearum, etc. et notamment des souches qui présentent de faibles variations génétiques comme Bacillus anthracis, Mycobacterium tuberculosis, Pseudomonas aeruginosa, Legionella pneumophila, Yersinia pestis, Xanthomonas citri, etc. (Bertrand et al. 2015 ; Denœud & Vergnaud 2004 ; Eyre et al. 2013 ; Lindstedt et al. 2013 ; Parkinson et al. 2013 ; Poulin et al. 2015 ; Pruvost et al. 2014 ; Ravelomanantsoa et al. 2016 ; SHAN et al. 2015 ; Van Belkum 2007 ; Zaluga et al. 2013). Les VNTRs sont généralement des fragments intergéniques (localisés entre les gènes) mais peuvent aussi se retrouver dans des fragments codants. Ces sont des séquences hypervariables dont la taille des motifs répétés peut varier de quelques bases à plus d’une centaine (Vergnaud & Pourcel 2009). Généralement, ces variations génétiques au niveau des VNTR sont dues à un processus de mésappariement par glissement des brins d’ADN lors de la réplication. Contrairement à la méthode MLSA/MLST, la méthode MLVA repose sur la comparaison de la taille des amplicons (produits PCR) et la détermination du nombre de répétitions (allèles) sur un locus donnée. Un code numérique composé d’une série de chiffres correspondant au nombre d’unités répétées à chaque locus constitue le profil génétique d’un individu (Figure 6C). La méthode MLVA qui est généralement plus discriminante que les autres méthodes présentées, est donc plus appropriée pour des investigations d’épidémiologie locale. La performance à associer des souches épidémiologiquement liées permet de tracer et d’identifier les sources/foyers d’infection (Lindstedt et al. 2013).

EXPLORATION DE LA DIVERSITE GENETIQUE VARIATIONS GENETIQUES

Malgré l’existence d’un important fond génétique commun au sein d’une espèce, les individus d’une population peuvent présenter des différences, de même que les populations entre elles. Au cours de l’évolution, les variations qui surviennent sur le matériel génétique sont sources de diversité génétique. Ces changements sont héritables et transmis à la descendance, donnant naissance à des variants (sous-clones) qui présentent des caractères nouveaux (nouveaux allèles) différents des cellules parentales d’origine. Les principales modifications observées au niveau des séquences nucléotidiques peuvent être :
• une substitution qui correspond par un remplacement de plusieurs nucléotides par d’autres (Figure 7A) ;• insertion et/ou délétion i.e. addition et/ou perte de quelques paires de bases (Figure 7A) (de Vienne 1998 ; Emerson et al. 2008 ; Rodriguez-Murillo & Salem 2013 ; Schork et al. 2000 ; Väli et al. 2008). Le polymorphisme générée se traduit en :• un polymorphisme mononucléotidique (SNP) représenté par une variation d’une seule paire de bases sur un locus donné, entre individu d’une même espèce ;• un polymorphisme de nombre de copies (CNV) dans lequel le nombre de copies d’un même locus est variable entre les individus dû à des événement de duplication et de délétion (Brynildsrud et al. 2015 ; Riehle et al. 2001) ;• un polymorphisme de répétitions localisé généralement au niveau des séquences répétées en tandem, résultat d’une contraction (délétion) ou expansion (insertion) d’un motif répétée par la suite d’une mutation par glissement (Bichara et al. 2006 ; Gemayel et al. 2010) ou une recombinaison (Bi & Liu 1996 ; Richard & Pâques 2000) (Figure 7C).
Chez les bactéries, des variations génétiques peuvent également se produire par transfert horizontal de matériel génétique d’une cellule à l’autre. C’est un processus dans lequel une bactérie intègre du matériel génétique provenant d’une autre bactérie (différent genre ou espèce) sans en être le descendant (échange de gènes ou recombinaison génétique). Trois évènements de transfert sont possibles :
• la transformation : incorporation d’ADN libre de l’environnement directement dans la bactérie ;• la transduction : transfert de matériel génétique d’une bactérie à une autre par l’intermédiaire d’un phage ou d’un virus ;• la conjugaison : transfert d’ADN d’une bactérie à une autre par contact direct (Figure 7B) (Mazodier & Davies 1991). Le transfert horizontal de gènes joue un rôle majeur dans la diversification rapide, l’adaptation et l’évolution des génomes bactériens (Doolittle et al. 2003).

DIVERSITE GENETIQUE INTRA-POPULATION

En épidémiologie notamment en génétique des populations, la variabilité génétique est estimée au sein de la population (diversité intra-population) et entre les populations (diversité inter-population). La population est généralement considérée comme une unité génétique d’évolution (Mayr 2001). Sous le nom de population, on désigne un ensemble d’individus de la même espèce cohabitant dans un même milieu écologique, qui ont la possibilité d’interagir entre eux et qui sont reliés génétiquement les uns aux autres. Autrement dit, une population correspond à un ensemble d’individus qui forme un pool génétique (composé par des gènes identiques mais qui diffèrent par ses combinaisons d’allèles) qui la caractérise. Analyser le niveau de variation génétique d’une population équivaut à mesurer la diversité pour définir la composition génétique aux niveaux des allèles et génotypes, en utilisant des marqueurs génétiques. Pour décrire la diversité génétique intra population, les paramètres de diversité génétique les plus couramment utilisés sont le taux de polymorphisme, la richesse allélique, la diversité de Nei ; et en complément pour les données de séquences, la diversité nucléotidique et la teneur en G+C. Ces paramètres sont estimés par locus et la moyenne est prise sur tous les loci.
• Le taux de polymorphisme (P) exprime le pourcentage de loci polymorphes dans la population étudiée. = ∑ = 1 / , où = proportion de loci polymorphes dans une population et = nombre de populations.
• La richesse allélique calculée par raréfaction (A) exprime le nombre d’allèles observés à un locus donné calculé en fonction de la taille de l’échantillon (Petit et al. 1998). La méthode est basée sur la probabilité ( ) pour un allèle k, observé fois parmi les N gènes dans la population i, d’être absente dans un échantillon de taille réduite g où g < N, prise comme référence pour la comparaison de toutes les populations ; où ( ) = ( − , )/ ( , ), expression dans laquelle ( , ) représente le nombre de combinaisons de N objets pris g a g (ou − objets dans le cas du numérateur). La richesse allélique à un locus donné est obtenue en sommant les allèles observés dans la population. = − ∑ = 1 ( )
• L’indice de diversité génétique non biaisé de Nei (HE) (Nei 1978) est définie comme étant la (1−Σ 2) probabilité de tirer au hasard deux allèles différents à un même locus.= , où n = −1 nombre d’individu étudiés, et pi est la fréquence de l’allèle i à ce locus. On définit la diversité génétique HE d’une population comme la moyenne de diversité observée pour l’ensemble des gènes étudiés.
• La diversité nucléotidique ( ) est estimée à partir de séquences d’ADN. C’est le nombre moyen de différences nucléotidiques par site entre paire de séquences prises au hasard (Nei & Li 1979). = /( − 1)Σ π , où n est le nombre de séquences analysées pour une population, Xi et Xj sont les fréquences estimées des séquences de types i et j dans la population totale et π est la proportion de nucléotides différents entre les séquences i et j.

STRUCTURE DES POPULATIONS ET FLUX DE GENES

La loi de Hardy-Weinberg a été proposée au début du XXe siècle démontrant qu’en absence de mécanismes évolutifs, la fréquence allélique reste constante de génération en génération. Si on atteint cet équilibre, la population n’évolue pas. Cet équilibre de Hardy-Weinberg fournit une référence pour l’étude de populations réelles. Cependant, la composition génétique des populations varie au cours du temps, de génération en génération et les populations sont structurées dans le milieu naturel. La structuration des populations est modulée par diverses forces évolutives, plus ou moins dépendantes les unes des autres.• Comme nous l’avons vu, la mutation génétique peut survenir spontanément d’une génération à l’autre ou causée par des facteurs environnementaux, entrainant peu de changement direct des fréquences alléliques. Le taux de mutation donne des informations sur l’évolution des fréquences alléliques au sein d’une population et une indication sur le potentiel adaptatif des populations.• La sélection naturelle est liée aux variations imprévisibles des conditions du milieu. Elle agit uniquement sur des variations existantes et augmente la fréquence des variations favorables permettant aux organismes de s’adapter à leur milieu au fil des générations. L’analyse d’effets de la sélection sur la composition génotypique des populations permet de comprendre comment le polymorphisme se maintient dans les populations naturelles (adaptation).• La dérive génétique est définie comme une variation aléatoire de la fréquence allélique. La dérive génétique s’exerce plus facilement sur une petite population et tend à fixer différents allèles (nocifs, neutres ou bénéfiques) dans des populations. Une réduction de taille d’une population peut être causée d’une part, par un effet fondateur où certains individus isolés de leur population initiale s’implantent dans un nouveau territoire et forment une nouvelle population dont le patrimoine génétique n’est pas représentatif de la population initiale ; d’autre part, par un effet d’étranglement où une population est susceptible de traverser occasionnellement des périodes durant lesquelles seul un petit nombre d’individus survivent. Lors de ces goulets d’étranglement, la variation génétique peut être perdue par l’effet du hasard.• Le flux de gènes désigne le transfert efficace d’allèles entre populations favorisant ainsi l’introduction de nouveaux allèles. Il a un impact sur l’organisation spatiale de la diversité génétique à différentes échelles spatiales. Le flux de gènes tend à homogénéiser les fréquences alléliques entre les populations d’où réduction des différences entre les populations au fil du temps, favorisant la mise en place d’adaptation. Le transfert horizontal des gènes est un mécanisme qui génère un flux de gènes constant favorisant l’acquisition de fonctions à forte valeur adaptative (fitness). En outre, ces quatre forces interagissent les unes avec les autres à différentes échelles spatio-temporelles. Par exemple, l’action combinée de la sélection naturelle et des mutations tend à maintenir les fréquences alléliques de la population à une valeur d’équilibre pour des populations de tailles conséquentes occupant un milieu stable. Comme le flux de gènes tend à l’homogénéisation de la composition génétique de différentes populations entre elles, il peut contrecarrer l’effet de la mutation, de la sélection et de la dérive génétique qui confère une différenciation entre populations. Le flux de gènes peut compenser l’effet de la dérive génétique. Comme la sélection agit uniquement sur certains loci soumis à la sélection, elle pourrait constituer une barrière aux flux de gènes pour ces régions génomiques. Cependant, pour de faible pression de sélection, le flux de gènes peut s’opposer à l’adaptation (Hartl et al. 1997 ; Robinson et al. 2010) .
L’analyse de ces processus d’évolution des populations, la mise en évidence de la présence ou non de recombinaison et de l’étendue de la recombinaison lors de la diversification ont permis de décrire les structures de populations suivantes :• Population clonale qui présente un fort déséquilibre de liaison, i.e. une forte association d’allèles entre loci en absence de recombinaison et la mise en évidence du même génotype ou d’un complexe clonal dont la divergence est initiée à partir d’un génotype fondateur. La divergence se fait généralement par des mutations neutres héritées.• Population panmictique où la population évolue par recombinaison ou par transfert horizontal de gènes. On a un équilibre de liaison, i.e. que les allèles sont distribués aléatoirement.• Population épidémique qui est panmictique mais apparaît comme clonale (avec les complexes clonaux) en situation d’épidémie du fait que le génotype responsable de l’épidémie est surreprésenté dans la population étudiée. Dans de telles populations les taux de recombinaison sont faibles et des lignées séparées se composent de souches isolées, étroitement liées (clones) qui se diversifient principalement par mutation (Smith et al. 2000 ; Smith et al. 1993). Ces clones particuliers peuvent s’adapter à leur hôte et persister dans le temps.• On dit qu’une population a une structure mixte quand les souches évoluent par expansion clonale entrecoupée d’évènements de recombinaison. L’expansion clonale est le résultat d’une adaptation à une nouvelle niche écologique ou un nouvel hôte. La divergence est ainsi modulée par la sélection naturelle ou par dérive génétique.
• On distingue également des populations qui sont en déséquilibre de liaison mais dont les sous-populations qui les composent présentent de la recombinaison interne à chaque sous-population mais pas entres elles. Dans ce cas, les populations peuvent être géographiquement ou écologiquement isolées, ou il y a des barrières biologiques limitant l’échange de gènes. En outre, les conditions environnementales, l’hôte (espèce ou cultivar), la distribution spatiale des génotypes de l’hôte, les pratiques culturales et les facteurs anthropiques semblent influencer la composition génétique et la structure des populations (Scortichini 2005).
La structure des populations ainsi que le flux de gènes entre les populations peuvent être estimés par le ‘F-statistique de Wright’ qui est un indice de déviation par rapport aux proportions de Hardy-Weinberg (Wright 1949). Le degré de diversification génétique sur un ensemble de loci est donné par l’indice de différenciation GST de Nei (Nei 1973) qui est une généralisation du FST de Wright (Wright 1949) calculé sur un seul locus di-allélique. GST est défini par : = ( − )/ , où est la moyenne des hs sur l’ensemble des locus ; (hs = moyenne arithmétique sur l’ensemble des sous-populations de la diversité génétique à un locus par sous population) ; et est la moyenne arithmétique des ht sur l’ensemble des locus (ht = diversité génétique sur un locus sur la population totale). La valeur du GST est comprise entre 0 et 1 avec une valeur seuil significative p < 0,05. Pour les données de séquences nucléotidiques, on calcule également le NST (Lynch & Crease 1990) qui est analogue au GST. GST considère la proportion de la diversité allélique totale entre les populations tandis que NST tient compte la diversité nucléotidique, les similarités entre haplotypes (groupes d’allèles de différents loci) et de la distance génétique. Pour les données de séquences répétées en tandem, on calcule le FST (Nei 1977) ou le RST (Slatkin 1995). Le FST mesure la différenciation génétique en fonction des fréquences alléliques et assume que chaque mutation engendre une forme allélique unique (modèle de mutation IAM, Infinite Allele Model) (Kimura & Crow 1964) tandis que le RST tient compte des variations alléliques et assume une mutation avec une perte ou un gain d’un motif (modèle de mutation SMM, Stepwise Mutation Model) (Kimura & Ohta 1978). Les indices de différenciation donnent une indication sur la distribution de la variation génétique au sein et entre les populations. Une valeur égale à 0 suggère que deux populations sont à l’équilibre et possèdent des mêmes fréquences alléliques (panmixie). Une valeur très faible indique un flux de gènes élevé (migration) avec une population à large distribution (dérive génétique). Une valeur de 1 implique que les deux populations ne partagent aucun allèle entre elles et évoluent de manière indépendante.

Table des matières

INTRODUCTION GENERALE
SYNTHÈSE BIBLIOGRAPHIQUE
EPIDEMIOLOGIE MOLECULAIRE
I. GENOTYPAGE BACTERIEN
Marqueurs moléculaires comme outil d’investigation
Technique de génotypage
Approches MLSA/MLST, MLVA
II. EXPLORATION DE LA DIVERSITE GENETIQUE
Variations génétiques
Diversité génétique intra-population
Structure des populations et flux de gènes
Représentation des relations génétiques
Diversité phénotypique
III. ABOUTISSEMENT ET PORTEE DES INVESTIGATIONS MODELE D’ETUDE : LE FLETRISSEMENT BACTERIEN
IV. LE COMPLEXE D’ESPECES CHEZ RALSTONIA SOLANACEARUM
Description
Taxonomie et diversité génétique
Distribution et spectre d’hôte
Cycle infectieux, conservation et survie
Facteurs de virulence
Epidémiologie
Stratégies de lutte et de gestion
V. GENOTYPAGE APPLIQUE AUX SOUCHES DU ceRs
Diversité génétique, génétique des populations et phylogénie de la collection mondiale
inférée par analyse MLSA
Marqueurs VNTRs à fort pouvoir de discrimination des souches du ceRs.
OBJECTIFS ET QUESTIONS DE RECHERCHE
CHAPITRE 1. DÉVÉLOPPEMENT DU SCHÉMA MLVA DU PHYLOTYPE III
INTRODUCTION
METHODOLOGIE
RESULTATS ET DISCUSSION
CONCLUSION PARTIELLE
CHAPITRE 2. DIVERSITÉ GÉNÉTIQUE DU ceRs ET ÉPIDEMIOLOGIE
INTRODUCTION
MATERIELS ET METHODES
Constitution de la collection de souches du ceRs
Traitement des échantillons
Collection de souches
Caractérisation moléculaire des souches en collection
Enquête épidémiologique
Analyse des données
RESULTATS ET DISCUSSION
Ampleur de l’échantillonnage et collection de souches du ceRs
Phylotypes, spectre d’hôtes et distribution géographique
Identification de l’écotype ‘Brown rot’ IIB-1 et de sept sequevars
Populations endémiques diversifiées et complexes de souches malgaches de l’écotype
africain phylotype III
Synthèse et analyses des données d’enquêtes
CONCLUSION PARTIELLE
CHAPITRE 3. ÉVALUATION PRÉLIMINAIRE DE LA RÉSISTANCE DES VARIÉTÉS CULTIVÉES À MADAGASCAR
INTRODUCTION
MATERIELS ET METHODES
Matériel végétal
Ralstonia solanacearum
Dispositif expérimental et inoculation
Suivi et mesure des symptômes
Analyses des données
RESULTATS ET DISCUSSION
CONCLUSION PARTIELLE
CONCLUSION GÉNÉRALE ET PERSPECTIVES
EPIDEMIOLOGIE MOLECULAIRE : RS3-MLVA16 et RS2-MLVA9, deux puissants outils hautement résolutifs pour caractériser respectivement les souches du phylotype III et du phylotype II.
DEUX MODELES EPIDEMIOLOGIQUES CONTRASTES AU SEIN DU ceRs : l’écotype ‘Brown rot’ et l’écotype ‘Africain’
EVALUATION DE LA RESISTANCE GENETIQUE des principales variétés de pomme de terre cultivées à Madagascar : pas de résistance aux souches malgaches ; résistance génétique des variétés 720118 (Jaingy) et 800934 (Miova) aux souches I-31
PRIORITES DANS LA STRATEGIE DE LUTTE contre le fletrissement bactérien dû aux souches de quarantaine IIB-1
APPROFONDIR LES CONNAISSANCES SUR LE PHYLOTYPE III et ériger en modèle d’étude la capacité à développer des infections latentes ET DEMAIN…
RÉFÉRENCES BIBLIOGRAPHIQUES
ANNEXES