Détecter la sélection naturelle
De nombreux types de traits s’expriment chez un individu: comportementaux, morphologiques, physiologiques, reproducteurs, etc. Lorsque les traits sont quantifiables, il est possible de détecter et de mesurer la force de la sélection s’exerçant sur eux en mesurant la covariance entre les traits et le fitness des individus. Le fitness étant le succès reproducteur, il se mesure facilement sur des organismes avec un temps de génération court. Chez des organismes avec un temps de génération plus long, il est commun de diviser le fitness en composantes telles que la survie à la reproduction , l’âge à la première reproduction et la fécondité. Ces composantes du fitness sont communément appelées traits d’histoire de vie (THV). Par exemple, si un trait réduit les chances de survie d’un organisme jusqu’à la reproduction, les porteurs de ce trait auront moins de chance en moyenne de trouver un partenaire et se reproduire.
Par conséquent, le fitness des porteurs en sera réduit. Il est aussi possible de détecter la sélection survenue par le passé à partir de la signature laissée par les mutations dans la séquence d’ADN. Il est toutefois plus difficile de quantifier la force qu’ elle exerçait. De nombreux tests statistiques ont été développés à cette fin. Ils se distinguent principalement par l’échelle à laquelle ils sont appliqués, c’ est-à-dire, par des comparaisons entre espèces, entre populations d’une même espèce ou entre les individus d’une même population. Parmi ceux-ci, le test de ratio dN/dS (Nei et al., 1986), le test de McDonald-Kreitman (McDonald et al., 1991) et le test de Tajima (Tajima, 1989) compte parmi les plus utilisés (Vitti et al., 2013). Le test de ratio dN/dSutilise des séquences d’espèces divergentes et compare le taux de substitutions non-synonymes sur la séquence d’ADN (N, conduisant à un changement d’acide aminé dans la protéine) à celui de substitutions synonymes (S, pas de changement d’acide aminé) en utilisant le codon comme unité d’analyse. Différents modèles existent pour ce faire, avec différents niveaux de complexité mathématique pour tenir compte, par exemple, des substitutions successives sur un même site.
Le modèle de Nei-Gojobori (1986), par exemple, ne prend pas en compte le ratio de transitionltransversion et assume que les deux types de mutations surviennent à la même fréquence. D’autres modèles estiment le taux de substitution selon la position sur le codon (Goldman et al., 1994; Yang et al., 2000). Les régions d’un gène sous sélection purifiante (régions protéiques conservées) démontreront un excès de mutations synonymes, ce qui donnera un ratio dN/dS plus petit que 1 alors qu’un ratio plus grand que 1 indiquera une tendance à long terme de sélection positive. Le test de McDonald-Kreitman compare la variation génétique au sem d ‘une espèce à la différence inter-espèces en utilisant un ratio de mutations non-synonymes et synonymes mesurés sur un gène complet. Sous l ‘hypothèse nulle de l’absence de sélection lors de la divergence des deux espèces, on s’attend à ce que le ratio dN/dS au sein d’une espèce soit équivalent à celui entre les espèces (divergence due essentiellement à la dérive génétique). Finalement, le test de Tajima mesure avec la statistique D la différence entre deux estimations de diversité génétique dans un échantillon de séquences de nucléotides. La première estimation est obtenue en calculant le nombre de sites polymorphiques total de l’échantillon. La deuxième estimation se fait en calculant la moyenne des différences polymorphiques par paires de gènes. L’hypothèse nulle stipule que ces deux estimations sont équivalentes lorsque l’ évolution est neutre.
Limite des tests moléculaires
Les méthodes utilisées pour détecter la sélection à partir de la séquence d’ADN demeurent sujettes à une interprétation prudente. Le test de Tajima, par exemple, repose sur des prémisses qui sont rarement respectées par les populations naturelles. Il considère une taille de population constante, aucune migration ainsi qu ‘un appariement aléatoire des partenaires de reproduction (panmixie ou random mating). Plusieurs phénomènes peuvent aussi faire varier la fréquence des allèles dans une population et être confondus avec la sélection, ce qui peut conduire à des inférences erronées. C’est entre autres le cas de changements démographiques rapides qui peuvent changer le pool génétique et laisser dans les génomes une signature ressemblant à celle de la sélection (Stajich et al., 2005). Par exemple, un goulot d’étranglement et un effet fondateur (Figure 1.1), deux phénomènes conduisant à une réduction de la diversité génétique qui peuvent être confondus avec la fixation d’une mutation bénéfique par sélection positive.
Lors de la fixation, il peut également y avoir une réduction de la diversité allélique par « hitchhiking» en entrainant des gènes qui ne sont pas sous sélection, mais qui sont physiquement liés à celui sélectionné (Hung et al., 2014). Théoriquement, au niveau moléculaire, on s’attend à ce que les effets démographiques se reflètent sur l’ensemble du génome alors que la sélection, elle, laisse une trace sur un ou des segments précis de l’ADN. Cependant, il demeure compliqué de séparer démographie et sélection par ces approches (Ramirez-Soriano et al., 2008). De plus, ces tests de neutralité sont aussi sensibles à la taille de l’échantillon. Si le test est effectué à partir d’un échantillon trop petit, le nombre de mutations dans la population sera sous-estimé, car il ne prendra pas bien en compte les allèles rares. D’ailleurs Subramanian (2016) montre qu’en utilisant les exomes de 512 humains au lieu de 16, la détection de mutations jugées adaptives passe de 24 % à 10 %.
ADN mitochondrial
La mitochondrie provient très probablement de l’intégration par endocytose d’une bactérie proche du genre Rickettsia par une cellule eucaryote il y a de ça environ deux milliards d’années (Kurland et al., 2000). Au fil du temps, son génome se serait intégré dans l’ADN nucléaire, de sorte que l’ADNmt aurait lui-même diminué progressivement de taille. À ce jour, il ne reste qu’un plasmide double brin de 16 à 20 kb avec un code génétique qui est en partie différent du code universel de l’ADN nucléaire. Ce dernier diffère aussi selon l’espèce (exemple: AGA et AGG sont des codons stop chez l ‘humain, sérine chez Drosophila et non des codons arginine comme sur l’ADN nucléaire). L’activité de la mitochondrie est hautement régulée par le noyau. La majorité des protéines s’y trouvant sont issues des gènes nucléaires. Cependant, l’ADN mitochondrial encode toujours 22 ARN de transfert, deux ARN ribosomaux ainsi que 13 protéines (Figure 1.2). Ces 13 protéines sont transcrites uniquement à l’intérieur de la mitochondrie par les ribosomes mitochondriaux en utilisant son propre ARN de transfert. L’ensemble de ces 13 protéines sont impliquées dans la formation de la chaîne de transport d’électrons (ETC); (Figure l.3), qui est une composante essentielle de la respiration cellulaire, un processus convertissant l’énergie contenue dans les nutriments en A TP, principale source d’énergie de la cellule (Lodish, 1997).
Une cellule peut contenir des milliers de copIes d’ADNmt selon la demande énergétique du tissu dans laqueIle eIle se trouve. On retrouve généralement de 2 à 10 copies d’ADN par mitochondrie et un nombre de mitochondries allant de 100 à 1000 par cellule (Fazzini et al., 2018). Lors de sa réplication, le taux de mutation de l’ ADNmt est environ 100 fois plus élevé que celui de l’ADN nucléaire. Ceci est dû en partie à un mécanisme de réparation moins performant que dans le noyau. Il a aussi été suggéré que l’enzyme ADN polymérase gamma, codé par le noyau, a tendance à répliquer moins fidèlement l’ADNmt en raison d’une plus grande concentration de désoxyguanosine triphosphate (un précurseur de l’ADN) présent dans la mitochondrie (Song et al., 2005). Elle intègrerait donc davantage de mauvais nucléotides. Les taux de mutations varient selon la partie du génome mitochondrial. La région de contrôle, lieu de l’origine de réplication, est connue pour avoir des régions hypervariables, dont le taux de mutation est estimé à 4.3 xI 0-3 par nucléotide par génération, tandis que le taux pour la région de contrôle au complet est estimé à 3.5 x 10-5. Ce taux diminue à 8.8 x 10-6 par nucléotide par génération pour les régions codantes (Santos et al., 2008).
Chez la plupart des espèces dont l ‘humain, la transmission de l’ ADNmt se fait uniquement par la mère, mis à part de rares cas de «fuites paternelles» (Lutz-Bonengel et al., 2019) et ne subit pas de recombinaison. Les mutations survenant dans les cellules germinales, susceptibles d’être transmises à la prochaine génération, font l’objet d’une forte sélection purifiante durant l’ovogenèse (De Fanti et al., 2017). Ce sont donc les mutations neutres ou légèrement délétères qui seraient majoritairement transmises aux descendants. Malgré tout, certaines mutations associées à des phénotypes pathologiques importants peuvent être transmises. Leur effet délétère peut par exemple s’exprimer après l’ovogenèse ou affecter peu le fitness de l’individu (une maladie n’implique pas automatiquement qu’un individu aura une plus petite descendance que la moyenne). À ce jour, on connaît plus de 600 mutations mitochondriales associées de près ou de loin avec une maladie humaine (MITOMAP: A Human Mitochondrial Genome Database. https://www.mitomap.org, 2008).
Dans la littérature, les différentes séquences d’ADNmt sont classifiées par haplogroupes selon les mutations qu’elles arborent. Un haplogroupe se définit comme un ensemble de séquences d’ ADNmt avec des polymorphismes communs conservés phylogénétiquement (Weissensteiner et al., 2016). Pour qu’une séquence soit classifiée dans un groupe particulier, elle doit présenter une liste de mutations bien précises. Pour chacune des mutations successives qui seront conservées, on retrouvera une déclinaison de la classification. Par exemple, pour l’haplogroupe H, on trouvera les sous-haplogroupes Hl, HIa et Hl b, etc. Chacun de ces sous-haplogroupes consiste en une séquence d’ADNmt unique. Nous ferons références dans ce texte au terme haplotypes pour désigner chacune des séquences uniques de l’ ADNmt et au terme haplogroupe pour désigner les groupes de séquences appartenant à la première lettre. Il y a de fortes raisons de crOIre que les polymorphismes définissant ces haplogroupes soient physiologiquement importants, car les haplogroupes mitochondriaux ont été associés à un bon nombre de maladies comme l’Alzheimer (Ridge et al., 2018), le Parkinson (Swerdlow, 2012), le diabète de type 2 (Charoute et al., 2018) et plusieurs cancers (Singh et al., 2009).
REMERCIEMENTS |