Télécharger le fichier original (Mémoire de fin d’études)
Les mécanismes de l’isolement reproductif
Etudier la spéciation revient donc en grande partie à étudier l’évolution des mécanismes de l’isolement reproductif (Coyne & Orr, 2004). Ces mécanismes sont nombreux et peuvent être classés en pré- ou post-zygotiques selon le stade de vie auquel ils interviennent (Dobzhansky, 1937).
• Isolement pré-zygotique : Les mécanismes pré-zygotiques sont ceux qui interviennent avant ou pendant la reproduction diminuant ainsi la probabilité de rencontre et de fécondation entre gamètes d’individus appartenant à des entités différentes. Parmi ces mécanismes, on peut citer le choix de l’habitat, la philopatrie (reproduction dans des lieux définis qui différent selon les entités), l’homogamie (choix préférentiel de partenaires de la même entité) ou bien encore la divergence morpho-anatomique des appareils génitaux (fréquente chez les insectes par exemple).
• Isolement post-zygotique Les mécanismes d’isolement post-zygotiques sont ceux qui s’expriment après la fécondation. Dans ce cas, l’existence de barrières d’isolement reproductif peut se traduire par la stérilité et/ou la non-viabilité des hybrides. Ces barrières peuvent être également subdivisées en fonction de leur degré de dépendance vis-à-vis de l’environnement. On parle alors de barrières extrinsèques lorsque la valeur sélective des hybrides dépend de l’environnement biotique et/ou abiotique, telles que la non viabilité écologique ou l’inadaptation comportementale. On parle de barrières intrinsèques ou endogènes quand il s’agit de problèmes indépendants des conditions environnementales qui touchent les hybrides comme la non viabilité ou la stérilité hybride.
La mise en place de barrières d’isolement reproductif est en étroite relation avec le contexte biogéographique expérimenté par les populations au cours de leur histoire. Par exemple les oscillations climatiques du Pléistocène au cours des 2,5 derniers millions d’années ont été à l’origine de profondes modifications des aires de répartitions de plusieurs espèces terrestres (Hewitt, 2000) et marines (Palumbi, 1994). Les périodes glaciaires ont notamment modifié les routes migratoires, et contraint de nombreuses espèces à migrer vers des régions refuges pour suivre leur préférendum thermique, provoquant une fragmentation de leurs aires de distribution. A l’inverse, les périodes interglaciaires (comme l’actuelle) ont favorisé l’extension des aires de répartition pour les espèces tempérées, provoquant ainsi la mise en contact de lignées glaciaires ayant survécu dans des refuges différents. Ces contacts entre lignées glaciaires d’une même espèce sont aujourd’hui visibles au niveau de zones de transition biogéographiques majeures, comme la transition Atlantico-Méditerranéenne matérialisées par le front courantologique Almeria-Oran chez certaines espèces marines (Patarnello et al., 2007). D’une manière plus générale, le contexte géographique dans lequel la spéciation se déroule peut varier en fonction de l’importance des événements biogéographiques et des adaptations écologiques qui accompagnent l’histoire évolutive des populations. Trois modes de divergence sont ainsi classiquement distingués en fonction du contexte spatial dans lequel les barrières d’isolement reproductif évoluent :
• Divergence allopatrique : la spéciation est initiée en l’absence de flux génique. Elle est le résultat de la mise en place de barrières géographiques à la migration (Mayr, 1942). En effet si deux populations se retrouvent séparées par de telles barrières, leur polymorphisme ancestral partagé va d’abord se fixer indépendamment dans chacune d’entre elles provoquant leur différentiation progressive, puis de nouvelles mutations vont se fixer de manière indépendante dans les deux populations qui continuent ainsi à diverger.
• Divergence sympatrique : elle se déroule en l’absence de barrière physique au flux génique. Ici, les individus peuvent donc se croiser librement, et les probabilités de croisement entre individus ne dépendent que de leurs génotypes (Kondrashov & Mina, 1986). Ce mécanisme nécessite l’évolution conjointe d’une adaptation locale et d’un choix d’habitat correspondant au génotype.
• Divergence parapatrique : dans ce mode de spéciation, la divergence se fait entre deux populations susceptibles d’échanger encore des migrants. Cependant les flux de gènes ne sont pas totalement libres, et la migration est donc intermédiaire entre les modes de spéciation sympatrique et allopatrique. Les différents modes de spéciation précédemment énoncés ne font pas intervenir les mêmes forces évolutives principales dans l’évolution des barrières d’isolement (Sobel et al., 2010). Lors de la divergence allopatrique, c’est la dérive génétique et éventuellement la sélection qui jouent un rôle majeur dans l’accumulation des barrières reproductives. Dans la spéciation sympatrique, c’est l’antagonisme entre la migration qui s’oppose à la différentiation et la sélection qui détermine le processus de différentiation.
1.2. Bases génétiques de l’isolement reproductif
La dépression hybride est un fait d’observation courante (Dobzhansky, 1937; Coyne & Orr, 2004). Ce fait est la manifestation d’un isolement reproductif dont les bases génétiques peuvent être expliquées génétiquement par le biais de modèles comme celui de la sous dominance ou encore le modèle des incompatibilités dites de Dobzhansky-Muller (Dobzhansky, 1937; Muller, 1942; Coyne & Orr, 2004; Presgraves, 2010). Le modèle de Dobzhansky-Muller (Figure 1) permet notamment d’expliquer comment des mutations provoquant une diminution de la valeur sélective des individus hybrides peuvent se fixer indépendamment dans les populations parentales sans entrainer d’effet délétère. Dans ce modèle, seules les nouvelles combinaisons alléliques produites par hybridation, et qui n’ont pas été soumises au filtre de la sélection lors du processus de divergence sont délétères. Ce modèle permet également d’expliquer l’observation courante d’une dépression hybride plus élevée dans les deuxièmes générations d’hybridation (Dobzhansky, 1937; Edmands, 1999) par simple effet de dominance (Turelli & Orr, 1995).
Etude de la spéciation dans les zones d’hybridation
Dans la nature, la rencontre de deux espèces partiellement isolées reproductivement se produit généralement dans une zone géographique restreinte où des hybrides sont créés par croisements interspécifiques. Ces zones intermédiaires appelées « zones de tension » sont maintenues par un équilibre entre les flux de combinaisons alléliques parentales qui arrivent par migration et la contre-sélection de certaines combinaisons hybrides qui ne sont ainsi pas ou peu exportées en dehors de la zone (Barton & Hewitt, 1985). Une zone de tension fonctionne alors comme un puits pour les génotypes hybrides (« hybrid sink », Barton, 1980). Ces zones, parfois qualifiées de laboratoires naturels pour étudier l’évolution, jouent un rôle important dans notre compréhension des mécanismes d’isolement reproductif (Barton & Hewitt, 1985). La théorie des zones d’hybridation offre une description mathématique des clines de fréquences allèliques le long d’un transect géographique passant d’une population parentale à l’autre en traversant la zone d’hybridation. L’existence d’un cline repose sur un équilibre entre deux forces antagonistes, la migration qui tend à homogénéiser les fréquences allèliques et la sélection qui tend à diminuer la fréquence des génotypes hybrides à chaque génération du fait de leur moindre valeur sélective. La forme sigmoïde des clines n’est que très peu affectée par le type de contre-sélection des combinaisons hybrides, qu’elle soit exogène (valeur sélective liée à l’environnement) ou endogène (valeur sélective liée aux interactions entre incompatibilités génétiques, (Barton & Gale, 1993; Kruuk et al., 1999). Par contre, leur largeur dépendant de l’équilibre migration-sélection, les locus les plus contre-sélectionnés montrant les clines les plus abrupts (Figure 2).
Flux génique au travers d’une zone d’hybridation
Les zones d’hybridation sont connues pour être un ralentisseur du flux génique neutre (Barton & Hewitt, 1985). Pour expliquer la stabilité géographique des zones de tension, il est prédit que les clines de gènes sous sélection viennent se caler au niveau de barrières physiques où la migration est limitée où de zones à faible densité de populations (Barton, 1979). A cet effet mécanique s’ajoute le déséquilibre de liaison entre les gènes soumis à la contre-sélection chez les hybrides, qui est responsable de l’effet puits à hybrides et vient réduire d’autant plus la densité d’individus dans les zones d’hybridation (Barton, 1980). Ces deux effets sont pris simultanément en compte pour expliquer l’impact que jouent les zones d’hybridation sur la réduction du flux génique (Barton & Bengtsson, 1986). Les zones d’hybridation peuvent également se caler au niveau de barrières environnementales, lorsque des gènes d’adaptation à l’habitat parviennent à attirer les clines endogènes dont la localisation n’est pas contrainte par l’environnement. Ce phénomène de couplage entre clines explique l’existence de nombreuses zones de tension co-localisées au niveau de zones de transition écologique comme les écotones (Bierne et al., 2011). Le flux de gènes au niveau des zones de tension affecte les différentes régions du génome de façon hétérogène. On qualifie ainsi ces barrières génétiques de barrières semi-perméables car elles agissent comme un filtre sélectif au flux génique (Harrison, 1993). Le concept de barrière semi-perméable prédit en effet des comportements différents pour trois types de locus à travers la zone d’hybridation : les locus contre-sélectionnés, les locus neutres et les locus uniformément favorables. Les locus impliqués dans l’isolement reproductif présentent des combinaisons alléliques défavorables chez les individus hybrides, qui réduisent d‘autant plus les échanges génétiques entre espèces qu’ils sont fortement contre-sélectionnés. On parle ainsi de gènes barrières au flux génique ou de gènes verrous. Les échanges aux locus neutres ne sont pas tout à fait indépendants de l’existence des gènes verrous, dont l’effet de barrière au flux génique s’étend aux marqueurs voisins en raison de la faible fréquence des événements de recombinaison. Ainsi, le flux génique aux marqueurs neutres est d’autant plus ralenti qu’ils sont fortement liés à des gènes verrous (Barton & Bengtsson, 1986; Feder & Nosil, 2010). A proximité des gènes verrous, le flux génique est donc fortement restreint voire nul, y compris pour des locus neutres, et au fur et à mesure que l’on s’en éloigne, le flux génique augmente vers son niveau génomique basal (Figure 3) qui dépend de la démographie des espèces en interaction. Sous certaines conditions, la variance de différenciation entre locus peut donc devenir très grande avec des régions complètement hermétiques aux échanges génétiques et des régions qui introgressent librement tout autour. Une telle variance favorise donc la détection des gènes localisés dans le voisinage chromosomique des locus d’isolement. Lorsque les gènes s’isolement sont très nombreux, leurs effets sélectifs cumulés peuvent suffire à réduire efficacement le flux génique sur l’ensemble du génome (Barton & Bengtsson, 1986), on parle alors de « genome hitchhiking » (Feder et al., 2012) ou de « génome congelé ». Dans ce type de situation, seuls les locus soumis à une sélection positive indépendante de l’isolement reproductif (Pialek & Barton, 1997; Bierne et al., 2002) parviennent à traverser la zone d’hybridation (Barton & Bengtsson, 1986). Cet effet peut se produire quand un allèle issu du fond génétique d’une espèce A s’avère avantageux dans le fond génétique d’une espèce B qu’il va envahir via l’intermédiaire de la formation de génotypes hybrides. La catégorie des locus qui introgressent adaptativement parviennent donc à passer le filtre sélectif des barrières semi-perméables quel que soit le degré d’isolement reproductif tant que celui-ci n’est pas complet.
Inférence démo-génétique de l’histoire du flux génique
Reconstituer l’histoire de la divergence entre espèces est une composante importante de l’étude de la spéciation, afin de déterminer quand les populations divergentes ont cessé et éventuellement recommencé à échanger des gènes. Cependant il n’est pas toujours facile d’entreprendre une telle démarche rétrospective, surtout chez de vraies espèces différenciées qui n’interagissent plus via des échanges génétiques. En effet, au cours du temps les populations peuvent être soumises à une variété de processus démographiques et migratoires. Des alternances peuvent avoir lieu entre des périodes où le flux génique est interrompu (périodes d’isolement) et d’autres périodes où les échanges génétiques entre populations sont rétablis (Feder et al., 2012; Abbott et al., 2013). Ces événements laissent néanmoins une empreinte sur le polymorphisme des génomes. Ainsi les données polymorphisme recueillies sur grand nombre de locus au sein d’une paire de populations divergentes contient des informations pouvant nous renseigner aussi bien sur les aspects temporels et démographiques de l’histoire de leur divergence. Ainsi, en comparant des modèles qui sont des représentations simplifiées mais intégrants les principales caractéristiques du processus de divergence, il est possible d’évaluer statistiquement la vraisemblance de différents scénarios alternatifs de spéciation.
Le premier modèle de divergence démographique à avoir été utilisé est celui représentant l’isolement strict entre deux populations divergentes issues d’une même population ancestrale (Figure 4a) (Wakeley & Hey, 1997). En 2001, une nouvelle méthode s’appuyant sur l’information généalogique contenue dans les données haplotypiques qui renseignent en particulier sur les patrons de coalescence a été développé par Nielsen et Wakeley (Nielsen & Wakeley, 2001) dans le but de distinguer entre un modèle d’isolement strict et un modèle d’isolement avec migration continue (modèle IM) entre deux populations divergentes (Figure 4b). L’avancée importante procurée par ce type de modèle est de permettre de distinguer les effets de la migration de ceux liés au tri incomplet du polymorphisme ancestral, essentiellement sous l’influence de la taille efficace. Le modèle IM permet donc de décomposer le flux génique en deux composantes en prenant en compte séparément les effets de la dérive et de la migration. L’implémentation de méthodes statistiques permettant d’ajuster le modèle IM à des données dans les programmes IM et IMA (Hey & Nielsen, 2007) a contribué à son application pour étudier la spéciation chez de nombreuses espèces, comme la drosophile (Herrig et al., 2014) ou encore le gobe-mouche Ficedula (Backstrom et al., 2013).
Figure 4 : Scénarios de spéciation. Quatre scénarios avec des patrons temporels de migration différents sont comparés : (A) SI, strict isolement ; (B) CM, migration continue au cours de la divergence ; (C) AM, migration ancienne et (D) SC, contact secondaire. Tsplit est le nombre de générations écoulées depuis la spéciation ; Nancestor, NA, et NB sont les tailles efficaces des populations ; TAM est le nombre de générations depuis que les deux espèces ont arrêté d’échanger des migrants ; et TSC est le nombre de générations depuis que les deux espèces échangent des migrants, après avoir été strictement isolées. Les taux de migration efficaces MA et MB sont exprimés en unités 4Nm, où M est la proportion de la population composée de migrants venant de l’autre population à chaque génération (d’après Roux et al., 2013).
Avec le développement des nouvelles méthodes de séquençage à haut débit permettant l’acquisition de jeux de données génomiques, les méthodes classiques de coalescence développées pour l’analyse de quelques gènes sont inadaptées sur le plan computationnel. De plus, certaines de ces méthodes qui se basent sur les généalogies des gènes nécessiteraient des données haplotypiques phasées qui restent difficiles à obtenir à l’échelle génomique. Les nouvelles techniques moléculaires de génotypage par séquençage telles que le séquençage de fragments RAD (Rad sequencing) produisent des milliers de marqueurs SNPs (Polymorphisme Nucléotidique Simple) aléatoirement échantillonnés dans le génome, et le plus souvent avec une densité insuffisante pour reconstituer localement des généalogies. Pour exploiter ces nouvelles données, deux types de méthodes d’inférence ont été développées. La première appelée méthode ABC pour Aproximate Bayesian Computation (Beaumont et al., 2002) compare un ensemble de statistiques résumant des jeux de données obtenus par simulations avec celles des données observées. Cette méthode est particulièrement appropriée pour la comparaison de modèles complexes dont la vraisemblance est incalculable numériquement et doit être approximée par simulation. La seconde méthode se base sur des équations de diffusion pour décrire analytiquement le polymorphisme sous un modèle de divergence donné. Dans les faits, c’est spectre joint des fréquences allèliques (ou JAFS pour joint site frequency spectrum) qui est utilisé pour décrire la façon dont le polymorphisme se réparti au sein et entre les populations, en représentant le nombre de copies d’allèles dérivés en fonction de leur fréquence dans chacune des deux populations. Cette méthode, proposée et implémentée dans le programme δaδi par Gutenkunst et al.,(2009), permet donc d’ajuster des spectres joints théoriques à celui observé en maximisant la vraisemblance d’un modèle de divergence démographique. De plus, sa flexibilité permet le calcul de la vraisemblance de modèles de divergence plus complexes que le modèle IM (Tine et al., 2014; Le Moan et al., 2016). Grace à ces avancées méthodologiques, de nouveaux scenarios de divergence se rapprochant encore plus de la réalité peuvent être comparés à ceux d’un isolement strict et d’une divergence avec migration continue. Ainsi, des situations où une partie de la divergence entre populations se fait en présence de flux génique et l’autre en allopatrie peuvent être évaluées, comme la migration ancienne (le flux génique post divergence suivi d’un isolement allopatrique) (Figure 4c) ou le contact secondaire (isolement allopatrique suivi par une reprise des échanges génétiques) (Figure 4d).
Table des matières
Introduction
1. Spéciation et notion d’espèce :
1.1. Les mécanismes de l’isolement reproductif
2. Etude de la spéciation dans les zones d’hybridation
2.1. Flux génique au travers d’une zone d’hybridation
2.2. Inférence démo-génétique de l’histoire du flux génique
3 Génomique de la spéciation
4 Originalité des organismes marins et modèle d’étude
5 Objectifs de la thèse
Chapitre I : Hybridation introgressive et transgression morphologique dans la zone de contact de deux espèces méditerranéennes du genre Solea
1 Introduction
2 Article: Introgressive hybridization and morphological transgression in the contact zone between two Mediterranean Solea species
2.1. Introduction
2.2. Materials and Methods
2.3. Results
2.4. Discussion
Chapitre II : Acquisition d’un jeu de données de SNPs haute densité
1. Echantillonnage, Construction des librairies RAD et Séquençage
1.1. Echantillonnage
1.2. Construction des librairies et séquençage
2. Préparation des données et analyses bio-informatiques
3. Analyse descriptive du polymorphisme
4. Résultats
4.1. Obtention du jeu de données final
4.2. Distribution de la variabilité génétique
5. Discussion
Chapitre III : Histoire du flux génique et signature génomique des échanges génétiques à travers la zone d’hybridation semi-perméable
Introduction
1. Analyses démo-génétiques
1.1. Spectre joint des fréquences allèliques
1.2. δaδi et ajustement des modèles démographiques
2 Clines génomiques
3 Clines géographiques
4 Résultats
4.1. Ajustement du meilleur modèle démo-génétique de divergence
4.2. Probabilité de l’introgression
4.3. Clines génomiques
4.4. Géographie de l’introgression
4.5. Analyse comparative de l’introgression
5 Discussion
Conclusion
Bibliographie