Variabilité naturelle des mucilages des graines de
Brassicaceae
L’évolution, un mécanisme complexe à la découverte précoce
L’évolution est le nom attribué au mécanisme responsable de la diversité et de la complexité du monde vivant que l’on peut apprécier chaque jour sur la Terre. La vie est tellement vaste et merveilleuse qu’elle a longtemps été dépeinte comme étant d’origine divine. Pourtant, depuis le XIXème siècle nous savons que l’ensemble de cette diversité est le résultat d’une diversification progressive des êtres vivants à partir d’un ancêtre commun unique. Cette diversification repose sur le mécanisme de sélection naturelle qui favorise les individus les plus adaptés à leur environnement génération après génération. C’est avec l’application de plus en plus rigoureuse de la méthode scientifique que des similarités morphologiques ont pu être observées, reportées, et mises en relation afin de commencer à réfléchir aux mécanismes sous-jacents à l’évolution. En effet, la morphologie étant le paramètre le plus facilement accessible, c’est grâce aux observations macroscopiques que ce mécanisme a pu être compris et publié pour la première fois en 1859 par Charles Darwin dans L’origine des espèces (Darwin, 1859). Résumé simplement, si deux organismes partagent le même trait morphologique, ils l’ont donc probablement hérité de leur ancêtre commun. En revanche, s’ils ont une spécificité, elle doit répondre à une contrainte présente dans leur environnement. Il est toujours étonnant de constater a posteriori à quel point les Hommes sont doués pour comprendre et décrire un mécanisme dans son ensemble, quand bien même il manque une information clef pour confirmer l’hypothèse. L’information manquante dans le cas de Darwin était l’existence et le rôle du code génétique, puisque à son époque les recherches sur l’hérédité étaient encore balbutiantes (bien que Mendel y travaillait déjà dans l’ombre) et que l’existence des chromosomes et leur lien avec l’hérédité n’ont eu de réel succès qu’au début du XXème siècle. Il est d’ailleurs fascinant de mettre en perspective L’origine des espèces de Darwin avec Le gène égoïste de Dawkins (Dawkins 1976) pour prendre conscience à quel point la connaissance de la biologie moléculaire peut changer notre perception d’un même mécanisme. C’est bien le même mécanisme qui est décrit dans les deux ouvrages, mais l’unité de base sur lequel ce mécanisme s’exerce change. Dawkins propose de penser le gène comme unité de l’évolution, ce qui a pour conséquence de considérer les individus (unité de l’évolution de Darwin) comme de « simples » machines à survie au service des gènes.
La progression de la compréhension du matériau de base de l’évolution
Pour étudier l’évolution, la morphologie se révèle souvent peu digne de confiance, car elle ne reflète pas toujours clairement les relations de parenté entre les espèces. C’est particulièrement vrai en cas d’apparitions indépendantes de morphologies qui se ressemblent car elles ont convergé vers la même fonction en réponse à des contraintes similaires. Ces phénomènes de convergence évolutive sont induits par l’exposition longue à une même contrainte environnementale forte qui va provoquer une adaptation similaire chez des espèces pourtant bien différentes à l’origine. Un exemple frappant dans le monde végétal est l’adaptation aux milieux chauds et arides de certaines espèces de Cactaceae sur le continent Américain et d’Euphorbiaceae et Aizoaceae (entre autre) sur le continent Africain que l’on confond bien souvent du fait de leur ressemblance morphologique (Alvarado-Cárdenas et al., 2013) (Figure 1). Or, si les adaptations convergentes ont des origines différentes elles auront aussi des bases génétiques différentes. L’avènement de la génétique a donc permis de déjouer ces pièges pour un établissement plus exact de la phylogénie du vivant. Les arbres de parenté ainsi basés sur la similarité des séquences génomiques (arbres phylogénétiques) ont donc permis de se rapprocher de plus en plus des réelles histoires évolutives. Deux modalités sont alors possibles pour la construction d’arbre phylogénétique. La première utilisera un mélange de séquences génétiques présentes chez toutes les espèces à étudier. Les internal transcribed spacers (ITS) ont longtemps été utilisés pour leur conservation (en présence et en séquence) dans le vivant permettant de se faire une assez bonne idée de l’apparentement entre les espèces sans avoir besoin de séquencer une grande portion du génome (Baldwin et al., 1995). La deuxième possibilité consiste à reconstruire la phylogénie d’une famille de gènes provenant d’une ou plusieurs espèces. Cette approche permet d’appréhender l’évolution de la famille de ce gène au cours du temps, et éventuellement à travers les espèces mais ne suivra pas forcement la phylogénie des espèces à cause de divergence propre à ce gène. Dans le premier cas ce sera donc des noms d’espèces qui seront en feuilles de l’arbre alors que dans le deuxième ce seront des noms de gènes. Cette dualité fait écho avec les deux natures d’unité de l’évolution évoquées précédemment.
Une disponibilité de données grandissante, en types comme en nombre
L’innovation technologique constante du XXIème siècle et la diminution des coûts de séquençage ont permis de faciliter progressivement l’obtention des données génomiques. En conséquence, de plus en plus d’espèces ont des données génomiques disponibles et elles deviennent de plus en plus exploitables grâce au progrès des séquenceurs mais aussi du traitement informatique de cette colossale masse d’informations. Concernant l’étude de l’évolution, le traitement de ces données par des logiciels appropriés, peut permettre de construire des phylogénies d’espèces plus précises en utilisant un grand nombre de gènes simultanément pour compenser leurs divergences évolutives intrinsèques (Nikolov et al., 2019). Ces banques de données permettent aussi de mettre en regard les données génétiques disponibles avec des données phénotypiques déjà publiées pour retracer l’évolution d’un réseau de 11 gènes et du trait qu’il contrôle à très grande échelle phylogénétique (Radhakrishnan et al., 2020). Ce genre d’approche tire parti des données d’expression des gènes (transcriptomique) et/ou de leur traduction (protéomique) car elles permettent de s’approcher de la réalité spatiotemporelle des traits que l’on souhaite étudier. Dans un même organisme l’expression sera dépendante de l’organe, des tissus ou même du type cellulaire étudié, et sera de plus variable en fonction des conditions environnementales (Zhang et al., 2017). De plus, une simple modification post traductionnelle d’une protéine peut complètement modifier sa fonction biologique (Li et al., 2018). Le croisement de tous ces niveaux d’informations rend donc les analyses plus complexes mais plus puissantes. Le principal défaut de cette ressource génomique vient de sa nature même. Comme l’information est colossale, elle est traitée informatiquement afin d’automatiser le plus de tâches possibles. Des erreurs se glissent lors de ces processus informatiques et, malgré les multiples innovations dans la correction automatiques d’erreurs, certaines peuvent persister (Laehnemann et al., 2016). De plus, l’automatisation est dépendante de nos connaissances actuelles sur la structure et le fonctionnement génomique. Pour prendre un exemple récent, des ARN considérés jusqu’à présent comme non codant se sont révélés être codants pour des peptides aux effets biologiques importants (Ren et al., 2021). L’annotation et les prédictions de la traduction de ces ARN devraient donc être mises à jour pour tous les organismes déjà séquencés. En plus d’être colossale, l’information est asymétriquement accessible à cause de limitations techniques. Par exemple, certaines zones des chromosomes sont beaucoup plus difficiles à séquencer que d’autres comme l’attestent les efforts déployés pour obtenir les quelques pourcents encore inconnus ou erronés du génome humain, 20 ans après la publication de sa première version (Nurk et al., 2021).
RESUME |