La structure des acides nucléiques

Les acides nucléiques sont des molécules biologiques au cœur des mécanismes de la vie, situées dans les cellules des organismes procaryotes et eucaryotes ainsi que dans les capsides des virus. L’acide désoxyribonucléique (ADN) est le support de l’information génétique utilisée pour le développement, le fonctionnement et la reproduction des êtres vivants. L’acide ribonucléique (ARN) participe à l’expression de cette information, c’est-à-dire à la construction de protéines à partir du modèle codé dans l’ADN. Certains virus, cependant, ne possèdent pas d’ADN et stockent leur matériel génétique directement sous forme d’ARN. Connaître précisément la structure de ces molécules est indispensable pour comprendre leur fonctionnement, et lutter contre les maladies génétiques ou le développement de virus comme le VIH. Or, les acides nucléiques présentent une grande variété structurelle. Leur composition chimique ainsi que leur formule développée sont bien identifiées et seront présentées en soussection 1.1. Toutefois, leur structure tridimensionnelle, i.e. l’arrangement et le positionnement des atomes dans l’espace, est moins complètement déterminée. Elle est l’objet d’une diversité significative énoncée en sous-section 1.2. Quoique largement étudiée avec différentes méthodes prometteuses, la détermination de la structure 3D des acides nucléiques présente toujours des enjeux, qui seront discutés en sous-section 1.3. 

Briques élémentaires des acides nucléiques

Les acides nucléiques sont des polymères, c’est-à-dire de longues chaînes moléculaires constituées par la répétition de nombreuses sous-unités appelées nucléotides. La plus longue molécule d’ADN du corps humain en contient environ 220 millions (Gregory et al. 2006), pour une longueur rectiligne supérieure à 7 cm. Chaque nucléotide se compose de trois parties : un phosphate P O 3− 4 , un sucre à cinq atomes de carbone C5H10O5 (pentose) lié au phosphate par une liaison ester, et une base azotée liée au sucre par une liaison glycosidique (Figure 1.1a). L’ADN diffère de l’ARN par l’absence d’un atome d’oxygène en liaison avec le carbone C2 0 du sucre, qui lui vaut le préfixe « désoxy ». Les bases azotées sont les éléments fondamentaux du code génétique. Elles existent dans l’ADN sous quatre formes différentes : l’Adénine (A), la Guanine (G), la Cytosine (C) et la Thymine (T). On les retrouve également dans l’ARN, à l’exception de la Thymine qui est remplacée par l’Uracile (U). C’est l’ordre d’enchaînement de ces bases, ou séquence, qui code l’information génétique. C’est pourquoi elles sont souvent qualifiées de « briques élémentaires » des acides nucléiques. Les bases de l’ADN sont regroupées en « paquets », les gènes, chacun spécialisé dans le codage d’une ou plusieurs protéines. Chez les eucaryotes, les gènes sont en grande partie constitués d’introns, des séquences d’ADN ne codant généralement pas de protéine mais utilisées pour la régulation, l’organisation et la maintenance du génome. L’enchaînement des nucléotides de l’ADN et de l’ARN se produit par l’intermédiaire des phosphates, qui forment une liaison ester avec le carbone C3 0 d’un sucre et une autre liaison ester avec le carbone C5 0 du sucre suivant (liaison phosphodiester). Cela constitue la chaîne sucrephosphate, aussi appelée squelette de la molécule, sur laquelle les bases azotées sont accrochées. The equivalent representation of deoxypolynucleotides differs only by the absence of the 2¿-OH groups and the replacement of U by T. (b) Figure 1.1. Formule développée des acides nucléiques : (a) nucléotides d’ARN (ribonucléotide) et d’ADN (désoxyribonucléotide) et (b) exemple d’une chaîne d’ARN de séquence AUCG (ou d’une chaîne d’ADN de séquence ATCG avec les informations entre parenthèses). Schémas de Voet et Voet (2011). respectivement, C3 0 ne sont liés à aucun nucléotide. Par convention, on écrit un acide nucléique dans le sens 5 0 −→ 3 0 . La Figure 1.1b représente un exemple d’enchaînement des quatre bases A, U (T pour l’ADN), C et G. Les phosphates sont à l’origine de l’acidité du squelette, ainsi que de sa charge négative. L’expression des gènes, autrement dit la construction de protéines à partir de « morceaux de séquence d’ADN », est généralement décrite chez les procaryotes et les eucaryotes par une procédure schématique appelée le dogme central. Une enzyme, l’ARN polymérase, reconnaît le début 6 Chapitre 1. La modélisation des acides nucléiques du gène, le promoteur, et se fixe dessus. Elle parcourt ensuite le gène et fabrique l’ARN dit messager : cette étape est appelée la transcription. L’ARN messager transporte alors l’information génétique jusqu’au ribosome, un important complexe d’ARN (dit ribosomique) et de protéines. Le ribosome parcourt l’ARN messager, et une protéine est construite par l’enchaînement d’acides aminés apportés par l’ARN de transfert : c’est la traduction. 1.2 Structure tridimensionnelle La structure tridimensionnelle, ou conformation, est l’arrangement et le positionnement des atomes dans l’espace tridimensionnel. Elle présente, dans le cas des acides nucléiques, une telle diversité qu’il est encore difficile de la caractériser entièrement. Elle varie notamment en fonction de la séquence de la molécule et des contraintes qui lui sont imposées par son environnement physico-chimique. 

Structure 3D de l’ADN Double-hélice

(c) Figure 1.2. Double-hélice d'ADN-B. (a) Représentation de van der Waals, image de Goodsell (1992). (b) Appariement G-C en représentation boule-bâton, schéma de Voet et Voet (2011). (c) Représentation en ruban, image de Neidle (2008). (c) Représentation en ruban, image de Neidle (2008). deux brins sont antiparallèles : ils évoluent en sens opposés, et l’extrémité 3 0 de l’un est en face de l’extrémité 5 0 de l’autre. Ils diffèrent par une symétrie pseudo-dyadique : le squelette de l’un 1. La structure des acides nucléiques 7 peut être obtenu à partir de celui de l’autre par une rotation de 180 degrés autour d’un axe (judicieusement choisi) perpendiculaire à l’axe des hélices. Enfin, ils sont accrochés entre eux par des liaisons hydrogène entre leurs bases azotées. Les bases A et T s’apparient en formant deux liaisons hydrogène, et les bases C et G font de même avec trois liaisons hydrogène. Les paires de bases ainsi constituées sont presque planes et perpendiculaires à l’axe des hélices. Elles sont empilées les unes sur les autres avec un décalage angulaire quasi constant d’environ 36 degrés. La double-hélice possède deux sillons extérieurs qui s’enroulent entre les chaînes sucrephosphates. Ces sillons sont de tailles inégales : le petit sillon correspond aux bords des paires de bases où le carbone C1 0 ressort, tandis que le grand sillon correspond au bord opposé (Figure 1.2b). Pour visualiser plus facilement la structure de cette double-hélice, il est courant de représenter le squelette sucre-phosphate par un ruban qui décrit sa trajectoire et les sucres et bases par des blocs (Figure 1.2c). Cependant, l’ADN-B n’est pas la seule structure en double-hélice. Il en existe d’autres, comme l’ADN-A qui présente une différence de taille plus marquée entre les sillons, et des paires de bases inclinées de 19 degrés par rapport au plan perpendiculaire à l’axe des hélices. Un autre exemple, l’ADN-Z, fait intervenir des hélices gauches avec des sillons de tailles équivalentes. 

