Ligands de structures G-quadruplex d’acides nucléiques
Les G-quadruplex d’acides nucléiques
Généralités
Les nucléotides sont les briques constitutives du génome. Fondations des acides nucléiques du vivant que sont l’Acide DésoxyriboNucléique (ADN) et de l’Acide RiboNucléique (ARN), ils sont constitués d’un sucre de type ribose ou 2- désoxyribose, d’un groupement phosphate et d’une base azotée. La structure des principales bases constitutives de l’ADN et de l’ARN ainsi qu’un enchaînement de plusieurs nucléotides formant un brin d’ADN sont présentés sur la Figure 1. La liaison entre nucléotides est une liaison phosphodiester, elle se fait entre le groupement hydroxyle en 3’ d’un nucléotide et le groupement hydroxyle en 5’ du suivant. Une séquence d’ADN se lit de l’extrémité 5’-OH libre vers l’extrémité 3’-OH libre. Les interactions entre les différents nucléotides permettent la structuration des brins. La structure la plus connue est celle de l’ADN double brin permise par les interactions de type liaisons hydrogènes entre les nucléotides deux à deux. Ces liaisons hydrogène se font par appariement sur la face appelée Watson-Crick (en violet sur la Figure 1) 1 . Le Prix Nobel de médecine1 qui a été attribué en 1962 à ces auteurs, sur la base des travaux de Rosalind Franklin a marqué l’importance de cette structure. Ces appariements dits canoniques concernent les interactions entre les bases adénine (A) et thymine (T), cytosine (C) et guanine (G), deux à deux de type A=T et C≡G. L’appariement en double brin d’ADN n’est pas le seul existant cependant. Des appariements de plusieurs types sont connus également, entre des bases non canoniques par exemple ou suivant une face différente de la face WatsonCrick, qui permettent des structurations différentes indispensables au bon fonctionnement d’un organisme vivant. Ce sont ces dernières qui vont nous intéresser plus particulièrement. Figure 1 : a. Représentation des cinq principales bases nucléiques. Représentation d’un enchaînement de trois nucléotides dans un brin d’ADN .En effet, les travaux présentés ci-après portent sur des structures d’acides nucléiques constitués d’assemblages à quatre brins d’ADN ou d’ARN que l’on appelle des G-quadruplex (G4s). On les appelle ainsi car ces assemblages supramoléculaires se forment grâce aux guanines qui interagissent via des liaisons hydrogènes par leur face Hoogsteen2 (en rose sur la Figure 2a) et non pas Watson-Crick (en violet sur la Figure 2a) pour former ce que l’on appelle un plateau (quartet en anglais) de quatre guanines. On parle aussi de tétrade de guanines. Ces plateaux peuvent se superposer par deux ou par trois par exemple grâce à des interactions de π-stacking entre les surfaces aromatiques des guanines et former un assemblage supramoléculaire (Figure 2b). Au centre de ces structures on retrouve des ions cationiques monovalents, potassium ou sodium, qui stabilisent encore davantage l’ensemble.
Topologie des G4s
Les G4s sont des structures qui présentent un certain polymorphisme illustré sur la Figure 33 . Cette variation de topologie implique plusieurs aspects. On peut citer notamment l’orientation relative des brins impliqués. Par exemple, si tous les brins sont orientés dans le même sens, on parlera d’un G4 parallèle. Si les brins sont orientés dans le même sens que deux à deux, on parlera de G4 antiparallèle. Enfin, si une structure dite 3+1 présente trois brins de même sens et un brin de sens opposé, on parlera de G4 hybride. Il existe des G4s inter et intramoléculaires. La position relative des bases au sein de l’assemblage par rapport aux sucres est également un facteur de polymorphisme. En effet selon que Figure 2 : a. Structure d’un plateau de guanines b. Une représentation schématique d’un quadruplex formé par l’empilement de trois plateaux. c. Vue supérieure d’un G4 télomérique (PDB : 1KF1) dont la structure, déterminée par rayons X, est parallèle. d. vues latérales d’une autre structure G4 (PDB : 2JPZ) dont la structure a été déterminée par RMN. Les G sont en violet, les A sont rose, les T sont orange. a. c. d. b. CHAPITRE 1 Introduction Bibliographique 7 les bases sont placées en position syn ou en position anti, le G4 aura une géométrie différente. On peut également s’intéresser au nombre de nucléotides qui composent les boucles ou encore aux différentes boucles possibles entre les brins etc. 4,5 Ainsi des boucles externes (en forme d’hélice) relieront entre eux des brins parallèles tandis que des boucles latérales relieront des brins d’orientation antiparallèles. Les boucles diagonales relient deux brins d’orientation opposées mais diamétralement opposés l’un par rapport à l’autre. Il est intéressant de noter que la taille des boucles a une incidence sur la stabilité et la cinétique de formation des G4s 6–8 .
Dispersion des G4s dans le génome
Des assemblages de guanine sont connus depuis les années 609 . On les a observés une première fois dans une solution tampon contenant un gel de guanosine 5’-monophosphate. Par la suite, il sera mis en évidence que des assemblages à 4 brins peuvent également se former dans un ADN monobrin contenant des régions à forte proportion de guanine10 en conditions physiologiques.Des séquences riches en guanines existent au sein du génome humain au niveau des chaînes lourdes des immunoglobulines10,11 , de l’ADN ribosomal12 ou encore des télomères13,14 . Bien qu’il s’agisse de structures dynamiques au sein du vivant, ces G4s peuvent s’avérer être également des structures extrêmement stables15 . Leur dynamisme in vivo est régulé par des protéines15 . Des études bio-informatiques montrent qu’il existe chez l’Homme plus de 350 000 séquences susceptibles de former des G4s in vivo 16–18 .On peut également remarquer la prévalence de G4s potentiels dans certaines zones bien précises du génome, au niveau des télomères bien sûr mais également au niveau des promoteurs de certains gènes, ce qui Figure 3 : Illustration du polymorphisme des G4. Adaptée de Kaushnik et al. suggère que les G4s peuvent jouer un rôle à différentes étapes de la transcription de ces gènes19–21 . Les séquences contenant des G4s sont également très largement conservées dans le vivant aussi bien chez les procaryotes que chez les eucaryotes, ce qui confirme leur importance pour certaines fonctions biologiques20,22–24 . Pour réaliser ces fonctions au niveau de l’ADN, les G4s doivent pouvoir se former. Cependant, pour que cela se produise, l’ADN doit se trouver sous la forme simple brin, ce qui ne se produit qu’à certaines occasions particulières (réplication, transcription). La plupart du temps, l’ADN est condensé pour pouvoir être contenu dans une cellule procaryote ou dans le noyau des cellules eucaryotes. Cette structure condensée porte un nom, Il s’agit de la chromatine. L’élément constitutif de la chromatine est appelé nucléosome, qui est lui-même formé par un assemblage de huit histones. Une histone est une protéine autour de laquelle s’enroule la molécule d’ADN, lui donnant ainsi un aspect dit en collier de perles. Il existe deux types de chromatine durant l’interphase cellulaire. On parle d’hétérochromatine lorsque celle-ci est extrêmement condensée et d’euchromatine lorsqu’elle l’est peu. L’hétérochromatine, en effet, contient peu de régions transcrites, majoritairement des séquences répétées ayant un rôle structural comme les centromères ou les télomères. L’euchromatine, en revanche, est relativement accessible à la machinerie cellulaire de transcription lors de l’interphase. Elle contient la majorité des gènes transcrits. Ce n’est que lorsque l’ADN est sous sa forme monocaténaire qu’il est susceptible de former ou non des G4s, ce qui renforce l’idée d’un rôle transcriptionnel de ces structures. En résumé, les G4s sont des structures dynamiques qui se forment dans des régions du génome riches en guanine comme par exemple les régions des promoteurs ou les télomères. Du fait de leur localisation non aléatoire et de la forte conservation des séquences contenant des G4s, il est supposé une pression de conservations de ces assemblages aussi bien que des rôles majeurs dans plusieurs fonctions biologiques, notamment durant la transcription ou la division cellulaire25 . I. 2. Rôles des G4s dans le vivant chez l’Homme et les pathogènes non viraux Dans cette partie nous aborderons les différents rôles attribués aux G4s depuis leur découverte au sein du vivant chez l’Homme et chez les micro-organismes non viraux. La partie II sera tout particulièrement dédiée aux cas des virus.
Chez l’Homme
Les télomères Les télomères sont des complexes nucléoprotéiques qui contiennent des séquences répétées non codantes d’ADN qui se situent en fin de chromosome. Chez les eucaryotes cette séquence est (TTAGGG)n. Ils servent à la protection de la molécule d’ADN dans la mesure où l’ADN polymérase, responsable de la synthèse d’une nouvelle molécule d’ADN lors de la division cellulaire, est incapable de copier la fin de la séquence dupliquée26 . Ce sont donc les télomères situés en fin de chromosome qui diminuent à chaque réplication cellulaire et non pas les régions codantes, pour éviter une perte de l’information génétique et donc la mort cellulaire. Une cellule humaine en culture in vitro peut se diviser en moyenne 50 fois avant d’entrer en phase de sénescence27 . Ce nombre de division limite est appelé limite de Hayflick et est directement corrélé à la longueur des télomères. Nous l’avons abordé plus haut, les séquences télomériques sont des séquences riches en guanine qui peuvent former des G4s 28 . La capacité des régions télomériques à former des G4s est hautement conservée dans le vivant ce qui suggère un rôle participatif de ces structures au bon fonctionnement des télomères29. Leur extrémité, qui est linéaire et monobrin du fait de la réplication incomplète des chromosomes, peut se structurer de sorte à recouvrir l’extrémité du télomère. On appelle cette structure le G-overhang29–31 (Figure 429). Cette structure particulière joue un rôle protecteur des télomères en permettant la formation de la T-loop (Telomere Loop) en fin de séquence télomérique32 . Cette boucle protège le télomère de la dégradation par les enzymes de réparation de l’ADN qui pourrait confondre la terminaison simple brin avec une cassure de l’ADN. Elle se forme par insertion de la portion simple brin du télomère dans la boucle de réplication, la D-loop33 . L’extrémité simple brin sert également de substrat à la télomérase. La télomérase est une ADN polymérase ARN dépendante. Elle est composée de deux sous-unités, une sous-unité à activité polymérase que l’on appelle la sous-unité TERT (TElomerase Reverse Transcriptase) et une sous-unité portant le motif ARN qui sert de template à la synthèse de l’ADN télomérique. Son rôle est d’allonger les séquences télomériques pour pallier leur raccourcissement. Son activité est généralement très faible dans les cellules somatiques dans lesquelles la région codant pour la sous-unité TERT est placée sous haute régulation transcriptionnelle34 . La télomérase est inhibée par les G4s. En effet, elle doit trouver l’extrémité 3’-OH du chromosome pour commencer à polymériser l’ADN. Si cette extrémité est masquée de par le repliement en G4 du simple-brin télomérique, elle ne sera pas accessible et l’allongement du télomère n’aura pas lieu. Par contre, il est intéressant de constater que des G4s peuvent avoir aussi un effet positif sur la télomérase . Le repliement en G4 du brin d’ADN neosynthétisé au sein du complexe de la télomérase active joue un rôle positif sur son efficacité à polymériser. Il est à noter qu’il existe des TERRA, des ARN télomériques, qui peuvent jouer un rôle stabilisant au sein des structures télomériques, comme par exemple la T-loop. Figure 4 : À gauche, une représentation de la T-loop qui se forme par intercalation du G overhang, lui-même pouvant se structurer en G4. Est également montré la participation potentielle d’un ARN télomérique (en vert) à la stabilisation des G4s. À droite, un cliché du phénomène observé en microscopie électronique dans une lignée de cellules HeLa. Schéma de Bryan et al., 202029 . D-loop T-loop TERRA
Les G4s impliqués dans les phénomènes de transcription et traduction
Les promoteurs de gènes sont des séquences précises qui se situent en amont de la séquence codante d’un gène. C’est cette région qui est reconnue par l’ARN polymérase. Elle contient des séquences régulatrices qui permettent de contrôler le taux d’expression des gènes et après les télomères, ce sont les zones du génome les plus enrichies en G4s. En effet, près de 40% des promoteurs de gènes contiennent au moins une séquence susceptible de former un G419 . Il est intéressant de remarquer que la plupart des promoteurs de proto-oncogènes19,37 possèdent des zones riches en guanines capables de former des G4s alors qu’au niveau des promoteurs des gènes suppresseurs de tumeurs la probabilité de trouver des séquences riches en guanines est très faible20. Des G4s ont été identifiés dans les séquences de certains de ces gènes in vitro38 . Le premier G4 à avoir été démontré comme ayant une activité de régulation sur l’expression des gènes a été identifié au niveau du promoteur de l’oncogène c-myc, responsable de la régulation positive de la transcription de nombreux gènes impliqués dans la réplication cellulaire et donc le cancer37,39 . Si la séquence promotrice présente un G4 structuré, elle devient inaccessible à la machinerie de transcription. Cela suggère un rôle des G4s dans la régulation de l’expression des gènes (Figure 5). On retrouve un enrichissement en G4s dans le 1e intron de certains gènes en aval de leur site de début de transcription, mais cette fois ci sur le brin non transcrit. La formation d’un G4 à cet endroit induit une pause de l’ARN polymérase II, qui est responsable de 90% de la transcription des gènes. Ainsi les G4s auraient un rôle supplémentaire dans la régulation de l’expression des gènes (Figure 6). Figure 5 : Impact de la présence d’un G4 structuré sur l’étape de transcription. Figure 6 : Région riche en G du brin non transcrit qui forme une G-loop. CHAPITRE 1 Introduction Bibliographique 11 La présence de séquences de G4s dans le brin non transcrit implique leur présence également au sein de l’ARNm résultant. Cela suggère la possibilité d’un rôle des G4s lors de l’étape de traduction. I. 2. i. c. Les G4s dans la réplication, réparation et recombinaison La réplication de l’ADN est un phénomène hautement régulé. C’est un processus qui s’effectue lors de la division cellulaire et qui consiste en la duplication de la totalité de l’ADN contenu dans la cellule. Cette réplication est initiée à plusieurs endroits différents au sein du génome que l’on appelle origine de réplication (ORI). C’est à l’ORI que s’effectue l’ouverture de la double hélice d’ADN permettant la copie par la polymérase. Des séquences potentielles de G4s ont été identifiées près de certaines ORI, ce qui suggère que les premières étapes de la réplication pourraient être régulées par la formation de ces G4s40,41 . Lors de la réplication, les brins d’ADN se retrouvent un certain temps sous la forme simple brin, rendant possible la formation de G4s. Ces G4s sont des obstacles potentiels à la progression de l’ADN polymérase. Heureusement, il existe des hélicases particulières pouvant déplier les G4s et permettant d’éviter une perte d’information lors de la réplication du fait de l’arrêt des ADN polymérases42 . Ces zones sont donc à risque de forte instabilité génomique. En effet la présence de G4s au niveau des télomères, des centrosomes ou des ORI peut induire un phénomène de translocation43 qui est normalement inhibé par la présence d’hélicases. Le phénomène de recombinaison permet l’échange de brins d’ADN entre deux brins possédant des séquences similaires. Il intervient aussi au niveau des échanges de séquences des chaînes lourdes des immunoglobulines44,45 . Des séquences de G4 ont été identifiées dans le voisinage de zones sujettes à la recombinaison, ce qui indique que les structures G4s pourraient jouer un rôle de signalisation dans ce phénomène46 .
Les quadruplex d’ARN chez l’Homme Jusqu’à présent nous n’avons abordé que les G4s d’ADN chez l’Homme. Cependant il est à noter que des G4s d’ARN existent également. Bien que cela ne soit pas détaillé, il est cependant important de mentionner quelques propriétés et rôles de ces G4s lorsque ceux-ci diffèrent de ceux de G4s d’ADN. Comme souligné plus haut, pour que les G4s puissent se former, il faut que l’acide nucléique soit sous forme simple brin. Pour l’ADN cela implique une rupture des liaisons Watson-Crick au profit de la formation des liaisons Hoosgteen. Cependant, l’ARN est quant à lui déjà sous une forme simple brin et des G4s peuvent également s’y former. Il a même été montré que les G4s d’ARN étaient plus stables que les G4s d’ADN47,48, du fait de la présence de ribose à la place du désoxyribose47,48 . Certains ARNs contiennent donc des séquences potentielles de G4s. Par exemple, il a été déterminé par séquençage bio-informatique qu’il existerait près de 3000 séquences potentielles de G4s dans les régions 5’UTRs des ARNm (UTR : UnTranslated Region), des régions non traduites qui participent à la régulation post-transcriptionnelle des gènes . La présence de G4 dans la région 5’UTR inhibe la traduction. On peut citer le rôle de G4s dans la traduction des ARNm, des modifications post-transcriptionnelles de ces ARNm ou encore le maintien de l’homéostasie des télomères. Les différentes fonctions des G4s d’ARN sont documentées dans plusieurs revues . En conclusion de cette partie, les G4s sont des structures extrêmement intéressantes à étudier dans la mesure où leurs fonctions dans le génome sont très diverses et bien que déjà documentées, de nombreux mécanismes de fonctionnement restent inconnus. De cette importance dans nombre de fonctions biologiques, il parait évident que ces structures pourraient tout aussi bien être impliquées dans des mécanismes délétères amenant à un phénotype pathogène. Comprendre le fonctionnement des G4s peut aider à mieux s’en servir comme cible thérapeutique et cela sera abordé dans la partie I. 3 pour l’Homme et les micro-organismes, et dans la partie II. 1 pour le cas particulier des virus.
Rôles des G4s chez les micro-organismes non viraux
On ne s’intéresse que depuis récemment aux différents G4s existants chez les micro-organismes. Si certains de leurs rôles peuvent être similaires à ceux trouvés chez l’Homme, il existe d’autres intérêts évolutifs des G4s chez ces pathogènes qui seront abordés ci-dessous54 . Tout comme pour l’Homme, des analyses bio-informatiques ont été menées afin d’identifier la présence de structures potentielles de G4s chez les pathogènes22. Il s’avère que, tout comme pour l’Homme, leur distribution au sein du génome n’est pas aléatoire. Il s’agit de séquences hautement conservées22–24 qui seraient de plus associées à la virulence de ces pathogènes55–57 . Figure 7 : Les différents rôles des G4s chez les micro-organismes. Qu’ils soient conservés ou non au fur et à mesure de l’évolution, ces structures sont impliquées dans leur évolution et introduisent de la variabilité au sein des espèces via différents mécanismes. Figure issue de Saranathan et Vivekanandan, 201956 . La Figure 7 résume les différents rôles des G4s chez les micro-organismes. Dans la suite de cette partie nous n’aborderons que les pathogènes non viraux, les G4s viraux étant développés dans la partie II. I. 2.
Fonctions des G4s chez les pathogènes
Les recherches des G4s dans le génome des pathogènes mettent en évidence que ceux-ci, lorsqu’ils existent, se concentrent au niveau des séquences régulatrices. Les séquences de G4s sont importantes chez les micro-organismes dans la régulation de l’expression des gènes lors de la transcription58–60 . Leur stabilisation affecte la transcription61 . Chez les bactéries, il a été mis en évidence in vitro que le contrôle de la terminaison de la transcription est potentiellement régulé par la formation d’un G4 hybride intermoléculaire entre de l’ADN et de l’ARN62 . Chez d’autres bactéries encore, les G4s sont impliqués dans le métabolisme de l’azote de ces mêmes bactéries, et leur stabilisation par un ligand de G4s empêche l’expression des gènes nécessaires au bon développement de la bactérie en milieu azoté .
Les G4s et la variation antigénique.
Le phénomène de recombinaison sert un intérêt tout particulier chez certains microorganismes. Chez les bactéries par exemple, ou certains parasites, le recours à la recombinaison génique permet à la bactérie d’échapper au système immunitaire de l’hôte en modifiant les séquences codant pour des protéines de surface58 qui sont ciblées par le système immunitaire, leur permettant de générer une forme de résistance43,63 . Ce processus est appelé variation antigénique. Il existe des cas rapportés où ce phénomène implique la formation de séquences de G4s43,63. On peut citer par exemple la bactérie responsable de la gonorrhée, Neisseria gonorroheae64,65 ou encore chez le parasite Plasmodium falciparum.
Introduction Bibliographique |