Interconnexions entre épissage alternatif et chromatine
L’EPISSAGE DES ARN
L’ARN (acide ribonucléique) est une molécule universelle chez les êtres vivants. Les ARN effectuent des fonctions variées dans la cellule : messager, guide, régulateur ou catalytique. Pour être fonctionnels, les ARN subissent de nombreux processus de maturation.
HISTORIQUE
L’état des connaissances à la fin des années 1970
Il existe plusieurs classes d’ARN (Darnell et al., 1986) : – les ARN ribosomaux (ARNr) : synthétisés par les ARN polymérases I et III, ils représentent environ 80% des ARN totaux. – les ARN de transferts (ARNt) : synthétisés par l’ARN polymérase III, ils représentent environ 15% des ARN totaux. – les ARN messagers (ARNm) : synthétisés par l’ARN polymérase II, ils servent de matrice à la synthèse protéique et sont présents dans le cytoplasme. Leur taille est comprise entre 0,5 et 3 kilobases (kb). – les ARN nucléaires hétérogènes (ARNnh) : nommés ainsi en raison de l’importante hétérogénéité de leur taille, entre 2 kb et 30 kb, ils sont présents dans le noyau. A l’instar des ARNr et des ARNt, il est proposé que les ARNm puissent eux aussi être formés à partir d’ARN précurseurs nucléaires. De manière intéressante, les ARNm et les ARNnh ont une composition en bases similaire suggérant ainsi que certains ARNnh pourraient être des précurseurs d’ARNm. (Darnell et al., 1986) Dans les années 60 et 70, deux étapes de maturation des ARN sont mis en évidence : – l’ajout de la queue poly A en 3’ de l’ARN : En exposant très brièvement (2 min ou moins) des cellules avec de l’adénosine radio-marquée au tritium (3H), il est montré que dans le noyau, une queue poly A est ajoutée en 3’ de certains ARNnh de manière post-transcriptionnelle puisque aucune longue séquence répétée d’adénosines n’est présente dans le génome. De plus, en suivant la fraction des ARN marqués 13 au 3H au cours du temps il est mis en évidence que les ARNm sont issus des ARNnh. (Darnell et al., 1986) – l’ajout de la coiffe en 5’ de l’ARN : La découverte de la queue poly A amène à purifier plus aisément les ARNm et les ARNnh. Leur analyse a ensuite révélé qu’ils possèdent une coiffe en 5’ de l’ARN : un groupement guanosine méthylé en position N7 (m7G). (Darnell et al., 1986) La composition similaire en nucléotides et leurs maturations communes en 5’ et 3’ conduisent à proposer que les ARNnh sont les précurseurs des ARNm. Pourtant, les tailles de ces deux classes d’ARN sont très différentes : les ARNnh sont environ 10 fois plus grands que les ARNm. Cette différence s’explique par un troisième processus de maturation appelé épissage et qui consiste à l’excision de fragments des ARNnh.
La découverte de l’épissage
Les travaux de l’équipe de Phillip A. Sharp (Berget et al., 1977) et ceux de l’équipe de Richard J. Roberts (Chow et al., 1977), publiés en 1977, ont permis de mettre en évidence le phénomène d’épissage des ARN. Philip A. Sharp et Richard J. Roberts reçoivent en 1993 le prix Nobel de physiologie ou médecine pour cette découverte. Cette découverte se base sur des observations obtenues par microscopie électronique de R-loop (hybride d’ARN et d’ADN double brin) et d’hybridation ARN/ADN simple brin. Ces évidences amènent l’équipe de Phillip A. Sharp à proposer que le gène hexon et son ARNm ne sont pas colinéaires. Expérimentalement, ils observent que l’extrémité 5’ de l’ARNm ne s’hybride pas au fragment « HindIII A » du génome de l’adénovirus 2 qui a été cartographié comme étant le gène hexon. Philip A. Sharp et ses collaborateurs ont alors hybridé l’ARNm hexon au fragment en amont du fragment « HindIII A ». Cette expérience leur a permis d’observer des hybrides ARN/ADN entrecoupés de structures en boucle d’ADN au niveau de l’extrémité 5’ de l’ARNm hexon (Figure 1A), c’est-à-dire l’extrémité qui ne s’hybride pas au fragment « HindIII A » précédemment utilisé. Le groupe de Philip A. Sharp en a conclu que l’extrémité 5’ de l’ARNm hexon est complémentaire à 3 régions non contiguës de l’ADN de l’adénovirus 2. Un modèle a ensuite été proposé dans lequel l’ARNm hexon, en plus de l’ajout de sa coiffe en 5’ et de sa queue poly A en 3’, subirait un autre processus de maturation impliquant l’excision de certains fragments du transcrit primaire. Philip A. Sharp 14 propose pour la première fois le terme splicing (traduction anglaise d’ « épissage ») et se questionnent quant à la généralisation de ce modèle aux ARNm eucaryotes. De façon concomitante, l’équipe de Richard J. Roberts a abouti à la même observation en utilisant une technique similaire : elle a observé par microscopie électronique des R-loop, formées par l’ADN double brin de plusieurs gènes et par les ARNm correspondants, auxquelles sont ajoutées des sondes d’ADN simple brin (fragments de restriction du génome de l’adénovirus 2). L’extrémité 5’ de l’ARNm hexon qui ne s’hybride pas dans la R-loop est capable de s’hybrider à des régions non contiguës de la sonde d’ADN en formant des boucles d’ADN (Figure 1B). L’ensemble de ces travaux sont obtenus dans le cadre de recherche sur l’adénovirus 2, et des résultats similaires ont été obtenus avec plusieurs gènes du génome viral. Figure 1. Le gène et l’ARNm hexon de l’adénovirus 2 ne sont pas colinéaires. A. Microscopie électronique d’hybrides d’ARNm hexon et de fragment d’ADN simple brin correspondant au gène hexon (gauche). Représentation schématique de l’hybride ARN/ADN (ligne épaisse) et de l’ADN non hybridé (ligne fine) (droite). (Berget et al., 1977) B. Microscopie électronique d’une R-loop, formée par l’ARNm hexon et par un fragment d’ADN double brin du gène hexon, hybridée à un fragment de restriction simple brin de l’ADN de l’adénovirus 2 (gauche). Représentation schématique, l’ADN est représenté par une ligne épaisse, l’ARNm par une ligne pointillée et le fragment de restriction par une ligne fine (droite). (Chow et al., 1977) 15 Quelques mois après ces publications, l’équipe de Pierre Chambon montre aussi la présence de « gènes rompus » (split genes) chez un eucaryote : le poulet. Le gène qui code pour l’ovalbumine contient 2 séquences non présentes dans l’ARNm, et au moins l’une d’elle interrompt la région codante (Breathnach et al., 1977). Pierre Chambon nomme alors ces séquences « séquences intervenantes » (intervening sequences). Cependant, c’est au biochimiste américain Walter Gilbert que nous devons les appellations courantes des séquences présentes ou absentes dans l’ARNm. En 1978, il dénomme les séquences exclues de l’ARNm « introns » pour la contraction d’INTRagenic regiONs (traduction anglaise de « régions intragéniques ») et les séquences incluses dans l’ARNm « exons » pour la contraction d’EXpressed regiONs (traduction anglaise de « régions exprimées ») (Gilbert, 1978). Très rapidement, plusieurs équipes montrent d’autres exemples de « gènes rompus » dans divers organismes eucaryotes en détectant des duplex ARN/ADN, en analysant des fragments de digestion enzymatique ou par séquençage. Voici quelques exemples : – le gène de la β-globine chez le lapin (Jeffreys and Flavell, 1977) et chez la souris (Tilghman et al., 1978a) – les 2 gènes de la vitellogenine chez X. laevis (Wahli et al., 1980) – le gène du précurseur de l’insuline chez le poulet (Perler et al., 1980) et chez l’homme (Bell et al., 1980) – le gène du collagène de type α2 chez le mouton (Schafer et al., 1980) – le gène de l’actine chez S. cerevisiae (Gallwitz and Sures, 1980; Jolla et al., 1980) Malgré la caractérisation de nombreux gènes possédants des introns, beaucoup de questions restent en suspens et plusieurs d’entre elles ne sont toujours pas élucidées à ce jour (Crick, 1979) : – Quel est le rôle des introns ? Sont-ils des éléments régulateurs ? – Quelle est l’origine des introns ? Comment ces séquences ont-elles évoluées au cours de l’évolution ? – Comment les ARNm, composés de séquences complémentaires de régions d’ADN non contiguës, sont-ils synthétisés ? Lors de la transcription, l’ARN polymérase fait elle des sauts au niveau des séquences introniques ? Les exons sont-ils transcrits séparément puis finalement ligués ? Est ce qu’un transcrit primaire, colinéaire à son gène, est synthétisé avant de subir une étape d’excision des séquences introniques ? 16 En 1978, Tilghman et al. ont montré que la β-globine du lapin est d’abord transcrite sous forme d’un ARN précurseur contenant un intron. C’est la première expérience qui appuie l’hypothèse du mécanisme d’épissage. (Tilghman et al., 1978b)
Les premières avancées sur la compréhension du mécanisme d’épissage
La communauté s’est ensuite interrogée sur le mécanisme mis en jeu par l’épissage. Une des hypothèses privilégiée fut l’étude d’une complémentarité entre les extrémités 5’ et 3’ des introns. Ce postulat impliquait une hybridation entre ces séquences et leurs excisions par l’intermédiaire d’enzymes capables de reconnaître les extrémités des introns. L’équipe de Pierre Chambon invalide cette hypothèse en 1978 (Breathnach et al., 1978). Les jonctions exons-introns du gène de l’ovalbumine ont été séquencées et révèlent l’absence de complémentarité entre les extrémités des introns. En revanche, cette approche a permis de découvrir un consensus aux extrémités 5’ et 3’ des introns, et notamment les dinucléotides GU à la frontière 5’ et AG pour la jonction 3’. Ces motifs sont retrouvés dans tous les introns (ou presque…cf paragraphe 2.2. de ce chapitre). Parce que les séquences aux abords des extrémités des introns présentent aussi un degré de conservation élevé, une hypothèse (très populaire à l’époque) fut d’imaginer que d’autres motifs puissent jouer un rôle dans le maintien des deux jonctions d’épissage. L’une des voies de recherche du moment a été d’envisager l’intervention de petits ARN nucléaires « snRNA » (small nuclear RNA). Il avait déjà été montré que la maturation des ARNt chez E. coli impliquait l’intervention d’un complexe ARN/protéine (Darnell et al., 1986). En effet, il sera montré par la suite que la réaction d’épissage est catalysée par un complexe ribonucléoprotéique. La réaction d’épissage sera présentée en détail dans le paragraphe 2.2. de ce chapitre.
La découverte de l’épissage alternatif
Dès janvier 1978, les équipes de Philip A. Sharp et Paul Berg mettent en évidence que les ARN correspondant au grand et petit antigène T du virus simien 40 (SV40) sont produits à partir d’un gène unique (Berk and Sharp, 1978; Crawford et al., 1978). Ces résultats 17 représentent donc la première évidence que des ARNm peuvent être le produit d’une régulation par épissage alternatif. Le premier exemple d’épissage alternatif d’un gène eucaryote fut publié en 1982 (Amara et al., 1982) et concerne le gène de la calcitonine dont les deux ARNm distincts codent pour différentes protéines.
|