Rôle de Hda1 dans la régulation de l’expression gènes par les longs ARN
Introduction
Des analyses à grande échelle de transcriptomes d’organismes eucaryotes ont montré que la quasi-totalité de ces génomes sont transcrits. Des estimations faites à partir de l’analyse d’1% du génome ont suggéré que 98% du génome humain (2,3) et 85% du génome de la levure ( 4 ) sont ainsi transcrits. Des analyses plus précises du projet GENCODE v7 ont été publiées très récemment (5–7 ). Cette étude montre que 80% du génome humain est fonctionnel et que 66% est transcrit en ARN. Cette transcription de la presque totalité d’un génome est connue sous la notion de transcription « pervasive ». Ce terme, peut-être péjoratif, a donné lieu à de nombreux débats tantôt reflétant une affinité par défaut de l’ARN polymérase pour l’ADN nu sans rôle particulier, tantôt reflétant la réalité d’un promoteur et d’une régulation spécifique ( 8–13). De nombreuses études récentes ont pu mettre en évidence un très grand nombre de nouvelles familles d’ARN non codants (ARNnc) dont la fonction reste largement méconnue. Ces ARNnc sont différents des ARNnc bien connus comme les small nucle(ol)arARN, impliqués dans l’épissage des préARNm, les ARN de transfert et les ARN ribosomiques impliqués dans la traduction des ARNm. . Les ARNnc eucaryotes Les ARNnc peuvent être transcrits en orientation sens ou antisens par rapport à l’orientation du gène le plus proche. Ces ARN peuvent être stables c’est-à-dire à des niveaux d’expression comparables à des ARNm ou instables, ciblés par des machineries de dégradation particulières. Chez les procaryotes, la proportion d’ADN non codant est de moins de 25%, elle est de plus de 60% pour les plantes et les métazoaires et environ 98,5% chez l’Homme (14). Cette proportion semble augmenter avec la complexité des génomes. Pour les organismes les plus complexes, la transcription pervasive peut donc constituer un nouveau niveau de régulation de la structure de la chromatine ou de l’expression des gènes (15). Les régulations ainsi mises en jeu peuvent être plus complexes et plus fines. Etant donné que la synthèse d’un ARN est plus rapide que la synthèse d’une protéine, qui demande la synthèse préalable d’un ARN, la transcription pervasive dans ces organismes leur permettrait de réagir plus vite aux changements de l’environnement. De plus, les effets des ARNnc peuvent être transcriptionnels ou post-transcriptionnels ce qui entraine une plus grande variabilité phénotypique. 11 Le plus simple critère de classification est la taille de ces ARNnc. De 17 à 200nt ces ARNnc sont désignés comme petits. Au-delà de 200nt ils font parties des grands ARNnc. Ces deux classes sont ensuite divisées en sous-familles en fonction de leurs caractéristiques, de leurs fonctions et de leurs modes d’action. Le projet GENCODE a ainsi identifié 9000 petits ARNnc provenant de 9000 loci, de 15000 longs ARNnc provenant de 9640 loci et de 14000 transcrits provenant de 11900 loci dans 16 lignées cellulaires humaines différentes (5–7 ). Pour la première fois le nombre de loci non codants (24000) dépasse le nombre de loci codants (21000). I. Petits ARN non codants chez les eucaryotes : Les petits ARNnc ont des tailles comprises entre 17 et environ 200nt. Les petits ARNnc peuvent être subdivisés en courts ARN interférents (siARN), courts ARN non codants (sARN) (figure 1).
Les courts ARN non codants
Caractéristiques générales
Cette sous-classe inclue les petits ARN interférents (siRNA, 16), les ARN interagissant avec PIWI (piARN, 17), et les micros ARN (miARN, 18). Ces ARNnc ont des tailles respectivement comprises entre 19-30nt, 24-31nt et 21-25nt. Les piARN sont classés en trois sous-types différents tous associés à des répétitions de séquences. Ce sont les répétitions associées aux siRNA (repeat-associated siARN ou rasiARN) (19), les si ARN associés aux centromères (crasiARN, 20) et les sARN associés aux telomères (tel-sARN, 21).
Synthèse Les siARN proviennent de la digestion par Dicer d’ARNdb
Ces ARNdb peuvent provenir de régions répétées comme les transposons, les centromères (22). Des transcrits naturellement antisens (Natural Antisens Transcript ou NAT, voir plus loin) peuvent aussi former des ARNdb avec l’ARNm dont ils sont antisens (23–25) (figure 2). Figure 2 : mode se synthèse des petits ARN interférents Les siARN sont produits à partir de la digestion d’ARN double-brin (ARNdb) par Dicer. Ces ARNdb proviennent d’ARN antisens ou d’un ARN qui se replie en épingle à cheveu. Les ARN ainsi formés sont chargés sur une protéine Argonaute qui peut ainsi se fixer sur les ARNm cible et entrainer leur dégradation après déadénylation et « décapping ». Les pri-miARN sont obtenus à partir d’un seul ARN. Cet ARN peut contenir deux exons dans le cas des mirtrons. Ces ARN sont maturés par Drosha et exportés dans le cytoplasme ou Dicer clive la boucle. Les ARN sont ensuite chargés sur une protéine Argonaute qui peut ainsi se fixer sur les ARNm cible et entrainer leur dégradation après déadénylation et « décapping » ou empêcher la traduction. 13 Les miARN sont transcrits par les ARN polymérase II et III sous forme de primiRNA coiffés et poly-adénylés (26,27). Certains miARN sont transcrits à partir de leur propre promoteur (27–31). Leur expression est variable au court du développement (28,32,33). Les autres miARN sont transcrits à partir d’introns en orientation sens ou antisens. Leur expression est corrélée à l’expression du gène dans lequel ils sont situés (34–39). Le pri-miARN est digéré par la ribonucléase Drosha pour former le pré-miARN qui a une structure en tige-boucle (40,41). Il existe d’autres sources de pre-miARN. Ces pre-miARN atypiques sont appelés mirtrons. Ils ont initialement été découverts chez la drosophile (34) et jusqu’à récemment seuls 10 mirtrons avaient été identifiés chez l’Homme (42). Récemment 237 et 240 mirtrons ont été identifiés respectivement chez le rat et l’Homme (43). Ces pri-miARN se présentent sous la forme de deux exons séparés par un intron en forme d’épingle à cheveu. Le pre-miARN est relâché suite à l’épissage du pri-miARN. La boucle du pre-miARN est ensuite enlevée pour terminer la genèse des miARN (34,35). Ces ARNdb sont ensuite clivés par Dicer (44–47). Les petits ARN ainsi synthétisés sont pris en charge par une protéine Argonaute (figure 2). Les piARN sont généralement produits à partir d’ARN simple brin (ARNsb) par un mécanisme ping-pong qui n’implique pas Dicer (figure 3). Figure 3 : modèle ping-pong de production des piARN Un piARN déjà synthétisé chargé sur la protéine Aubergine peut s’hybrider à un ARN provenant de séquences répétées. Cette interaction entraine le clivage de l’ARN 10 nucléotides en amont du A. Cet ARN est maturé pour produire un nouveau piARN. Ce piARN est chargé sur une protéine Ago3 qui peut cibler un ARN provenant de séquences répétées. Ceci entraine une coupure de l’ARN au niveau de l’uracile. L’ARN ainsi formé est maturé et chargé sur Aubergine. Adapté de Aravin et al, Mol Cell, 2008. 14 Ce mécanisme reste actuellement encore très mystérieux mais les étapes de maturation font intervenir Argonaute ayant la capacité d’hydrolyser l’ARNm. Pour le transposon, des piARN sont capables d’interagir avec Piwi ou Aubergine. Ce complexe est capable de se fixer sur l’ARNm du transposon. Cette fixation entraine le clivage de l’ARNm du transposon en petit ARN. Cet ARN est pris en charge par la protéine Ago3. Ce complexe est capable de reconnaître le transcrit contenant la séquence du piARN. Cette reconnaissance conduit au clivage de l’ARN et donc à la production du piARN (48). c. Modes d’action Les régulations des cibles de ces ARNnc peuvent être co- ou post-transcriptionnelles. La régulation co-transcriptionnelle passe par le silence transcriptionnel du gène (Transcriptionnal Gene Silencing ou TGS), modifications de l’état de condensation de la chromatine, méthylation de l’ADN et modifications post-traductionnelles des histones (49). Le TGS est impliqué dans le silence de la transcription des centromères et des régions impliquées dans la détermination du type sexuel chez Schizosaccharomyces pombe ( 50) (figure 4). Des siARN interagissent avec le complexe ARC contenant les protéines Argonaute, Arb1 et Arb2. Arb1 et Arb2 sont ensuite remplacées par Tas3 et Chp1, pour former le complexe RITS (RNA Induced Transcriptional Silencing complex). Un des deux brins de l’ARNdb est dégradé. Grâce au brin toujours intact le complexe RITS est capable d’interagir avec un ARN néo-naissant transcrit au niveau du centromère. Le recrutement du complexe RITS au niveau de la chromatine centromérique entraîne le recrutement du complexe CLRC. Le recrutement de ce complexe induit la méthylation de H3K9 grâce à l’histone méthyl-transférase Clr4. Cette méthylation est reconnue par la protéine Swi6 ellemême reconnue par la protéine HP1 ce qui va conduire à une condensation de la chromatine centromérique. L’interaction du complexe RITS avec l’ARN néo-naissant provoque le clivage de cet ARN et la dissociation du complexe RITS. Le siARN hybridé à l’ARN cible est un substrat pour le complexe RDRC. Ce complexe contient une ARN polymérase ARN dépendante. Elle va synthétiser un brin complémentaire à partir du siARN en utilisant l’ARN cible comme matrice. Cette transcription entraîne la formation d’un long ARNdb qui sera ensuite clivé par Dicer pour générer de nouveau siARN (51)
PREMIER CHAPITRE : INTRODUCTION |