Analyse de l’impact sur l’épissage de l’ARN de variants de signification inconnue de gènes impliqués
Altérations des signaux d’épissage
Une variation génétique au sein d’un site d’épissage ou des séquences régulatrices provoquant un épissage aberrant sont souvent retrouvés dans les maladies héréditaires humaines (Daguenet et al. 2015). Des substitutions ponctuelles affectant les sites 5’ ou 3’ d’épissage sont les mutations d’épissage les plus courantes, entraînant soit un saut d’exon, soit l’activation d’un site cryptique donneur ou accepteur d’épissage, soit dans une moindre mesure une rétention d’intron. De même, des variations introniques ou exoniques (faux-sens, non-sens ou silencieuses) peuvent souvent déclencher des perturbations d’épissage par une perte ou une création d’élément régulateur de l’épissage, activateur ou inhibiteur (Supek et al. 2014; Daguenet et al. 2015). Il est estimé que la moitié des variations synonymes peuvent potentiellement impacter l’épissage (Supek et al. 2014). Ceci est illustré par l’analyse du spectre de mutations du gène CFTR (cystic fibrosis transmembrane conductance regulator) responsable de la mucoviscidose (Pagani et al. 2005) ou du gène NF1 responsable de la neurofibromatose, où 50% des mutations délétères conduisent à des défauts d’épissage (Serra et al. 2001). Ces altérations peuvent se produire aussi bien dans les exons constitutifs qu’alternatifs et génèrent par conséquent des transcrits aberrants où il manque un exon constitutif ou entraîner des changements dans les ratios entre isoformes (Figure 16A). Dans la base de données HGMD (Human Gene Mutation Database), 9,1% de l’ensemble des mutations publiées sont considérées comme des mutations d’épissage (http://www.hgmd.cf.ac.uk/ac/index.php). Ce pourcentage varie fortement en fonction des gènes : l’on obtient par exemple 23% pour le gène BRCA2, 18% pour le gène ATM et seulement 9% pour le gène BRCA1 (Lewandowska 2013). Cependant, ces résultats sont encore très sous-estimés car des mutations potentielles situées dans les éléments régulateurs 65 pourraient être confirmées expérimentalement. Globalement on estime que les mutations d’épissage représentent un tiers de l’ensemble des mutations délétères (Daguenet et al. 2015). L’utilisation d’algorithmes, tels que MutPred Splice (Mort et al. 2014), a permis de montrer que, parmi les mutations d’épissage identifiées, celles provoquant la perte de sites d’épissage naturels forment la principale catégorie de mutations d’épissage dans les maladies génétiques, dont les prédispositions aux cancers, tandis que celles provoquant la perte d’ESE et/ou le gain d’ESS (générant in fine un saut d’exon) forment la principale catégorie de mutations d’épissage dans les cancers sporadiques. a. Altérations au niveau des sites consensus d’épissage Une mutation au niveau des sites consensus d’épissage empêcherait de facto leur reconnaissance par la machinerie cellulaire que constitue le spliceosome. Les mutations affectant le site de branchement ou la région riche en pyrimidines sont très rares. En revanche, les mutations d’épissage identifiées au niveau des sites 5’ et 3’ d’épissage sont très fréquentes. Parmi elles, les mutations ponctuelles siégeant au niveau des deux premiers et des deux derniers nucléotides des introns majeurs sont nombreuses (Fredericks et al. 2015) (Figure 17). D’autres mutations, à proximité directe de ces dinucléotides, sont fréquemment délétères (Krawczak et al. 2007) (Figure 17). Parmi elles figurent : · Des mutations au niveau du site donneur d’épissage : o Au niveau des deux derniers nucléotides exoniques (en position -2 et -1 par rapport au site donneur d’épissage) ; o Au niveau intronique en position +3 à +6 ; · Des mutations du site accepteur d’épissage, en position -3 au niveau de l’intron. Figure 17 : Distribution des mutations ponctuelles causales répertoriées aux niveaux des sites donneur et accepteur d’épissage dans la base de données HGMD en 2006 (d’après Krawczak et al. 2007) La destruction d’un site consensus d’épissage empêche donc sa reconnaissance par le spliceosome. En conséquence, celui-ci reconnaitra en principe le site d’épissage accessible le plus proche. Si le site d’épissage choisi est le site consensus de l’exon voisin, cela conduit alors à un saut d’exon. Cependant, le spliceosome peut reconnaitre des sites alternatifs d’épissage, plus proches qu’un autre site consensus. L’utilisation d’un site cryptique peut générer des évènements tels que l’inclusion d’un exon cryptique ou la rétention de l’intron (Krawczak et al. 2007). Les exemples suivants illustrent comment les mutations pathogènes peuvent être étroitement liées aux multiples aspects de la reconnaissance des sites d’épissage et, en fait, aider à illustrer l’équilibre délicat entre les différents signaux d’épissage et leurs interactions. La grande majorité des patients atteints de dysautonomie familiale (FD, familial dysautonomia) porte une mutation ponctuelle à la position +6 de l’intron 20 du gène IKBKAP (c.2204+6T>C), qui encode une protéine régulatrice de la transcription (Anderson et al. 67 2001). Cette position est la dernière des nucléotides introniques du site donneur d’épissage, participant à la reconnaissance du site par la protéine ARNsn U1. La modification de ce nucléotide entraine la perte d’identification du site et donc de la définition de l’exon, provoquant le saut complet de l’exon 20 et générant un ARNm contenant un PTC, cible du NMD (Ibrahim et al. 2007). Le rôle essentiel de ce seul nucléotide est devenu évident lorsque des systèmes expérimentaux ont montré que la restauration de l’appariement de bases entre le site 5’ muté et l’ARNsn U1 par mutation de ce dernier restaurait l’inclusion de l’exon 20 (Carmel et al. 2004). De manière remarquable, l’ampleur du défaut d’épissage est tissudépendant, très limité dans les lymphoblastes mais très étendu dans le cerveau, expliquant les graves anomalies du cerveau et les symptômes de démyélinisation observés dans la maladie (Cuajungco et al. 2003). Cependant les bases de cette tissu-spécificité restent obscures. A l’inverse des mutations altérant ou détruisant un site consensus d’épissage, des variations peuvent créer ou activer un site cryptique d’épissage. Ces sites cryptiques, préexistants et situés tout au long des exons et des introns, sont habituellement peu ou pas utilisés par la machinerie d’épissage car leur force est faible comparativement à celle des sites consensus d’épissage. Il n’est donc pas surprenant que de petites variations de séquence peuvent conduire à l’activation de sites cryptiques d’épissage, en augmentant brusquement leur force, comme illustré de façon spectaculaire avec le syndrome de Hutchinson-Guilford (ou progéria) provoquant un vieillissement prématuré et où les individus les plus touchés portent une substitution silencieuse C>T dans l’exon 11 du gène LMNA (lamine A) en position c.1824. Cette mutation active un site cryptique 5’ d’épissage, générant un ARNm tronqué des 150 derniers nucléotides de l’exon 11 et codant une forme dominante négative de lamine A, tronquée de 50 acides aminés et appelée progérine, causant une instabilité nucléaire et génomique. 68 Des altérations des principaux signaux d’épissage peuvent aussi être dues à une altération de la région riche en pyrimidines. Ces altérations sont rares mais peuvent être à l’origine de certaines maladies comme l’hémophilie B, maladie récessive liée au chromosome X (Lewandowska 2013). Actuellement, dans cette pathologie, les variations dans le site de branchement et la région riche en pyrimidine sont recherchées quand aucune altération n’est identifiée par séquençage dans la région codante, dans les sites 5’ et 3’ d’épissage, et dans les régions transcrites non traduites (UTR, untranslated regions). Enfin, des mutations ponctuelles à proximité des sites d’épissage peuvent considérablement affecter l’épissage et provoquer la maladie. Un exemple remarquable est celui des FTDP-17 (frontotemporal dementia and parkinsonism linked to chromosome 17), un syndrome démentiel lié à des mutations du gène MAPT (microtubule associated protein Tau). Des mutations au sein de l’intron 10 du gène, à proximité du site 5’ d’épissage, altèrent l’équilibre entre les différentes isoformes d’épissage en augmentant l’inclusion de l’exon 10. L’augmentation d’expression de cet isoforme conduit à l’agrégation de la protéine Tau, responsable d’une dégénérescence neuronale. Cette mort neuronale est à l’origine d’une démence se traduisant initialement par des troubles de la personnalité et associant parfois des troubles moteurs (Hutton et al. 1998). Les mutations ne sont pas situées au niveau des sites canoniques d’épissage AG/GT mais induisent l’ouverture d’une tige-boucle qui normalement séquestre partiellement le site 5’ d’épissage afin d’éviter l’inclusion totale de l’exon 10 (Hutton et al. 1998; Grover et al. 1999; Pottier et al. 2016). Ceci est l’un des exemples les mieux documentés sur l’influence des structures secondaires du pré-mRNA sur la reconnaissance du site d’épissage. 69 b. Altérations au niveau des sites régulateurs de l’épissage L’altération des séquences régulatrices de l’épissage par des mutations est un mécanisme fréquent et probablement sous-estimé (Soukarieh et al. 2016). En effet, il est estimé que 25% des variations exoniques de type faux-sens et non-sens altèrent l’épissage par création ou destruction d’ESE et d’ESS (Sterne-Weiler et al. 2011). Ces données montrent que toute variation peut potentiellement être une mutation d’épissage, indépendamment de son effet potentiel sur la structure ou la fonction de la protéine. De plus, conformément à l’observation que les gènes liés au cancer peuvent posséder une plus grande sensibilité envers des altérations de l’épissage (Sterne-Weiler and Sanford 2014), des mutations synonymes récurrentes affectant des ESE et ESS ont été identifiées dans des oncogènes importants, représentant un mécanisme supplémentaire dans l’activation de ces derniers (Daguenet et al. 2015). Un exemple classique de la façon dont une mutation exonique peut influencer la reconnaissance de l’exon avec de graves conséquences est l’amyotrophie spinale (SMA, spinal muscular atrophy). C’est l’une des maladies génétiques les plus fréquentes, maladie neuromusculaire autosomique récessive caractérisée par la perte sélective des motoneurones spinaux, conduisant à une faiblesse sévère des muscles squelettiques associée à une atrophie. Elle implique une quantité insuffisante de protéine SMN (survival of motor neuron) dont la fonction est de chaperonner la biogénèse et l’assemblage des RNPsn (Matera and Wang 2014). Cette insuffisance quantitative résulte de mutations de type perte de fonction ou de délétions dans le gène SMN1 (Lefebvre et al. 1995). Malgré sa forte homologie avec SMN1, le gène SMN2, issu de la duplication génique de SMN1, ne parvient pas à empêcher le développement de la maladie car ce gène porte une substitution nucléotidique au niveau du 6e 70 nucléotide de l’exon 7 (C6T ex7 ou c.840C>T), responsable du saut de l’exon 7 et générant une version tronquée, instable et rapidement dégradée de la protéine SMN (Lorson et al. 1999). Des analyses de l’impact mécanistique de la transition C vers T ont montré la perte d’un ESE reconnu par la protéine SRSF1 en même temps que le gain d’un ESS reconnu par la protéine hnRNPA1 (Cartegni and Krainer 2002; Kashima and Manley 2003). Ce modèle montre le caractère inconstant des signaux de régulation d’épissage, pouvant convertir un ESE en ESS à la suite d’une modification d’un seul nucléotide. 2. Altérations des facteurs régulateurs de l’épissage Bien qu’il existe un nombre important et croissant d’exemples de mutations d’épissage agissant au niveau des signaux d’épissage et causant des maladies, les exemples de mutations d’épissage agissant au niveau des facteurs d’épissage sont relativement limités (Singh and Cooper 2012). La rareté des mutations agissant au niveau des facteurs d’épissage suggère que ces mutations au sein de la machinerie d’épissage sont létales pendant le développement embryonnaire, sinon au niveau des cellules individuelles (Kalsotra and Cooper 2011). Cependant, des études décrivent des mutations pathogènes agissant au sein de la machinerie d’épissage, y compris au sein même des composants du spliceosome ainsi que d’autres composants nécessaires pour la régulation de l’épissage alternatif (Singh and Cooper 2012) (Figure 16).
Altérations de la biogénèse des RNPsn
Comme décrit précédemment, la mutation du gène SMN1 conduit à des défauts dans la biogénèse des RNPsn responsable de la SMA. De manière intéressante, des liens moléculaires potentiels entre la fonction des RNPsn dans la SMA et d’autres troubles moteurs et/ou neurodégénératifs ont émergé. La sclérose latérale amyotrophique (SLA) en est un bel exemple, causée par des mutations dans plus de 20 gènes ayant des fonctions différentes (Renton et al. 2014), y compris les protéines FUS (fused in sarcoma) et TDP-43 (transactive response DNA binding protein 43 kDa) se liant à l’ARN. FUS est une protéine hnRNP-like qui interagit avec les ARNsn U1 et U2 (Kwiatkowski et al. 2009; Vance et al. 2009; Gerbino et al. 2013). Les protéines FUS mutantes se lient également à ces ARNsn, avec une moins bonne affinité, mais sont ensuite retenues dans le cytoplasme, provoquant une diminution du pool disponible de RNPsn U1 et U2 dans le noyau (Yu et al. 2015). En outre, FUS interagit avec SMN et les protéines FUS mutées semblent également modifier la localisation cellulaire de SMN, contribuant potentiellement aussi aux altérations d’épissage associées à la maladie (Yamazaki et al. 2012; Groen et al. 2013; Sun et al. 2015). La protéine TDP-43, autre protéine se liant à l’ARN et fréquemment mutée dans la SLA, interagit avec FUS (Groen et al. 2013). Son altération entraine en conséquence une dérégulation de FUS et ainsi conduit à une perte d’abondance des ARNsn et la mauvaise localisation de SMN (Ishihara et al. 2013). La protéine TDP-43 mutée forme des agrégats insolubles (Neumann et al. 2006), marqueurs caractéristiques d’autres maladies neurodégénératives, telles que la maladie d’Alzheimer. La récente analyse de la teneur en protéines des agrégats retrouvés dans la maladie d’Alzheimer a montré l’accumulation de certains composants de la RNPsn U1 (Bai et al. 2013) et des analyses immuno-histochimiques ont révélé que les protéines U1-70K et U1A forment des enchevêtrements dans le cytoplasme des cellules du cerveau de malades, mais pas dans les autres maladies neurodégénératives. De plus, des analyses de séquençage à haut débit de l’ARN (RNA-Seq) ont révélé un défaut global d’épissage, avec l’accumulation d’ARN non épissés (Bai et al. 2013), ce qui suggère un rôle de l’épissage de l’ARN dans l’étiologie de cette maladie. Ces observations montrent donc que des altérations menant à l’accumulation cytoplasmique de RNPsn et par conséquent à des altérations de l’épissage des pré-mRNA contribuent à l’étiologie de multiples maladies neurodégénératives peut-être grâce à des mécanismes et des cibles communes (Daguenet et al. 2015). Des altérations de la biogénèse de l’ARNsn U6 ont été détectées dans la poïkilodermie avec neutropénie (PN) de type Cléricuzio, rare maladie de peau autosomique récessive fréquemment associée à une neutropénie chronique et des anomalies de la moelle osseuse pouvant aboutir à une myélodysplasie et un risque accru de transformation leucémique (Shchepachev et al. 2012). La maladie est associée à des mutations dans le gène C16orf57 (appelé aussi USB1, U6 snRNA biogenesis 1) codant la protéine hMpn1/Usb1 (Volpi et al. 2010). Cette exoribonucléase 3’‡5’ est impliquée dans la maturation de l’ARNsn U6, supprimant sa queue de résidus uridine et générant un phosphate 2’-3’ cyclique qui stabilise l’ARNsn (Shchepachev et al. 2012). La baisse du taux d’enzyme dans les lymphoblastes de patients atteints de PN se traduit par une augmentation de la dégradation de l’ARNsn U6. Cependant, aucune perturbation globale de l’épissage n’a été observée dans ces cellules (Shchepachev et al. 2012), ce qui est remarquable compte tenu du rôle crucial que l’ARNsn U6 joue dans les 2 étapes catalytiques du processus d’épissage (Figure 10). Ces résultats suggèrent que la maladie est soit associée à de légers effets spécifiques sur l’épissage de 73 certains ARN, soit que cette enzyme joue un rôle dans le métabolisme d’autres classes d’ARN (Daguenet et al. 2015). b. Altérations des protéines composant le spliceosome Des données récentes de séquençage de génomes et d’exomes de cellules sanguines anormales de patients souffrant de maladies hématopoïétiques des lignées lymphoïdes et myéloïdes, y compris de syndrome myélodysplasique (SMD), de leucémie aigüe myéloïde (LAM), de leucémie lymphocytaire chronique (LLC) et de leucémie myélomonocytaire chronique (LMMC), ont mis en évidence des mutations somatiques récurrentes dans des gènes codants des facteurs d’épissage (Daguenet et al. 2015). Parmi ces facteurs impliqués, on trouve des protéines impliquées dans la reconnaissance du site 3’ d’épissage, telles que 2 sous-unités du complexe U2AF, SF1/BBP et ZRSR2 (zinc finger (CCCH type), RNA-binding motif and serine/arginine rich 2), et des protéines composant le complexe RNPsn U2, comme SF3A1 (splicing factor 3a, subunit 1, 120kDa) et SF3B1 (splicing factor 3b, subunit 1, 155kDa) (Papaemmanuil et al. 2011; Yoshida et al. 2011; Quesada et al. 2012). Dans ces données, le facteur le plus fréquemment muté était le gène SF3B1, dont la protéine joue un rôle essentiel dans la reconnaissance du site d’épissage. Ses interactions avec U2AF et le prémRNA contribuent au recrutement du RNPsn U2 (Gozani et al. 1998) ; sa phosphorylation est couplée avec les réactions de catalyse pendant l’épissage (Wang et al. 1998) et son association à la chromatine influence les réactions d’épissage (Kfir et al. 2015). Des mutations de SF3B1 ont été identifiées dans 85% des patients souffrant de SMD couplée à une anémie réfractaire avec « sidéroblastes en couronne », 15% des patients atteints de LLC et 5% des patients souffrant de LAM ou de LMMC (Daguenet et al. 2015). Etonnamment, alors que les 74 mutations de SF3B1 sont corrélées à un pronostic favorable dans les SMD, elles sont corrélées à un pronostic défavorable couplé à une résistance à la fludarabine dans les LLC (Papaemmanuil et al. 2011; Rossi et al. 2011), suggérant que les effets moléculaires de ces mutations sont fortement influencés par le contexte cellulaire (Daguenet et al. 2015). Ce concept est en outre vérifié par la récente identification d’altérations dans un autre composant du complexe RNPsn U2, SF3B4 (splicing factor 3b, subunit 4, 49kDa) chez des patients atteints du syndrome de Nager, dysostose acro-faciale caractérisée par des malformations cranio-faciales et des membres (Bernier et al. 2012). De manière intéressante, des analyses de séquençage à haut débit d’ADN de sang de plus de 4000 individus ont révélé que l’expansion de clones hématopoïétiques portant des mutations dans les gènes SF3B1 et SRSF2 augmente fortement avec l’âge, ce qui est compatible avec l’incidence plus élevée des SMD à un âge avancé (McKerrell et al. 2015). La régulation de l’épissage s’opère au niveau de toutes les étapes de l’assemblage du spliceosome. Il est donc attendu qu’une mutation altérant l’un de ces facteurs soit préjudiciable au moment de l’élimination des introns (Daguenet et al. 2015). Par exemple, des mutations dans les composants du complexe RNPsn U4/U6/U5 conduisent à des syndromes très spécifiques. Ainsi, des mutations dans le gène EFTUD2 (elongation factor Tu GTP binding domain containing 2), qui code pour la protéine U5-116kDa, composant du RNPsn U5, sont responsables de la dysostose mandibulo-faciale avec microcéphalie, syndrome polymalformatif (Lines et al. 2012). De plus, des mutations dans les gènes PRPF31, PRPF8, PRPF6, PRPF3 (pre-mRNA processing factors), RP9 (retinitis pigmentosa (autosomal dominant), codant la protéine PAP-1 et SNRNP200/BRR2 (small nuclear ribonucleoprotein 200kDa), sont associées aux rétinites pigmentaires, large groupe de maladies héréditaires dégénératives de la rétine caractérisées par un dysfonctionnement progressif des 75 photorécepteurs et de l’épithélium pigmentaire de l’œil (Mordes et al. 2006). On peut se demander pourquoi des altérations de facteurs clés de la régulation de l’épissage conduisent à des pathologies tissu-spécifiques. Il est possible qu’une altération de l’épissage soit plus préjudiciable dans des cellules à division rapide composant des tissus nécessitant une régénération rapide, comme la rétine (Daguenet et al. 2015). Bien qu’utilisé pour l’épissage d’un nombre très limité d’introns, le spliceosome mineur peut également être la cible de mutations délétères. Ainsi, des mutations dans le gène codant l’ARNsn U4atac sont responsables du nanisme microcéphalique ostéodysplasique primordial de type I (appelé aussi syndrome de Taybi-Linder), caractérisé par des anomalies neurologiques et squelettiques (Edery et al. 2011; He et al. 2011).
INTRODUCTION |