Influence des séquences subtélomériques sur la
régulation des télomères
Compartimentalisation nucléaire
Organisation tridimensionnelle des télomères dans le noyau
L’arrangement spatial tridimensionnel des fibres de chromatine dans l’espace nucléaire est une notion qui est apparue au début du XXe siècle (Boveri, 1909) mais qui n’a pu être pleinement développée que plus tard avec l’avènement de l’hybridation in situ en fluorescence (FISH) (notamment des peintures chromosomiques) et les techniques de microscopie en trois dimensions (3D) (Cremer et al., 2008). Dans le noyau interphasique, l’organisation de base est le territoire chromosomique (Figure 8a). Celui-ci est composé de repliement de fibres chromatiniennes qui seraient rattachées à la matrice nucléaire, un réseau ribonucléoprotéique parcourant l’ensemble du noyau, par des séquences d’attachement dénommées S/MARs (Cremer & Cremer, 2001; Nickerson, 2001). Cependant, l’organisation exacte des territoires chromosomiques de même que la notion de matrice nucléaire sont encore débattues. L’unité de base serait un domaine chromatinien d’environ 1 Mb, correspondant à des foyers réplicatifs pendant la phase S (Jackson & Pombo, 1998; Ma et al., 1998). Pour d’autres, il s’agirait plutôt de petites boucles de chromatine de 50 à 200 kb appelées rosettes (Munkel et al., 1999), ou encore de boucles géantes de plusieurs mégabases séparées par des régions de 200 kb (“giant loop model”) (Sachs et al., 1995). Différents modèles architecturaux ont également été proposés (Chubb & Bickmore, 2003; Dehghani et al., 2005; Branco & Pombo, 2006), comme le modèle du territoire chromosomique-compartiment interchromatinien (Cremer et al., 2006) (Figure 8b). Le territoire chromosomique ressemble à une éponge traversée par un réseau continu de canaux et de lacunes, le compartiment interchromatinien. Ce dernier correspond à un réseau ribonucléoprotéique qui débute au niveau des pores nucléaires et s’étend entre les différents territoires chromosomiques et l’intérieur de ceux-ci (Rouquette et al., 2009). Les gènes activement transcrits sont exposés directement au contact de l’espace interchromatinien soit en bordure du territoire chromosomique, soit à l’intérieur de celui-ci (Verschure et al., 1999; Volpi et al., 2000; Mahy et al., 2002a; Mahy et al., 2002b; Kupper et al., 2007).
Rôle de la périphérie nucléaire
La périphérie nucléaire est un environnement particulier. Le noyau est délimité par une membrane nucléaire composée d’une bicouche phospholipidique entrecoupée de complexes de pores nucléaires qui permettent les échanges noyau-cytoplasme. La surface nucléoplasmique de la membrane nucléaire interne est recouverte d’un réseau filamenteux appelé lamina nucléaire (Figure 8c). Celle-ci est étroitement associée à la membrane nucléaire interne et rattachée à la périphérie par les complexes de pore nucléaire. La lamina nucléaire est composée de deux types de filaments intermédiaires de type V spécialisés, les lamines de type A et de type B. Les lamines possèdent un domaine central alpha-hélice entouré de deux domaines globulaires. Le domaine central permet de former des dimères de lamines qui s’assemblent ensuite en chaîne puis forment un feuillet d’orientation antiparallèle. Les lamines de type B sont codées par deux gènes (LMNB1 et LMNB2) et sont exprimées dans toutes les cellules. Les lamines de type A sont codées par un seul gène, LMNA, dont l’expression génère une pré-lamine qui subit des modifications posttraductionnelles comprenant farnésylation, méthylation et clivage et est à l’origine des lamines A, C, A∆10 et C2. Les lamines A sont exprimées uniquement dans les cellules différenciées. Les lamines peuvent interagir avec de nombreuses protéines dont certaines font partie de la membrane nucléaire interne. Les interactions entre les lamines et la chromatine peuvent être soit directes avec les histones (Ruault et al., 2008), soit indirectes par l’intermédiaire de facteurs de transcription (Rb, SREBP1, MOK2, cFos) ou par l’interaction entre des protéines associées à la lamina et des protéines associées à la chromatine (LAP2- emerin-MAN1 et BAF, LBR et HP1). Les lamines forment également un réseau dans le nucléoplasme, qui pourrait intervenir dans la prolifération cellulaire, l’initiation de la réplication et l’épissage des ARNs (Dechat et al., 2008). Les lamines jouent un rôle structurel pour l’enveloppe nucléaire et permettent la transduction de signaux entre le nucléoplasme et le cytoplasme grâce à l’interaction avec les 40 protéines de la membrane nucléaire et du cytosquelette (Starr, 2009). De plus, la lamina nucléaire participe à l’organisation de la chromatine interphasique, la réplication de l’ADN, la transcription, la prolifération cellulaire, la différenciation et la réparation de l’ADN (Dechat et al., 2008). Cette multifonctionnalité est liée au fait que la lamina nucléaire est une structure non uniforme, dont les composants peuvent avoir différentes fonctions. Les pores nucléaires sont capables d’interagir avec l’euchromatine et des gènes actifs (Gilbert & Ramsahoye, 2005; Menon et al., 2005; Kalverda et al., 2010). Par ailleurs, les lamines de type B seraient plutôt associées à l’hétérochromatine et aux régions silencieuses, alors que les lamines de type A seraient associées à des régions d’euchromatine riches en gène (Shimi et al., 2008). Ceci expliquerait les résultats parfois discordants dans les corrélations entre localisation nucléaire et expression génique (Luo et al., 2009). Récemment, une cartographie des régions d’interaction entre la lamine B1 et l’ADN a été établie dans des cellules humaines par la technique damID (technique basée sur la méthylation des adénines des séquences d’ADN qui interagissent avec une protéine d’intérêt, ici la Lamine B1, fusionnée avec l’enzyme dam DNA adenyl transférase) (Guelen et al., 2008). Elle a permis d’identifier 1 300 domaines associés à la lamina (LADs), soit environ 40% du génome. Ces domaines sont de relativement grandes tailles de 0,1 à 10 Mb (553 kb en moyenne) et sont pauvres en gènes. Les gènes des LADs sont 5 à 10 fois moins actifs que ceux qui ne sont pas associés à la lamina et sont dépourvus des marques de transcription active (polymérase II et diméthylation des résidus H3K4). Les LADs sont par ailleurs enrichis en résidus H3K27 triméthylés et H3K9 diméthylés et pauvres en histones acétylés, compatibles avec un environnement chromatinien répressif. L’interaction LAD-lamina pourrait être médiée par la liaison de la lamine B1 avec le facteur Oct1 dont les sites sont enrichis dans les LADs. La transition avec les régions nonLADs est brutale sur environ 10 kb. Trois marques, dans les 5 à 10 kb à l’extérieur des LADs, signalent préférentiellement ces frontières : la présence du site de liaison de la protéine insulatrice CTCF, l’augmentation de la densité de promoteurs orientés vers l’extérieur du LAD (associée à une augmentation de la polymérase II et des résidus H3K4 diméthylés) et l’enrichissement en ilôts de CpGs. Ainsi les LADs permettraient de structurer l’organisation de domaines chromosomiques dans le noyau. Enfin, les mutations constitutionnelles des lamines de type A (plus de 250) sont responsables d’un ensemble de pathologies appelées laminopathies. Elles regroupent des pathologies variées comme des dystrophies musculaires, des lipodystrophies, des neuropathies périphériques et des syndromes de vieillissement prématuré dont le plus connu est la progéria de Hutchinson-Gilford (Worman et al., 2009). Leurs principales caractéristiques cliniques 41 sont résumées dans le tableau I. Au niveau cellulaire, l’architecture nucléaire est perturbée avec des noyaux irréguliers, des hernies de l’enveloppe nucléaire, une perte des lamines de type B, des anomalies des pores nucléaires et une délocalisation de l’émerine. Une perte d’hétérochromatine périphérique, des anomalies de la méthylation des histones et des anomalies de localisation des territoires chromosomiques (Goldman et al., 2004; Galiova et al., 2008) sont également observées. La localisation subnucléaire, la taille et la structure chromatinienne des télomères sont également perturbées, indiquant un rôle important des lamines de type A dans la biologie des télomères (Allsopp et al., 1992; Huang et al., 2008; Raz et al., 2008).
Les subtélomères
Les subtélomères sont définis comme les régions de transition entre les séquences chromosomiques spécifiques et les répétitions télomériques terminales (TTAGGG)n (Mefford & Trask, 2002) (Figure 1). Donner une définition plus précise est difficile car ces régions sont extrêmement dynamiques et variables. Elles sont composées d’un patchwork de séquences s’étendant sur une distance de 8 kb à 300 kb environ (Riethman et al., 2001) et sont particulièrement riches en duplications segmentaires (ou duplicons), qui sont des segments d’ADN génomique répétés d’au moins 1 kb de long et de plus de 90% de similarité de séquence. Les duplications segmentaires subtélomériques, encore appelées répétitions subtélomériques, représentent 25% des 500 kb les plus distaux et 80% des 100 kb les plus distaux des chromosomes (Riethman et al., 2004). Du fait de la présence de ces séquences répétées et de la grande variabilité allélique, l’identification et le clonage des séquences subtélomériques a été tardif, particulièrement difficile et n’est pas encore complet. De plus la sous-représentation de ces séquences dans les banques de BACs (“Bacterial Artificial Chromosome”, chromosome artificiel de bactérie) qui ont permis le séquençage du génome a nécessité la mise au point de techniques spécifiques comme la production de demi-YACs (“Yeast Artificial Chromosome”, chromosome artificiel de levure) (Riethman et al., 2001).
Structure des subtélomères
Les subtélomères sont composés d’un patchwork de séquences hautement évolutives et dynamiques. Les extrémités chromosomiques sont composées (dans le sens telomèrecentromère) des répétitions (TTAGGG)n terminales suivies par la région subterminale (<25kb) puis par la région subtélomérique étendue (Riethman, 2008b, a). 45 a : Représentation schématique d’une région chromos Figure 9 : Structure des régions subtélomériques omique subterminale (d’après Riethman, 2008a). Extrémité 3’ sortante (rouge) et répétitions télomériques (noir); (TTAGGG)n dégénérées (noir et gris), séquence TAR1 (rose), séquences Srpt ou spécifique des chromosomes (bleu), transcrits subtélomériques (flèche verte). b : Exemple d’organisation des séquences dans différents subtélomères (d’après Riethman, 2008b) : (TTAGGG)n dégénérées (flèche noire), Srpt (bleu), duplicons subtélomériques (vert), séquence spécifique (jaune), région non séquencée (gap) (rose). c : Exemple de variations structurales d’un même subtélomère (d’après Riethman, 2008b). Séquence spécifique (jaune), variant de séquences spécifiques (jaune hachuré), répétitions subtélomériques (en couleur). La région subterminale comprend des répétitions télomériques (TTAGGG)n dégénérées, des séquences de type TAR1, qui sont des séquences satellites de 0 à 2 kb présentes dans les 2 kb adjacents aux répétitions télomériques (Brown et al., 1990) et enfin soit des séquences d’ADN spécifiques des chromosomes en copie unique (télomères 7q, 8q, 11q, 12q, 18q, Xp/Yp), soit une des six familles de duplicons subterminaux (Srpt A à F) (télomères 2p, 4p, 9p, 10q, 17p, 18p) (Ambrosini et al., 2007) (Figure 9a). Les duplicons subterminaux peuvent avoir des copies subterminales, subtélomériques ou à l’intérieur du génome. Certains de ces blocs contiennent des gènes, comme la famille des gènes WASH, dont l’expression est susceptible d’être directement affectée par la structure des télomères (§ 1.2.3.1.). Les régions subtélomériques étendues sont très variables dans leur taille, leur séquence et leur organisation (Figure 9b). Elles peuvent contenir des répétitions télomériques dégénérées, des duplicons Srpt, d’autres duplications segmentaires et des séquences spécifiques de chromosome (Ambrosini et al., 2007). De plus, les régions subtélomériques sont enrichies en îlots de CpGs (séquence copie unique : 47,9%; Srpt : 44% ; duplicons 43 % ; génome 41,6%) (Riethman et al., 2004). Les séquences immédiatement centromériques aux îlots de CpGs subterminaux sont enrichies en sites CTCF, suggérant la présence de frontières chromatiniennes (Riethman, 2008b). Les répétitions (TTAGGG)n internes sont 25 fois plus fréquentes dans les régions subtélomériques que dans le reste du génome. Elles sont plus longues, de 150 à 200 pb en moyenne (maximum 823 pb), et plus conservées que dans le reste du génome, reflétant soit un évènement de propagation récent soit une forte pression de sélection. Elles sont orientées vers les télomères et coïncident avec la frontière des duplicons. Les duplications segmentaires subtélomériques sont généralement plus grandes et plus nombreuses. Certaines sont spécifiques des subtélomères, d’autres sont plus répandues. En effet, 1151 blocs subtélomériques, dont 461 exclusivement subtélomériques, ont été recensés (Ambrosini et al., 2007). La densité en duplicons est très variable d’un subtélomère à un autre. Des délétions et insertions d’ADN en copie unique ont également été décrites. Du fait des grandes disparités alléliques, les régions subtélomériques ont été parmi les premiers CNV (variation du nombre de copies) mis en évidence (Redon et al., 2006) (Figure 9c). Un exemple extrême est celui du bras court du chromosome 16, où la différence de taille entre le plus petit et le plus grand allèle est de 260 kb (Wilkie et al., 1991). Cette grande variabilité allélique traduit les remaniements constants et les échanges de duplicons dont les subtélomères sont les objets. Par exemple, le bloc 7501 est présent en une 47 seule copie chez les primates non humains mais en 7 à 11 copies chez l’Homme. Il est porté par les extrémités 3qter, 15qter et 19pter mais beaucoup d’autres combinaisons ont été décrites en fonction de l’origine géographique. Ceci illustre une dynamique constante et une évolution récente (Mefford & Trask, 2002). Il a été estimé, en effet, que 49% des séquences subtélomériques ont été générées après la divergence Homme-chimpanzé (Linardopoulou et al., 2005). La formation des subtélomères proviendrait de translocations impliquant l’extrémité des chromosomes suivies de la transmission d’un complément déséquilibré à la descendance. La présence d’un polymorphisme segmentaire prédisposerait à de nouveaux réarrangements qui seraient à l’origine de nouveaux polymorphismes (Linardopoulou et al., 2005) (Figure 10). Le mécanisme majeur impliqué dans ces réarranegements est le NHEJ (92%) alors que la recombinaison homologue non-allélique (“Non Allelic Homologous Recombination” NAHR) n’interviendrait que rarement (8% des cas) (Linardopoulou et al., 2005). L’évolution des blocs chromosomiques n’est donc pas indépendante mais est marquée par de constantes interactions entre les chromosomes.
1. INTRODUCTION |