Euphémisation et hypertrophie des relations marchandes sur Twitch
Chromatine de la drosophile
L’acide désoxyribonucléique, ou ADN, est un macromolécule qui contient l’information génétique qui permet à un organisme de se développer, fonctionner et de se reproduire. L’ADN est un enchainement de nucléotides formés à partir d’adénine (A), thymine (T), guanine (G) ou de cytosine (C), briques élémentaires de l’information génétique. Illustré à la Figure 1.1, l’ADN est un appariement de deux brins complémentaires et adopte une structure en double hélice, connue depuis la publication historique de Watson et Crick [2] de 1953. Chaque base d’un brin s’associe à sa base complémentaire de l’autre brin formant une paire de bases (bp), unité structurale de l’ADN. Adenine Thymine Guanine Cytosine Colonne sucre-phosphate Paire de bases Base azotée Figure 1.1 – Schéma de la structure en double hélice de l’ADN . Les organismes vivants se divisent en deux catégories : les eucaryotes et les procaryotes. Les premiers voient leur matériel génétique séparé du reste de la cellule par une membrane (nucléaire) délimitant le noyau, tandis que celui des seconds cohabite avec le reste de la cellule. Le terme « eucaryote » vient du grec ancien ευ et κάρυον signifiant respectivement « vrai » et « noyau » : possédant un « vrai noyau », par opposition aux « procaryotes » qui n’en ont pas. Le schéma de la Figure 1.2 présente la structure type d’une cellule eucaryote et permet d’en identifier le noyau. Figure 1.2 – Schéma d’une cellule eucaryote .
Chromatine
Historiquement, c’est le biologiste allemand Walther Flemming qui est le premier à avoir observé et décrit le contenu du noyau cellulaire (eucaryote). Il constate que le noyau est rempli d’une substance qu’il appelle chromatine pour son affinité avec les colorants. …in view of its refractile nature, its reactions, and above all its affinity to dyes, is a substance which I have named chromatin. [5] Figure 1.3 – Euchromatine et hétérochromatine [6]. La chromatine est la structure au sein de laquelle se trouve l’ADN dans le noyau des cellules (eucaryotes). Elle existe sous deux formes, que l’on peut voir à la Figure 1.3, qui reflètent le niveau d’activité de la cellule : 1. L’hétérochromatine se présente sous la forme de petites régions irrégulières, foncées et éparpillées dans le noyau, le plus souvent accumulées à proximité de l’enveloppe nucléaire. 2. L’euchromatine correspond aux régions plus claires et répandues dans tout le noyau. Elle ne se colore pas facilement. Aujourd’hui, on sait que l’euchromatine est prévalente dans les cellules qui sont actives dans la transcription de plusieurs de leurs gènes, tandis que l’hétérochromatine est plus abondante dans les cellules qui sont moins actives ou non actives [6].
Nucléosome
Depuis Walther Flemming, on sait que l’ADN s’associe à des protéines architecturales, appelées histones, pour former un complexe que l’on appelle nucléosome. Chaque nucléosome enroule de 146 à 147 paires de bases (bp) d’ADN. Les nucléosomes s’enchainent constituant la fibre de chromatine. Ils sont présents et très conservés chez tous les eucaryotes. Figure 1.4 – Nucléosome [7]. Conformément à la Figure 1.4, l’ADN (en bleu foncé) s’enroule autour d’un cœur d’histones (en bleu clair, en vert, en violet et en jaune) formant le nucléosome. Les histones H2A (en bleu clair), H2B (en vert), H4 (en violet) et H3 (en jaune) possèdent des queues riches en acides aminés basiques, notamment des lysines (en rouge). Ces queues n’ont pas de structure secondaire, i.e. elles ne se replient pas de façon structurée en hélice α ou en feuillet β. Figure 1.5 – Fibre de chromatine [8]. Conformément à la Figure 1.5, les histones se positionnent de manière ordonnée le long de l’ADN. Deux nucléosomes sont régulièrement espacés par un ADN de liaison d’une longueur de l’ordre de 50 bp. Cette régularité permet aux nucléosomes de s’agencer en une fibre dont l’architecture peut, en principe, s’adapter aux contraintes dues à la régulation de l’expression génétique.
Épigénétique
Les lysines présentes sur les queues des nucléosomes sont le lieu de modifications biochimiques qui n’altèrent pas l’information génétique encodée. C’est pourquoi, on parle de modifications épigénétiques, littéralement à la surface des gènes. N H 2 O H 3 N + O H 3 C H N O N H 2 C H 3 H 2 N + O N H 2 C H 3 H N + O N H 2 C H 3 N H 2 C H 3 N + O C H 3 H 3 C Histone Acetyltransferase Lysine Acetyltransferase (HAT, KAT) Histone deacetylase (HDAC) SAH SAM ac-coA coA Histone methyltransferase (HMT) Histone demethylase (KDM) Trimethyl-lysine Dimethyl-lysine Monomethyl-lysine Lysine Acetyl-lysine Figure 1.6 – Modifications post-transcriptionnelles des lysines [9]. Conformément à la Figure 1.6, l’extrémité réactive de la lysine est chargée positivement. Elle peut être méthylée jusqu’à trois fois, conservant sa charge, ou acétylée, lui faisant perdre sa charge. H3 tails H2A/H2B acidic patch acetylation (tri)methylation H4K16ac Global acetylation level H3 acetylation H4 Tails H3K9me3 and HP1 H3K27me3 and Polycomb (a) (b) (c) (d) Figure 1.7 – Réarrangements des nucléosomes [9]. Bien qu’elles n’affectent pas la séquence génétique, ces modifications épigénétiques modulent à la fois l’expression des gènes marqués, ainsi que l’agencement des nucléosomes entre eux. On parle aussi de marques épigénétiques. Comme l’illustre la Figure 1.7, le cœur d’histones possède une partie acide chargée négativement (a) sur laquelle peut venir se fixer une lysine d’une queue d’un histone voisin (b), conférant ainsi une structure tassée à la fibre non modifiée. En acétylant les lysines, elles perdent leur charge et ainsi leur capacité à se fixer aux autres nucléosomes. Il en découle une décondensation de la fibre de nucléosomes (b, en bas). De plus, les triméthylations peuvent être reconnues par des protéines, notamment les complexes répresseurs Polycomb-1 (PRC1) qui viennent réprimer les gènes marqués et condenser la fibre de nucléosomes. Chez les organismes eucaryotes, il apparait alors une forte corrélation entre marquages épigénétiques, structure de la fibre de nucléosomes et régulation de l’expression des gènes.
Chromatine de la drosophile
Les eucaryotes vont d’unicellulaires, telle que la levure, aux mammifères en passant par la drosophile. Ils ont tous une organisation nucléaire différente, de complexité croissante [9]. Chez la levure, les chromosomes sont en permanence ancrés par leur centromère à la membrane nucléaire et s’organisent en brosse de polymères . Chez la drosophile, les chromosomes sont partitionnés en domaines épigénétiques qui se replient sur eux-mêmes [12]. Chez les mammifères, par dessus les domaines épigénétiques s’ajoutent d’autres mécanismes de régulation telles que les boucles à extrusion [13, 14]. On s’intéresse, ici, à l’organisation nucléaire de la drosophile qui est riche du point de vue de la physique. L’enjeu à terme est de pouvoir comprendre graduellement la complexité de l’organisation nucléaire des mammifères (et notamment de l’être humain) par l’intermédiaire d’un système plus simple telle que la drosophile. La chromatine se structure à différentes échelles. Je vais présenter la vision historique, puis revenir sur l’approche moderne de l’architecture de la chromatine.
Approche structurale
L’existence in vitro d’une fibre de nucléosomes, dite de 30 nm [15], a montré que la chromatine pouvait se structurer et se replier de manière régulière sur plusieurs ordres de grandeur, potentiellement, jusqu’à l’échelle du chromosome tout entier (cf. Figure 1.8). Cependant, l’existence in vivo d’une telle fibre n’a jamais été prouvée [16]. La chromatine est une fibre, dite de 11 nm, très désordonnée, dont on sait peu de choses sur son organisation spatiale à plus grandes échelles. 30-nm chromatin bre of packed nucleosomes Section of chromosome in an extended form Condensed section of chromosome Entire mitotic chromosome Centromere Short region of DNA double helix 2 nm 11 nm 700 nm 1,400 nm 30 nm 300 nm « Beads on a string » form of chromatin Figure 1.8 – Structuration de la chromatine sur plusieurs échelles [17].
Approche architecturale
À l’échelle du noyau (cf. Figure 1.9), les chromosomes ne se mélangent pas et restent invariablement confinés dans leur territoire chromosomique. Chaque chromosome est partitionné en domaines épigénétiques formant des blocs continus de chromatine qui se replient physiquement sur eux-mêmes. Figure 1.9 – Architecture de la chromatine, modifiée de Sexton et Cavalli [18]. De telles structures sont mises en évidence expérimentalement à l’aide de cartes de contact (cf. Figure 1.10), permettant de décrire les contacts que chaque région du génome établit avec les autres. On les obtient avec des techniques de capture conformationnelle de chromosomes (3C, 5C, Hi-C [19–21]). On y reporte le nombre de fois 8 qu’un site génomique i a été en contact avec un site j, donnant après normalisation une carte de probabilité de contact. Figure 1.10 – Les carrés jaunes sur la diagonale de la matrice de contact représentent les domaines physiques. Ils sont corrélés aux domaines épigénétiques (rouges, noirs ou bleus) [12]. Filion et al. [22] ont effectué une analyse en composantes principales sur 53 protéines liées à la chromatine et sur 4 modifications des histones, qui permet d’identifier 5 combinaisons de marques épigénétiques de la chromatine, appelées couleurs de la chromatine (cf. Figure 1.11). Les couleurs s’organisent en domaines épigénétiques continus qui forment une partition des chromosomes et tendent à se replier sur eux-mêmes pour former des structures tridimensionnelles, appelées domaines physiques (cf. Figure 1.10). Par ailleurs, les couleurs sont corrélées à l’état d’activité transcriptionnelle des gènes au sein des domaines. Figure 1.11 – Les 5 couleurs de la chromatine de Filion et al Les domaines au sein de la chromatine rouge et jaune sont activement transcrits, tandis que les gènes se trouvant dans la chromatine bleue sont réprimés par les protéines du groupe Polycomb. Les domaines de la chromatine noire sont, quant à eux, inactifs, i.e. dans un état latent. La disposition des couleurs sur les chromosomes caractérise un type cellulaire. C’est la mise en place de ces marques épigénétiques qui est responsable de la différentiation cellulaire.
Imagerie des domaines épigénétiques
Jusqu’à l’apparition des techniques de microscopie super-résolue, la seule façon de visualiser la structure des domaines épigénétiques était par le biais de méthodes chimiques (Hi-C), destructives donnant la structure moyenne sur une population de plusieurs millions de cellules.
Microscopie super-résolue
La structure des domaines épigénétiques est longtemps restée hors d’atteinte par les techniques physiques d’imagerie. Conformément à la Figure 1.12, d’un côté, la cristallographie aux rayons X est limitée par la structure désordonnée de la fibre de chromatine de 11 nm et ne permet pas de remonter plus haut. De l’autre côté, le pouvoir de résolution des instruments optiques est intrinsèquement limité par la diffraction et ne permet pas de descendre plus bas que le chromosome. Figure 1.12 – Limites de résolution expérimentale . La microscopie super-résolue permet de descendre en dessous de la limite de résolution optique et d’imager la structure d’un domaine épigénétique dans une seule cellule. Ce qui permet non plus d’accéder à la structure moyenne, mais à la structure instantannée des domaines épigénétiques. Une image super-résolue a une résolution de l’ordre de quelques dizaines de nanomètres, bien inférieure à la limite de résolution optique. Elle est obtenue grâce à différentes techniques, en particulier des méthodes de traitement d’images. Figure 1.13 – Principe du STORM [24]. Prenons l’exemple de la microscopie de reconstruction optique stochastique, ou Stochastic Optical Reconstruction Microscopy (STORM) en anglais, dont le principe est illustré à la Figure 1.13. Le principe consiste à échantillonner aléatoirement l’image en faisant scintiller des sondes fluorescentes accrochées à l’objet à imager. Ainsi, on peut séparer le centre des taches lumineuses produites par les sondes et reconstruire l’image complète en superposant les clichés obtenus. Ce qui n’aurait pas été possible si les sondes avaient été toutes illuminées en même temps.
Les données analysées
En 2016, Boettiger et al. publient des images super-résolues de domaines épigénétiques de la drosophile dans trois couleurs épigénétiques différentes. Ces couleurs sont caractérisées par des marquages épigénétiques spécifiques et corrélés à un état d’activité de transcription des gènes : actif, inactif ou réprimé. 18.85 18.95 19.05 (Mb) Chromosome 3L 7.30 7.40 7.50 (Mb) Chromosome 2R 8.95 9.05 9.15 (Mb) −1 0 1 2 Marker enrichment −1 0 1 2 Marker enrichment −1 0 1 2 Marker enrichment Chromosome 2R Genomic coordinate A-16 I-06 R-07 Active Inactive Represse d H3K4me2 unmod-H3 H3K27me3 Figure 1.14 – Enrichissement en marqueurs. Les domaines sont labellisés grâce à la méthode de séquençage par immunoprecipitation de chromatine ou Chromatin ImmunoPrecipitation Sequencing (ChIP-Seq) en anglais, qui permet de mesurer l’enrichissement des domaines en H3K4me2, unmod-H3 et H3K27me3 (cf. Figure 1.14). Si l’un de ces marqueurs prévaut sur les autres alors le domaine sera dit respectivement actif, inactif ou réprimé. Les marquages correspondent : — H3K4me2 à la diméthylation (me2) de la lysine 4 (K4) de l’histone 3 (H3). — unmod-H3 à l’absence de modification biochimique (unmod) de l’histone 3 (H3). — H3K27me3 à la triméthylation (me3) de la lysine 27 (K27) de l’histone 3 (H3). A-16 I-06 R-07 1 μm x 250 nm y z x y z x y z Figure 1.15 – Domaines épigénétiques super-résolus [1]. À l’aide des images tridimensionnelles super-résolues (cf. Figure 1.15), les auteurs ont réalisé des mesures de rayon de giration d’un domaine épigénétique donné dans une population de cellules Kc167. Le rayon de giration représente la taille caractéristique de l’objet dans l’espace. Il sera défini au chapitre 2. 100 Domain length (kb) Radius of gyration (nm) 200 500 c = 0.37 ± 0.02 c = 0.30 ± 0.02 c = 0.22 ± 0.02 101 102 c = 0.35 ± 0.02 Figure 1.16 – Lois de puissance du rayon de giration [1]. En reportant le rayon de giration médian (en nm) obtenu pour les domaines d’un même état épigénétique en fonction de leur longueur (en kb 1 ), on observe Figure 1.16, en échelle logarithmique, un comportement en loi de puissance différent pour les trois états. Ce qui semble raisonnable. En effet, l’architecture des domaines joue un rôle clé dans la régulation des gènes en leur sein. On peut donc s’attendre à ce que l’architecture spécifique des trois états d’activité se reflète dans la manière dont le rayon de giration croit avec la longueur du domaine. Par exemple, les domaines réprimés sont revêtus d’une marque H3K27me3 qui va recruter une protéine PRC1 qui va venir compacter la fibre (cf. Figure 1.7). Du point de vue du physicien, le marquage épigénétique définit des interactions spécifiques au sein d’un domaine. On observe bien, ici, que l’évolution du rayon de giration en fonction de la taille des domaines dépend de la nature des interactions. Pour une longueur donnée, un domaine réprimé sera plus compact (aura un rayon de giration plus petit) qu’un domaine actif ou inactif. Comme on le verra au chapitre 3, cette évolution en lois de puissance, i.e. droites en échelle logarithmique, a une justification simple en physique des polymères.
Introduction |