La microscopie pour une meilleure visualisation des processus de régulation génique

Télécharger le fichier original (Mémoire de fin d’études)

Les familles de facteurs de transcription

Les facteurs de transcription à doigt de zinc

Le domaine de liaison à l’ADN de cette famille de FT contient neuf répétitions d’une séquence de 30 a.a (Miller et al., 1985). Chacune de ces répétitions contient deux paires de cystéine et histidine qui entourent un unique atome de zinc, le nom « doigt de zinc » provient de la structure qui en résulte. L’extrémité de ces doigts établit un contact direct avec le grand sillon de l’ADN, en alternance sur un côté ou l’autre de la double hélice (Klug and Rhodes, 1987) (Figure 8A).
Le premier FT à avoir été purifié s’avère être un membre de cette famille. Le facteur de transcription III A (TFIIIA) joue un rôle critique dans la transcription des gènes à ARN ribosomaux 5S par l’ARN polymérase III (ARNPIII) (Sakonju and Brown, 1982). Un autre exemple de FT à doigt de zinc est la protéine Krüppel (Kr) chez la Drosophile. Elle est exprimée dans un domaine restreint pendant le stade blastoderme de l’embryogenèse et est impliquée dans le contrôle du développement des segments abdominaux et thoraciques de la mouche (Klug and Rhodes, 1987; Licht et al., 1990). Une mutation ponctuelle dans l’un des motifs à doigt de zinc de Kr entraîne l’apparition d’une mouche mutante identique à celle obtenue lors de la délétion complète du gène (Redemann et al., 1988). L’aptitude à fixer le zinc est donc essentielle pour la fixation à l’ADN et par conséquent au bon fonctionnement du FT.

Le motif hélice-tour-hélice (HTH)

Les protéines à homéodomaine (HD) sont conservées au cours de l’évolution puisqu’elles sont présentes dans l’intégralité du règne Eukaryote, des organismes unicellulaires jusqu’aux plantes, champignons et animaux (Bürglin and Affolter, 2016). Les FT à HD représentent 15 à 30% de tous les FT, qui régulent des processus aussi divers que la formation des axes (Pick and Heffer, 2012), la maintenance des cellules souches (Dolzblasz et al., 2016) ou encore les réponses métaboliques (Tao et al., 2016; Wu et al., 2011). La plupart des FT à HD se fixent à l’ADN pour contrôler l’activité d’autres gènes.
L’HD contient un motif hélice-tour-hélice (HTH) (Figure 8D), motif déjà présent dans certaines recombinases bactériennes (Laughon and Scott, 1984; Scott et al., 1989). A l’intérieur de ce motif, une hélice-α est suivie par un tour-α et de nouveau par une hélice-α (Laughon and Scott, 1984). La première hélice-α est disposée en travers du grand sillon de l’ADN, alors que la deuxième, connue comme l’hélice de reconnaissance, se positionne partiellement dans le grand sillon et établit des contacts séquence-spécifiques avec l’ADN (Ptashne, 1986).
L’exemple le plus pertinent est celui des protéines Hox. Elles sont codées par les gènes homéotiques et jouent un rôle critique dans le développement embryonnaire mais aussi dans l’organogenèse chez l’adulte. Ce sont des FT dont l’HD est fortement conservée entre les différents gènes (Bobola and Merabet, 2017a; Latchman, 1990). Des motifs HTH sont aussi retrouvés dans les protéines de régulation transcriptionnelle du type sexuel chez la Levure (Nasmyth and Haering, 2005; Shepherd et al., 1984), dans diverses protéines d’Amphibiens et de Mammifères (Akam, 1989) et chez les Plantes comme l’Antirrhinum (Sommer et al., 1990).

La glissière à leucine et domaines basiques de liaison à l’ADN

Dans cette structure, des résidus de leucine sont espacés de sept a.a à l’intérieur d’une hélice-α. Les leucines apparaissent tous les deux tours du même côté de l’hélice. La glissière ainsi formée, facilite la dimérisation de protéines par interdigitation de deux hélices différentes contenant ces répétitions de leucines. De la dimérisation, résulte une conformation qui expose une région adjacente, souvent basique, qui peut interagir directement avec l’ADN acide (Gentz et al., 1989; Landschulz et al., 1989) (Figure 8B). La glissière à leucine est présente dans différents FT comme le FT spécifique du foie C/EBP, le facteur GCN4 chez la Levure, et les protéines proto-oncogènes Myc, Fos et Jun (Abel and Maniatis, 1989; Landschulz et al., 1989).
Le domaine basique est associé à une région adjacente qui forme une structure en hélice-boucle-hélice (HBH) (Murre et al., 1989). Comme la glissière à leucine, la conformation HBH cause une dimérisation des protéines permettant la liaison à l’ADN par le domaine basique adjacent (Murre et al., 1989; Prendergast and Ziff, 1989) (Figure 8C). Ces domaines sont identifiés dans un certain nombre de régulateurs trancriptionnels comme la protéine régulatrice MyoD1 (Tapscott et al., 1988) et la protéine Daughterless chez la Drosophile (Caudy et al., 1988).
Il existe donc différentes structures de fixation à l’ADN séquence-spécifique. Plusieurs d’entre elles sont communes à des FT distincts. Des différences dans la séquence précise du motif dans chaque facteur contrôlent la spécificité de la séquence d’ADN à laquelle il se lie. Bien que la fixation à l’ADN soit un prérequis nécessaire à un FT pour affecter la transcription, ce n’est pas suffisant. Ces facteurs doivent également interagir avec d’autres facteurs ou l’ARNPII elle-même pour moduler la transcription.
Figure 8 : Les différents types de FTs. (A) Le schéma représente la fixation d’un FT à doigt de zinc sur le grand sillon de l’ADN. (B) La glissière à leucine est formée par dimérisation de deux FTs et intéragit avec l’ADN via le domaine basique. (C) Le domaine basique s’associe à une région adjacente et forme une structure hélice-boucle-hélice. (D) La structure hélice-tour-hélice est présente dans les FT à homéodomaine. La première hélice est placée dans le grand sillon et la deuxième hélice est appelée hélice de reconnaissance. Issue de Medical Physiology, 3rd Edition Transcription Factors.

L’action des facteurs de transcription sur la transcription

En général, les domaines d’activation sont distincts des régions de liaison à l’ADN. Ceci indique que les FT ont une structure modulaire avec différentes régions qui ont chacune des activités indépendantes. Les membres de la famille des récepteurs des hormones thyroïdiennes (Evans, 1988), où des régions distinctes de la protéine induisent la liaison à l’ADN, l’activation transcriptionnelle et la fixation de l’hormone, illustrent ce mécanisme.
Une comparaison des domaines d’activation des FT montre qu’ils ne partagent pas d’homologie de séquence, mais qu’ils possèdent une grande proportion d’a.a acides (Ptashne, 1986; Sigler, 1988). Ces domaines d’activation acides semblent, le plus souvent, s’associer à d’autres FT pour former un complexe transcriptionnel basal, qui interagit avec l’ARNPII par la suite (Latchman, 1993). Ces a.a sont arrangés pour former une hélice-α amphipathique qui peut activer la transcription lorsqu’elle est liée au domaine de fixation à l’ADN. Si les a.a du domaine d’activation du FT GAL4 de la Levure, sont placés de façon arbitraire, il n’est plus en mesure d’activer la transcription. Cela montre l’importance de l’arrangement précis de ces a.a acides. Bien que ces domaines d’activation acides se retrouvent de la Levure à l’Homme, d’autres domaines d’activation non-acidiques, sont aussi décrits.
Pour faciliter la transcription, les FT peuvent aussi interagir directement avec l’ARN polymerase, comme évoqué précédemment (Sigler, 1988), ou avec d’autres facteurs de fixation à l’ADN comme le facteur de liaison à la TATA box TFIID (Sawadogo and Roeder, 1985). Le FT GAL4 ou le FT ATF (chez les Mammifères), engagent un changement de conformation de TFIID déjà fixé. De cette façon, plutôt que de contacter uniquement la TATA box, ils contactent aussi le site d’initiation de la transcription (Horikoshi et al., 1988).
Une mutation dans un FT peut se traduire par un manque de spécificité dans l’expression génique menant à l’apparition d’une maladie. Par exemple, des mutations dans le FT Pit-1, appartenant à la famille de FT POU, provoquent l’échec du développement de la glande pituitaire et une faible expression du gène codant pour l’hormone de croissance. Le nanisme résulte de ce défaut développemental (Radovick et al., 1992). Dans le cas de l’hémophilie B, le FT nécessaire à la transcription du gène facteur IX est présent, mais n’est pas capable de se fixer au promoteur du gène entraînant un échec de la transcription du gène (Crossley and Brownlee, 1990).

Répartition des facteurs de transcription dans l’environnement nucléaire

Pour assurer leur fonction de régulateur de gènes efficacement, les FT sont souvent regroupés dans des zones délimitées du noyau, comme les usines à transcription. Ces regroupements de FT pourraient se former par l’interaction de leurs régions désordonnées, ce phénomène s’appelle séparation de phase.

Séparation de phase et condensats transcriptionnels

De récentes études suggèrent qu’un processus coopératif de séparation de phase, qui implique des interactions multivalentes entre les FT, cofacteurs et ARNPII, pourrait être à l’origine de l’assemblage de ces condensats ou clusters de ces facteurs sur les éléments enhancers spécifiques (Boija et al., 2018; Chong et al., 2018; Hnisz et al., 2017; Tsai et al., 2017). De plus, la présence de tels clusters sur un locus génomique, peut prédire la présence d’un élément enhancer (Berman et al., 2002; Markstein et al., 2002; Rajewsky et al., 2002).
La formation de ces condensats transcriptionnels implique des protéines caractérisées par la présence de régions intrinsèquement désordonnées (RIDs) dans leur structure (Boija et al., 2018; Cho et al., 2018; Sabari et al., 2018) (Figure 9). A l’aide de modèles informatiques et de reconstitutions in vivo, Shrinivas et al. (Shrinivas et al., 2019) ont montré que la condensation de FT et coenhancers sur des éléments d’ADN, est basée sur la valence des sites de fixation des FT, leur densité et leur spécificité. L’étude révèle un seuil précis du nombre de sites de fixation qui permet la formation des clusters. En effet, en modulant l’affinité, le nombre ou la densité d’interactions FT-ADN et la force des interactions RID-RID, cela impacte la formation des condensats. Pour qu’ils se forment, l’interaction FT-ADN est aussi importante que les faibles interactions multivalentes entre RIDs. Des analyses bioinformatiques à l’échelle du génome montrent que les caractéristiques des RID marquent des régions activatrices connues. La formation de ces clusters transcriptionnels pourrait contribuer à l’organisation et aux interactions génomiques à longue portée (Shrinivas et al., 2019).
Il est aussi important de noter que les sites de faible affinité peuvent contribuer à l’échaffaudage des condensats transcriptionnels, s’ils sont en assez grand nombre et densité. Cela supporte les travaux évoqués précédemment sur les enhancers svb et autres (Crocker et al., 2015a; Tsai et al., 2017). L’arrangement des microenvironnements ou « hubs » de FT, décrits précédemment, serait autorisé par le processus de séparation de phase médiée par interactions entre les domaines désorganisés des différents facteurs (Cisse et al., 2013; Furlong and Levine, 2018; Ghavi-Helm et al., 2014; Mir et al., 2017) (Figure 9). En revanche, les séquences d’ADN comportant un grand nombre de sites de haute affinité, distribués à faible densité locale ne correspondent pas à des régions activatrices car elles ne permettront pas la formation des condensats.
Les interactions RID-RID sont relativement peu spécifiques et les RIDs d’un même coenhancers peuvent s’assembler à différents loci. Ceci corrobore le fait que les clusters de FT prédisent souvent la localisation des enhancers actifs puisqu’un mécanisme commun régit la formation de ces-derniers sur ces séquences d’ADN (Berman et al., 2002; Markstein et al., 2002; Rajewsky et al., 2002).
Ce mécanisme peut être étendu à d’autres condensats formés sur des loci génomiques spécifiques. Cela pourrait inclure les condensats dans l’organisation de l’hétérochromatine (Larson et al., 2017; Strom et al., 2017), la formation des paraspeckles contenant de longs ARN non-codants (lncARN) (Fox et al., 2018; Yamazaki et al., 2018), l’assemblage des nucléoles (Feric et al., 2016; Pederson, 2011), ou encore la répression transcriptionnelle par les protéines polycomb (Tatavosian et al., 2018). Des avancées récentes en microscopie à l’échelle nanoscopique (Li et al., 2019), pourraient donner de nouvelles informations sur la capacité de ces condensats à former des sub-structures d’odre supérieur comme le nucléole (Feric et al., 2016).
Figure 9 : Modèle de condensat
transcriptionnel. Les FTs et coactivateurs forment un condensat formé par séparation de phase. Dans ce modèle, les condensats incorporent des interactions dynamiques (RID-RID) et structurées. Issue de (Boija et al., 2018).

D’autres domaines nucléaires contiennent des FT

Les FT sont généralement concentrés en de nombreux foci répartis au sein du nucléoplasme (Grande et al., 1997a; van Steensel et al., 1995). Ils sont localisés dans des structures diverses comme les speckles, paraspeckles, nucléoles, corps de Cajal etc. En immunofluorescence, le marquage des FT montre un profil en points, cohérent avec les descriptions précédentes (Lamond and Earnshaw, 1998; Spector, 2001).
Corps de Cajal ou corps spiralés
Certains FT comme Oct1, TFIIH (p62), le récepteur aux glucocorticoïdes (RG), E2F-1 et TFIIF (RAP74), occupent des domaines de petite taille, interconnectés, à travers le nucléoplasme, en excluant les nucléoles. En plus de ce marquage pointilliste, TFIIH et TFIIF sont retrouvés dans différents foci. Dans 30% des cas, Oct1 montre un large domaine (>1,5 µm), souvent localisé à proximité d’un nucléole. Dans quelques zones, les sites de transcriptions (marquage BrUTP) et ces domaines contenant différents FT se chevauchent. Cependant, dans de nombreux cas, les domaines de FT ne montrent qu’un faible marquage BrUTP ou une absence de ce-dernier et vice versa. Une grande fraction des FT analysés dans cette étude est regroupée en clusters mais n’est pas impliquée dans l’activation de la transcription. La distribution pointilliste de TFIIH et TFIIF ne montre aucune relation. Sauf dans les foci contenant une haute concentration de ces deux facteurs. Ces foci sont appelés « corps spiralés » (Figure 10). Les RG et E2F-1 ne co-localisent pas non plus.
Les corps spiralés, aussi appelés corps de Cajal, sont souvent liés à la périphérie du nucléole, et sont composés de petites ribonucléoprotéines nucléaires (snRNPs, sous-unités des complexes d’épissage) et de composants du nucléole (Bohmann et al., 1995) (Figure 10). Ces différents domaines pourraient représenter des complexes d’initiation de la transcription incomplets ou des complexes inhibiteurs dont la plupart sont dépourvus de l’ARNPII. Ces clusters riches en FT peuvent aussi être des sites de stockage d’où ils peuvent être recrutés efficacement en cas de nécessité (Grande et al., 1997b).
Les FT dans le nucléole
La transcription spécifique des gènes codant pour les ARN ribosomaux (ARNr), par l’ARN polymerase I (ARNPI), requiert au moins deux FT, le facteur se fixant en amont (UBF) et le facteur de sélectivité du promoteur (TBP/SL1) (Bell et al., 1988; Schnapp and Grummt, 1991). Des immunomarquages montrent, de façon claire, que les facteurs UBF et TBP et l’ARNPI colocalisent avec les foci de transcription présents dans le nucléole (Figure 10) de cellules en croissance active (Carmo-Fonseca et al., 1996).
Les speckles nucléaires (SNs) ou clusters de granules interchromatiniennes (IGCs)
Les speckles nucléaires sont un des corps nucléaires les plus abondants (Figure 10). Ce terme est réservé à un corps nucléaire particulier, avec une taille entre 0,3 et 3 µm et une quantité variant entre quelques uns à une dizaine (Hall et al., 2006; Spector and Lamond, 2011). Presque tous les composants protéiques contenus dans les SNs sont des facteurs impliqués dans la transcription, le processing post-transcriptionnel de l’ARN, ou l’export des ARNs. Par conséquent, leur localisation peut varier : liaison à des loci actifs, des transcrits naissants, des pré-ARN messagers (ARNm) et/ou d’autres accumulations focalisées (Chen and Belmont, 2019).
Contrairement à ce qui était postulé auparavant, la sur-représentation des protéines d’épissage au sein des SNs n’est pas confirmée par les données plus récentes. En effet, ces nouvelles informations ont révélé que les protéines les plus représentées dans les SNs jouent un rôle dans la transciription, incluant FT et facteurs de remodelage de la chromatine (Galganski et al., 2017).
Les FT dans les granules de stress
Un trait caractérisique d’un stress, au sein de cellules humaines, est l’organisation de du FT HSF1 sous forme de structures sub-nucléaires, appelées granules de stress (GSs) (Alastalo et al., 2003). HSF1 est le FT de choc thermique le plus étudié. Il répond à des températures élevées et d’autres formes de stress induisant une dégradation des protéines (Pirkkala et al., 2001). HSF1 n’est pas le seul composant des GSs, des protéines de liaison à l’ARN et certains facteurs d’épissage ont aussi été identifiés dans ces domaines (Denegri et al., 2001; Weighardt et al., 1999).
Domaines OPT
Les FT, PTF et Oct1, activent la transcription de gènes codant pour les petits ARNs nucléaires (snARNs) et d’autres intervenant dans la maturation des ARNs. Ils se fixent à des éléments de séquence proximaux et distaux (PSEs et DSEs), présents au sein des promoteurs et activent la transcription par l’ARNPII ou l’ARNPIII (Hernandez, 1992).
Figure 10 : Les domaines nucléaires. Ce schéma donne une vue d’ensemble des différents domaines nucléaires. Chaque domaine est associé à une image en microscopie à fluorescence. Issue de (Spector, 2001).
PTF et Oct1 sont concentrés dans des domaines de grande taille, à un certain stade du cycle cellulaire : la phase G1. Chaque domaine contient quelques usines de transcription. Ils sont appelés « domaines OPT » (Figure 10). D’autres types de FT peuvent aussi s’y ajouter, comme la protéine de fixation p53 1 (53BP1), ainsi que les polymérases. Mais aucun facteur d’épissage n’est détectable (Pombo et al., 1998).
Il est également intéressant de remarquer que ces domaines colocalisent avec le variant d’histones γH2AX et MDC1, ce qui est une caractéristique des sites de dommage à l’ADN. Les domaines OPT sembleraient donc se former au niveau de ces sites (Harrigan et al., 2011).
Le clastosome
Dans le noyau des cellules eukaryotes, la majorité des protéines avec une courte durée de vie, est dégradée par la voie ubiquitination-protéasome (Rock et al., 1994). Dans les cellules de Mammifères, il est connu que les protéasomes sont enrichis à l’intérieur de domaines nucléaires, nommés clastosome. Le clastosome concentre les protéasomes 20S et 19S, des « ubiquitin-conjugates » et des chaperons moléculaires comme Hsp70/HSC70. Le clastosome contient aussi certains substrats du protéasome comme les FT c-Fos et c-Jun (Lafarga et al., 2002). Ces structures ont aussi été montrées plus récemment dans les neurones dopaminergiques de cerveau humain (Korzhevskii et al., 2017).

Les interactomes sont la base de processus moléculaires multiples et variés

Les cellules vivantes sont le siège de nombreux processus biologiques. Ceux-ci sont médiés par des interactions complexes entre protéines. Ces réseaux d’interaction sont appelés interactomes. L’interactome humain serait composé d’environ 130 000 interactions protéiques binaires (Venkatesan et al., 2009). Ces interactions protéine-protéine (IPPs) sont souvent connectées entre elles et sont organisées en réseaux denses et dynamiques.

Les interactomes : généralités

La vision de l’organisation des cellules a changé au court des ans. Auparavant cataloguée comme un sac d’enzymes, elle est maintenant considérée comme un réseau complexe d’interactions macromoléculaires (Robinson et al., 2007; Vidal et al., 2011).
La science des réseaux traite de la complexité par la simplification du système. Les composants représentent les « nœuds » et les interactions entre eux sont représentées par les « arrêtes ». Les nœuds sont des métabolites et des macromolécules comme les protéines, les ARNs ou encore des séquences génomiques, alors que les liens/arrêtes sont des interactions physiques, biochimiques et/ou fonctionnelles. Ces-dernières peuvent être détectées par différentes techniques (détaillées plus loin). Les interactomes permettent d’extraire des informations théoriques globales ou locales. Lorsque ces propriétés sont démontrées, statistiquement différentes d’un réseau aléatoire, il est possible de revenir sur les processus biologiques initiaux et ainsi, mieux comprendre les mécanismes impliqués (Vidal et al., 2011).

Cartes des réseaux d’interactions protéine-protéine

Dans le cas des interactomes de protéines, les nœuds représentent les protéines alors que les lignes représentent des interactions physiques ou biochimiques entre deux protéines. Pour établir des cartes d’interactions à large échelle, deux méthodes dominent la science expérimentale. La cartographie d’interactions binaires est souvent effectuée à l’aide de différentes variations et améliorations de la technique du double-hybride chez la Levure (DH) (Dreze et al., 2010; Fields and Song, 1989). Le DH est basé sur une observation des FT Eukaryotes, organisés en deux domaines fonctionnels: le domaine de liaison à l’ADN (BD) et le domaine d’activation (AD) décrits précédemment (Causier, 2004; Fields and Song, 1989). Ces domaines sont physiquement séparables.
L’ADN complémentaire (ADNc) codant pour une protéine d’intérêt est fusionné au BD du FT, et l’AD est fusionné à un autre ADNc codant pour une autre protéine donnée. Les vecteurs ainsi élaborés permettent l’expression de protéines recombinantes au sein des Levures. Si les deux protéines d’intérêt interagissent dans le noyau des Levures, le BD et l’AD sont suffisamment proches pour activer la transcription du gène rapporteur. Celui-ci est sous le contrôle d’un promoteur qui contient les séquences reconnues par le BD (Figure 11).
Un des désavantages du DH est la génération de faux positifs et faux négatifs. Les faux négatifs sont des interactions non détectables dans le système « Levure ». Par exemple, certaines modifications post-traductionnelles, indispensables à l’interaction entre deux partenaires, ne sont pas possibles chez la Levure. Les faux positifs sont les IPPs qui surviennent chez la Levure, mais qui n’ont pas d’intérêt biologique.
Comme pour toutes les méthodes de détection d’IPPs, la validation des partenaires identifiés par une deuxième méthode est indispensable. Les validations les plus communes sont la co-immunoprécipitation et le pull-down (Paiano et al., 2019) (Figure 11). Ce type de purification, pour isoler des complexes protéiques, est suivi d’une analyse en spectrométrie de masse (AP/MS) pour identifier les constituants de ces complexes (Charbonnier et al., 2008; Rigaut et al., 1999). Le principe général de l’AP/MS implique l’immobilisation de la protéine d’intérêt ou « appât » sur un support solide (billes d’agarose ou magnétiques), et capturer les protéines « proies » à partir d’une phase soluble, mise au contact de l’appât sur une colonne (Figure 11). Les protéines purifiées sont digérées par des protéases (trypsine) afin de générer des peptides qui sont par la suite sous- fractionnés par chromatographie liquide à haute pression (HPLC). Ces fragments sont enfin ionisés et détectés par un spectromètre de masse (Dunham et al., 2012a).
Figure 11 : Schéma de techniques communes pour analyser des IPPs. Le Y2H, le cross-linking MS et le pull-down suivi de la spectrométrie de masse sont schématisés de haut en bas. Ces différentes techniques aboutissent toute à l’établissement d’un interactome plus ou moins complexe. Issue de (Pires and Boxem, 2018) (à gauche) et (Lin et al., 2011b) (à droite).
Une grande partie des interactomes connus pour les organismes modèles comme, S. cerevisiae, C. elegans et D. melanogaster, ont été générés par la technique du DH (Giot et al., 2003; Reboul et al., 2003; Uetz et al., 2000). C’est aussi le cas pour certains interactomes chez les humains (Rual et al., 2005; Venkatesan et al., 2009).
Chez l’Homme, les maladies peuvent être perçues comme une dérégulation de réseaux cellulaires interconnectés. Par conséquent, les maladies ne peuvent être considérées comme indépendantes les unes des autres. Cette vision des choses a mené à la création de multiples cartes de réseaux de maladies. S’il existe des relations phénotypiques entre différentes maladies, ces cartes permettent d’établir des liens entre celles-ci. De telles cartes ont été construites à partir d’associations gène-maladie collectées dans une base de données appelée OMIM (Goh et al., 2007). Dans ce type d’interactomes, les nœuds représentent les maladies et un lien est créé entre deux maladies si elles partagent au moins un gène commun ou une mutation commune. Ces réseaux recoupent significativement les interactomes d’IPPs. Cela montre la pertinence de ces interactomes (Goh et al., 2007).

Prédictions à large échelle

Pour l’étude des interactomes à large échelle, le domaine de la bioinformatique se développe fortement. De plus en plus de logiciels de prédiction d’IPPs sont en libre accès sur internet. Les méthodes de prédiction d’IPPs sont réparties en plusieurs catégories : données génomiques, séquences protéiques, structures protéiques, réseaux d’IPPs, expression génique et annotations de la fonction des gènes, de leur localisation et des processus. Les prédictions d’IPPs sont presque aussi pertinentes que les données expérimentales à large échelle (von Mering et al., 2002).
Par exemple, SCINET (single-cell imputation and network contruction) reconstruit l’ensemble des interactomes type-cellulaire spécifiques avec des profils d’expression de gènes cellule-unique. SCINET donne un contexte cellulaire virtuel qui permet d’interpréter des voies moléculaires et fonctionnelles. Il permet aussi de contextualiser des gènes associés à des maladies dans différents types cellulaires ou différentes conditions. De plus, il est possible d’étudier les dynamiques d’interaction au cours du développement normal ou pathologique (Mohammadi et al., 2019).
Une approche plus globale, non spécifique à l’interactome humain, utilise le machine-learning pour prédire les IPPs. Cela peut permettre de découvrir de nouvelles IPPs. Les IPPs prédites par cette méthode peuvent aussi être utiles pour déterminer des couples de protéines prioritaires pour les tests expérimentaux, et peuvent fournir des informations sur le contexte spécifique de l’IPP comme le tissue ou le phénotype. Les réseaux d’IPP découverts par des techniques bioinformatiques, suivies de validations expérimentales, peuvent être utilisés pour la prédiction de la fonction d’un gène (Mostafavi and Morris, 2012), l’identification de gènes impliqués dans une maladie (Navlakha and Kingsford, 2010) et enfin la découverte de nouveaux médicaments (Barabási et al., 2011; Sarkar and Saha, 2019).

Détection des interactions protéine-protéine in vivo

Les IPPs sont, par nature, dynamiques. Cela permet d’ajuster la réponse à différents stimuli et les conditions environnementales. Une lègère perturbation de telles interactions peuvent avoir des conséquences majeures sur le fonctionnement cellulaire et provoquer l’apparition de phénotypes pathologiques (Vidal et al., 2011). De plus en plus de technologies émergent ou évoluent pour permettre l’identification et la caractérisation d’IPPs.

Les tests par complémentation de fragments protéiques (CFPs) : généralités

Les CFPs sont basés sur la fusion de partenaires hypothétiques à deux fragments d’une protéine rapportrice (Michnick et al., 2000). L’interaction entre l’appât et la proie réunit les deux fragments du rapporteur, assez proches pour reconstituer la conformation et l’activité d’origine de ce-dernier (Michnick et al., 2016) (Figure 12). Différents types de protéines sont utilisées comme rapportrices : la réductase dihydrofolate (DHFR) (Pelletier et al., 1998), la β-lactamase (Galarneau et al., 2002), la protéase TEV (Wehr et al., 2008), la protéine fluorescente (PF) verte GFP et ses variants (Hu and Kerppola, 2003), la luciférase (Villalobos et al., 2007), etc. En fonction de la protéine utilisée, le « read-out » est différent : couleur, survie cellulaire, fluorescence etc.
La sélection du rapporteur dépend de l’objectif de l’étude et de la protéine appât. La DHFR est particulièrement utilisée pour les expériences impliquant les sélections de banque, alors que les PFs ou luminescentes sont plus adaptées pour étudier une IPP spécifique : sa localisation, ses dynamiques dans différentes conditions (inhibition, par exemple). Les PFs sont plus simples d’utilisation car le « read-out » est direct et aucun substrat n’est nécessaire (contrairement à la luminescence ou la DHFR) (Morell et al., 2009).
Figure 12 : Le concept de base de la complémentation par fragments protéiques. La partie supérieure représente le repliement unimoléculaire d’une protéine à partir d’un polypeptide synthétisé. La fragmentation en parties N-term et C-term permettent de fusioner chaque fragment à une protéine d’intérêt. Si ces protéines intéragissent, les deux moitiés de la prtoéine rapportrice se replient correctement et récupèrent leur activité (panneau du bas). La protéine rapportrice peut être une enzyme comme la DHFR, la β-lactamase, la protéase TEV ou une protéine fluorescente comme la GFP. Le « read-out » est différent en fonction de la protéine rapportrice utilisée. Schéma issu de (Michnick et al., 2016).
Complémentation de Fluorescence Bimoléculaire (BiFC)
La BiFC est basée sur la capacité d’une PF à être séparée en deux fragments non fluorescents. Chaque fragment est fusionné à un des partenaires potentiels, si les deux partenaires interagissent, les deux fragments se retrouvent à proximité et reconstituent une PF fonctionnelle (Figure 13). Ce phénomène se manifeste par un signal fluorescent détectable par microscopie ou cytométrie en flux (Kerppola, 2008; Zhang et al., 2016). Les IPPs peuvent alors être visualisées en cellules vivantes ce qui permet d’observer leurs localisations en direct. La méthode est très sensible, un avantage pour détécter des interactions protéiques faibles et/ou transitoires. Les protéines de fusion peuvent être exprimées à des niveaux physiologiques/endogènes.

Table des matières

CHAPITRE 1 Introduction
I. Régulation de l’expression génique par les facteurs de transcription
I.1. Promoteurs et enhancers transcriptionnels
I.1.1. Les promoteurs
I.1.2. Les enhancers transcriptionnels
I.1.2.1 Enhanceosomes Versus Billboards
I.1.2.2 Une régulation à distance
I.1.2.3 Concentration et affinité des facteurs de transcription sur leurs sites de fixation
I.2 Les facteurs de transcription
I.2.1. Les familles de facteurs de transcription
I.2.1.1. Les facteurs de transcription à doigt de zinc
I.2.1.2. Le motif hélice-tour-hélice (HTH)
I.2.1.3 La glissière à leucine et domaines basiques de liaison à l’ADN
I.2.2. L’action des facteurs de transcription sur la transcription
I.2.3 Répartition des facteurs de transcription dans l’environnement nucléaire
I.2.3.1. Séparation de phase et condensats transcriptionnels
I.2.3.2. D’autres domaines nucléaires contiennent des FT
I.3 Les interactomes sont la base de processus moléculaires multiples et variés
I.3.1 Les interactomes : généralités
I.3.1.1. Cartes des réseaux d’interactions protéine-protéine
I.3.1.2. Prédictions à large échelle
I.3.2 Détection des interactions protéine-protéine in vivo
I.3.2.1. Les tests par complémentation de fragments protéiques (CFPs) : généralités
I.3.2.2. Transfert d’énergie entre protéines fluorescentes ou bioluminescentes (FRET/BRET)
I.3.2.3 Méthodes pour marquer les protéines avoisinnantes avec la biotine
I.3.2.4 Essai de ligature de proximité (PLA)
Tableau récapitulatif de techniques de détection des IPPs
II. Les protéines Hox comme modèle d’étude de facteur de transcription
II.1. Les différentes fonctions des protéines Hox
II.1.1. Patterning des axes longitudinaux : des cnidaires à l’homme
II.1.2. Les autres fonctions des protéines Hox
I.2.2. Différents types de gènes cibles
II.2.3. Propriété de liaison à l’ADN des protéines Hox
II.2.3.1. Fixation monomérique des protéines Hox
II.2.3.2. Fixation à l’ADN avec les cofacteurs TALE
II.2.4. Les autres cofacteurs des protéines Hox
II.2.4.1. Les protéines Hox en partenariat avec la machinerie transcriptionnelle
II.2.4.2. Les protéines Hox en proche relation avec les régulateurs de la chromatine
II.2.4.3. Les cofacteurs modificateurs des protéines Hox
II.2.4.4. Les petits motifs comme plateforme de régulation des interactions
II.2.4.5. Recrutement de molécules non-protéiques par les protéines Hox
III. La microscopie pour une meilleure visualisation des processus de régulation génique
III.1 La microscopie super-résolution: un outil indispensable pour dépasser la limite de diffraction
III.1.1 Le principe de la microscopie super-résolution
III.1.2. Les méthodes de SR les plus utilisées : STED, SIM, SMLM
III.1.2.1. Stimulated-emission depletion microscopy (STED)
III.1.2.2. Microscopie par illumination structurée (SIM)
III.1.2.3. Single-molecule localization microscopy
III.2. La microscopie au service de la compréhension du génome et de sa régulation
III.2.1. L’organisation nucléaire à l’échelle super-résolutive
III.2.1.1. Le repliement de la chromatine et les régions chromosomiques à l’échelle super-résolutive
III.2.1.2. Les domaines topologiquement associés (TADs)
III.2.1.3. La périphérie nucléaire et les domaines associés à la lamina (LADs)
III.3.2. La microscopie comme outil de visualisation des loci génomiques et de la transcription
III.3.2.1. Observation des loci génomiques à l’échelle super-résolutive
III.3.3. La régulation de la transcription en images
III.3.4. La microscopie super-résolution pour visualiser les IPPs
III.3.4.1. Single-molecule localization microscopy (SMLM) multi-couleurs
III.3.4.2. Une combinaison entre microscopie PALM et BiFC : la BiFC-PALM
CHAPITRE 2 Resultats
I. Visualisation des complexes Hox/Exd sur le locus génomique fkh : résolution confocale (Lightning)
I.1. Visualisation de l’enrichissement des complexes Hox/Exd sur le gène fkh : FISH
I.2. Visualisation de l’enrichissement des complexes Hox/Exd sur l’enhancer fkh250 : système ParB/INT
II. Visualisation des complexes Hox/Exd sur l’enhancer fkh250 à l’échelle super-résolutive
II.1. Observation de la protéine Hox Ubx au sein des noyaux de glandes salivaires, en microscopie PALM
II.2. Observation des complexes Ubx/Exd au sein des noyaux de glandes salivaires, en microscopie PALM
II.3. Observation des complexes Scr/Exd sur l’enhancer fkh250 à l’échelle super-résolutive
Matériels et Méthodes
CHAPITRE 3 Manuscrit : Hox and Lamin-C interact in a nuclear ring to repress autophagy in the Drosophila fat body
Abstract
Introduction
Results
Discussion
Materials and methods
Figure legends
Figures
Références
CHAPITRE 4 Discussions et Perspectives
I. Déchiffrer et visualiser la régulation de la transcription par un complexe protéique sur ses séquences cibles cis-régulatrices
I.1. Quantification de l’enrichissement de complexes binaires sur des séquences cis-régulatrices cibles au sein d’un échantillon épais
I.1.1. Une nouvelle méthode pour visualiser et quantifier des interactions protéine-protéine sur leur séquence génomique cible 163
I.1.1.1. En résolution confocale
I.1.1.2. A l’échelle super-résolutive
II.2. Expression endogène et microscopie super-résolution
II.3. Observation simultanée du locus génomique et de la transcription associée.
II. Les complexes Hox/LamC et la répression de l’autophagie dans les corps gras de drosophile
CHAPITRE 5 Annexes et Données Supplémentaires
I. Visualisation des complexes BiFC sur l’enhancer fkh250 via le nanobody RFP-booster
II. La microscopie PALM dans l’emrbyon et le corps gras de drosophiles
III. Données supplémentaires
III.1. Figures supplémentaires (Résultats et Discussion)
III.2. Séquences pour la création des sondes FISH pour le gène fkh
III.3. Séquences des enhancers fkh250, fkh250MUT et fkh250CONS
III.4. Macro pour le clustering
IV. Article : Generation of a versatile BiFC ORFeome library for analyzing protein-protein interactions in live Drosophila.
BIBLIOGRAPHIE

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *