Généralités sur les IDPs

Généralités sur les IDPs

La biologie structurale est l’étude de la structure et de l’organisation spatiale tridimensionnelle de macromolécules telles que les protéines et les acides nucléiques. Elle permet la compréhension des fonctions biologiques des protéines, notamment grâce à l’étude des interactions protéine-protéine. En 1973, Anfinsen énonce le paradigme séquence-structure-fonction expliquant que la séquence d’une protéine détermine sa structure tridimensionnelle qui elle-même dicte à la protéine sa fonction [8]. Cependant, durant les deux dernières décennies, des observations sur plusieurs protéines ont été à l’encontre de ce paradigme séquence-structure-fonction car elles ont mis en évidence une nouvelle catégorie de protéines, les protéines intrinsèquement désordonnées ou « intrinsically disordered proteins » (IDPs), soit entièrement désordonnées, soit possédant une ou des régions intrinsèquement désordonnées ou « intrinsically disordered regions » (IDRs) [87, 372], et dont le désordre est important pour la fonction. En fait, dès la fin des années 1970, des exemples de protéines présentant un désordre structural avaient été mentionnés dans la littérature. Ainsi Sasaki et al. remarquaient en 1975 qu’une petite hormone polypeptidique, le glucagon, existait en solution à pH 10 sous la forme de chaînes aléatoires flexibles en équilibre, et qu’elle se structurait en une grande hélice stabilisée par des interactions hydrophobes quand elle interagissait avec elle-même (formation d’oligomères par abaissement du pH) ou avec son récepteur [27, 304]. Néanmoins, l’émergence du concept de protéines intrinsèquement désordonnées a été relativement lente jusqu’aux travaux de l’équipe de Dunker à partir du milieu des années 90 [87, 123, 290], ceux de Wright et Dyson à partir de la même époque [372], et ceux d’Uversky [345] (Fig. 1.1). Les IDPs ne sont pas des protéines anecdotiques ou rares [89, 336, 345, 348, 372]. En effet, ce désordre est un élément commun des protéines dans tous les domaines de la vie : chez les archaébactéries, eubactéries, eucaryotes et même dans les protéomes viraux. Il est estimé dans plusieurs publications [71, 88, 111, 120, 251, 264, 296, 346, 360, 365, 376, 383] que les eucaryotes [365] ont une proportion plus élevée d’IDPs (30 %) que les virus (10 %) ou encore les bactéries ou les archéobactéries (5 %). De plus, la prédiction de désordre dans les structures de protéine est plus grande chez les eucaryotes multicellulaires que chez les eucaryotes unicellulaires [347]. Le taux de régions non structurées au sein des protéomes augmente donc avec le niveau d’organisation du vivant. Des études par bio-informatique de séquences de protéines, chez les mammifères, estiment qu’environ 50 % d’entre elles sont prédites avec de telles régions et qu’environ 25 à 30 % seraient complètement destructurées [91, 251, 346]. FIGURE 1.1 – Nombre de publications trouvées dans pubmed citant les protéines intrinsèquement désordonnées : en utilisant comme mots clés « (intrinsically AND disordered) OR (natively AND disordered) OR (intrinsically AND unstructured) OR (natively AND unstructured) OR (intrinsically AND unfolded) OR (natively AND unfolded) OR (intrinsically AND flexible) OR (natively AND flexible) ». Il est recensé environ 5 682 publications depuis 1978, dont 384 depuis le début de l’année 2019 (Figure faite le 21 juin 2019)

Rôles biologiques des IDPs

La grande flexibilité et plasticité des régions intrinsèquement désordonnées confèrent aux IDPs une grande capacité d’adaptation et d’interaction avec de nombreux partenaires protéiques. Ainsi, les IDPs ou IDRs sont généralement impliquées dans de nombreux mécanismes biologiques. Il existe plusieurs façons de les classifier suivant leurs fonctions : Dunker et al. en 2002 les séparent en 28 fonctions différentes [93], qui peuvent être regroupées en quatre grandes fonctionnalités (assemblage moléculaire, chaînes entropiques, modifications posttraductionnelles et reconnaissance moléculaire). Dans la même année, Tompa et al. proposent une classification avec cinq fonctionnalités (chaînes entropiques, sites de modifications post-traductionnelles, assembleurs, collecteurs et effecteurs) [336]. Cette classification sera complétée en 2005 par Tompa lui-même avec l’ajout de la fonction chaperone de certaines IDPs [337]. Un autre schéma de classification a été proposé en 2009 par Gsponer et Babu, qui ont regroupé les fonctions des IDPs en trois catégories (modifications post-traductionnelles, échafaudage et recrutement de différents partenaires, adaptabilité et variabilité conformationnelle) [131]. Cependant, la classification la plus utilisée semble être celle de Tompa [337]. En effet, dans la revue très exhaustive [355] publiée en 2014, les principaux pionniers du domaine classent les IDPs en six catégories (Fig. 1.2) :

Rôles biologiques des IDPs

FIGURE 1.2 – Schéma de la classification en six catégories des IDPs suivant leur fonction : les IDPs ont soit la capacité de fluctuer librement parmi un grand ensemble de conformations (chaînes entropiques), soit la capacité de se lier de manière transitoire (chaperones et protéines subissant des modifications post-traductionnelles) ou permanente (assembleurs, pièges et effecteurs) à une ou plusieurs molécules partenaires. (Figure adaptée en français de la figure 1 de la revue « The interplay between structure and function in intrinsically unstructured proteins » de Tompa [337]) • les chaînes entropiques : pour elles, le désordre structural est la cause directe de la fonction, et la protéine fonctionne sans devenir structurée. Ce désordre permet par exemple à la protéine de se comporter comme un ressort. Ainsi, les régions peu structurées riches en acides aminés PEVK de la titine génèrent en s’étirant une force capable de s’opposer à la tension d’étirement du sarcomère. On trouve également dans cette catégorie les peptides de jonction (« linkers ») entre deux domaines, qui permettent à ces domaines de se mouvoir l’un par rapport à l’autre, et les « spacers » qui régulent la distance entre domaines. • les chaperones : ces protéines ont pour rôle d’assister d’autres protéines ou des ARN pour qu’ils adoptent leur état fonctionnel. Dans les protéines chaperones, les segments désordonnés représentent une part importante de la séquence (de l’ordre de la moitié pour les chaperones à ARN et de l’ordre de un tiers pour les chaperones à protéines), ce qui confère à ces protéines une grande versatilité et ainsi la capacité de s’adapter à un grand nombre de partenaires. Par ailleurs, la nature très dynamique de ces IDRs leur permet de se lier rapidement avec les protéines mal repliées et peut ainsi empêcher la formation d’agrégats toxiques. Il a aussi été proposé par Tompa et Csermely qu’au cours de ce processus, l’IDR de la chaperone pourrait localement acquérir de la structure, au profit de la protéine malrepliée qui, elle, se déplierait, pour ensuite se replier correctement dans sa forme fonctionnelle [339]. On aurait ici un échange réversible d’entropie ne nécessitant pas d’ATP. Cette perte de flexibilité de l’IDR de la chaperone, quand elle se lie à son substrat, a par exemple été démontrée pour les chaperones GroEl et α-cristalline. • les sites de modifications post-traductionnelles ou « display sites » : ces régions désordonnées sont en interaction transitoire avec un ou des ligand(s) pour entraîner une modification chimique telles que la phosphorylation, l’acétylation, la glycosylation, la méthylation ou la protéolyse [78]. Ces sites remarquables sont préférentiellement reconnus par les enzymes assurant et régulant les modifications post-traductionnelles. Ces IDPs, pour lesquelles les modifications post-traductionnelles jouent un rôle clé dans la fonction et la régulation, incluent, entre autres, les extrémités désordonnées des histones, la protéine p53 et les kinases dépendant des cyclines (« Cyclin-dependent kinase » (CDK)) p27 [355]. • les assembleurs : certaines protéines, grâce à leurs IDRs, possèdent plusieurs sites de liaison avec de multiples protéines partenaires, et se comportent alors comme des assembleurs moléculaires en favorisant la formation, la stabilisation et la régulation de larges complexes protéiques. Par exemple, la protéine d’échafaudage axine (pour « axis inhibition ») possède plusieurs régions intrinsèquement désordonnées lui permettant d’interagir avec trois protéines structurées la β-caténine, la caséine kinase Iα et le glycogène synthétase kinase 3β, et ainsi de les colocaliser [384]. L’assemblage de ces quatres protéines augmente leurs concentrations locales et accélère les interactions entre elles, ce qui conduit à une phosphorylation efficace de la β-caténine et à sa destruction. Il faut noter que parmi tous les IDP/IDR mentionnées ci-dessus, les régions d’échafaudage sont celles qui possèdent le degré de désordre le plus important [355]. Ces IDPs jouent souvent le rôle de protéines « hub » au sein de la reconnaissance moléculaire [70, 352, 373], c’est le cas de la protéine p53 qui possède un très large réseau avec plus de 400 partenaires [296]. • les pièges (« scavengers » ) : ces IDPs ou IDRs permettent de stocker et/ou de neutraliser des ligands. Par exemple, la caséine et d’autres phosphoprotéines liant le calcium sont des protéines très désordonnées qui grâce à ce désordre, peuvent adapter leur conformation pour séquestrer des nanoclusters de phosphate de calcium et empêcher ainsi la précipitation du sel correspondant. • les effecteurs : certaines protéines, possédant des IDRs, jouent un rôle d’effecteurs, comme par exemple les protéines p21 et p27 qui en se structurant et en se liant avec leurs partenaires, modifient l’activité de ceux-ci. Elles régulent et contrôlent le cycle cellulaire et sont reconnues pour être des oncoprotéines. Dans le domaine des effecteurs, un exemple intéressant de mécanisme d’interactions compétitives contrôlant l’auto-inhibition est trouvé dans la protéine neuronale du syndrome de Wiskott-Aldrich (N-WASP). Quand le domaine GBD (« GTPase binding domain ») intrinsèquement désordonné de N-WASP interagit avec la protéine Cdc42, les deux domaines V (homologues à la verproline) de N-WASP sont libres d’interagir avec l’actine et de permettre l’assemblage des monomères d’actine, ce qui conduit à sa polymérisation. Mais le domaine GBD peut adopter une structure différente et interagir avec le domaine C (homologue à la cofiline) de N-WASP, entraînant l’inactivité de N-WASP et inhibant son interaction avec l’actine (Fig. 1.3) [102, 224, 397].

Association IDP-protéine

De manière générale, les régions permettant l’auto-inhibition sont riches en désordre intrinsèque et adoptent des conformations différentes suivant que la protéine est dans son état auto-inhibé ou dans son état actif [355].