Glycosylation des protéines et glycohormones
Les protéines subissent, en aval de leur synthèse, des modifications chimiques souvent régies par des réactions enzymatiques, appelées « modifications post traductionnelles » ou PTMs (de l’anglais « Post-Translational Modifications »). Ce terme désigne également, par extension, les modifications survenant lorsque la chaine peptidique est encore en cours de synthèse, et qui sont donc à proprement parler des modifications co-traductionnelles. Il existe de nombreuses PTMs différentes, de par la nature chimique des modifications ou leur localisation sur la protéine. Pas moins de 1493 modifications covalentes sont répertoriées dans la base de données de modifications publique Unimod en 2019.
Ces modifications incluent, entre autres, le clivage de liaisons peptidiques (peptide signal, peptide C de la forme immature de l’insuline), et la modification covalente d’acides aminés particuliers par des groupements de natures variées, tels des phosphates (phosphorylation), groupements acétyle (acétylation) ou des polysaccharides (glycosylation et glycation). Elles peuvent être réversibles, alors souvent associées à des processus biologiques de régulation ou de signalisation, ou bien être irréversibles et dans ce cas potentiellement associées à des phénomènes de vieillissement cellulaire ou de dégradation (1). La glycosylation est un processus enzymatique (contrairement à la glycation qui est un processus passif) aboutissant à la liaison covalente d’une protéine et d’un mono- ou oligosaccharide. Il s’agit d’une famille de PTMs extrêmement courante retrouvée chez les organismes eucaryotes, pour lesquels on estime que la majorité des protéines sécrétées sont glycosylées (2), mais aussi sur les protéines synthétisées par les organismes du domaine bactérien (3), contrairement à ce qui fut longtemps admis.
Ces modifications ont un impact sur la stabilité, la conformation, la fonction et les capacités d’interaction des glycoprotéines. Figure 2 : Formes linéaire et cyclique (hémiacétal) du glucose. L’orientation du C1 au moment de la cyclisation peut aboutir à deux formes anomériques α ou β selon la position du groupement hydroxyle 1 (en rouge) par rapport au cycle. Figure 3 : Formes α-pyranosiques (hétérocycle hémiacétal à 6 atomes) des monosaccharides usuellement rencontrés dans les glycanes des mammifères. Les monosaccharides existent sous deux formes, linéaire ou cyclique (Figure 2). Lorsqu’ils adoptent une forme cyclique, ce sont des molécules hétérocycliques (leur cyclisation provoque l’intégration d’un hétéroatome d’oxygène au cycle carboné), poly-hydroxylées et chirales.
L’orientation des groupements hydroxyles sur chaque carbone stéréogène (à environnement asymétrique) a un tel impact sur les propriétés du monosaccharide que chaque diastéréoisomère possède une identité et un nom qui lui est propre (Figure 3). Chaque monosaccharide sous forme linéaire possède un unique groupement aldéhydique dont la réactivité est conservée lors de la cyclisation (Carbone-1 hémiacétal). Ce carbone étant impliqué dans la liaison de formation des oligosaccharides, la majorité des polymères d’oses n’ont qu’une extrémité réductrice, généralement impliquée dans la liaison à la protéine glycosylée. Un polysaccharide, aussi appelé glycane, est le nom donné au polymère linéaire ou ramifié composé de monosaccharides (ou oses) reliés entre eux par des liaisons covalentes, dites « osidiques ».
Différents types de glycosylation sont décrits en fonction du groupement chimique modifié ou de la molécule intermédiaire entre le polysaccharide à la ~ 35 ~ protéine glycosylée. Chaque famille de glycosylation utilise des voies de synthèse différentes, aboutissant à des structures osidiques variées mais également à des fonctions biologiques propres. La N-glycosylation et la Oglycosylation sont les formes les plus étudiées et sont les deux formes de glycosylation identifiées sur les hormones gonadotropes, tandis que d’autres types de glycosylation moins courants existent, comme la C-mannosylation, la glypiation et la glycosylation des phosphosérines.
Nomenclature
Les glycanes pouvant être ramifiés et de structure complexe, une nomenclature graphique appelée SNFG pour « Symbol Nomenclature for Glycans » s’est imposée au fil des années avec sa première édition publiée en 1999 dans la revue « Essentials of Glycobiology », révisée en 2004 et en 2015 pour sa troisième édition (5). Elle consiste en l’identification de chaque monosaccharide par des formes géométriques colorées, la forme géométrique indiquant généralement la structure du monomère, tandis que la couleur est une indication de sa stéréochimie (Figure 5). Aussi, les couleurs et les formes sont cohérentes entre les oses les plus communs : un cercle jaune représente un galactose (Gal), un carré jaune une N-acétylgalactosamine (GalNAc) et un carré bleu une Nacétylglucosamine (GlcNAc).
La nomenclature textuelle est aussi définie par le SNFG pour la représentation des structures polysaccharidiques dont les liaisons glycosidiques sont connues. Il s’agit d’une version condensée de l’écriture recommandée par l’IUPAC représentant de façon linaire ou ramifiée la composition des glycanes et les liaisons glycosidiques entre ses constituants monosaccharidiques, en écrivant dans le sens « extrémité(s) non réductrice(s) » → « extrémité réductrice ». Un trisaccharide linaire pourra ainsi s’écrire NeuAcα2-3Galβ1-3GalNAc. Si ses liaisons ou sa stéréochimie ne sont pas intégralement caractérisées, le sucre sera représenté graphiquement en utilisant les symboles SNFG non colorés ou en détaillant uniquement la composition du sucre, NeuAc1Gal1GalNAc1 ou HexNAc(1)Hex(1)NeuAc(1) dans le cas du sucre précédent. Les structures des N-glycanes étant très conservées, la notation Oxford peut être utilisée car plus compacte : Pour les formes high-mannose on indique le nombre total de mannoses « K » sous la forme MK (par exemple, M9 correspond à un N-glycane à neuf mannoses), tandis que les formes complexes suivent la forme générale « FAXBGYSZ », avec « X » le nombre d’antennes, « Y » le nombre de galactoses et « Z » le nombre d’acides sialiques (acide Nacétylneuraminique, NeuAc ou NANA) terminaux. L’utilisation des lettres « F » et « B » indique respectivement la présence d’un fucose à la base du N- ~ 39 ~ glycane, ou la bissection du core par une N-acétylglucosamine (située sur le mannose lié en β1-4. Les formes hybrides adoptent une notation similaire, indiquant à la fois le nombre total de mannoses et la composition des antennes (Figure 6).
La nomenclature proposée par B. Domon et C. Costello (6) pour désigner les ions produits lors de la fragmentation en spectrométrie de masse en tandem est universellement acceptée par la communauté et sera utilisée dans ce manuscrit (Figure 7). Elle suit des règles analogues à celles de la nomenclature des fragments peptidiques (7) : Les fragments B, C, Y et Z sont des fragments issus de la rupture de la liaison osidique, tandis que les fragments A et X sont issus Nomenclature IUPAC NeuAc α2-6 Gal β1-4 GlcNAc β1-2 Man α1- 3 (Gal β1-4 GlcNAc β1-2 Man α1-6) Man β1-4 GlcNAc β1-4 (Fuc α1-6) GlcNAc GlcNAc β1-4 (Gal β1- 4 GlcNAc β1-2 Man α1-3) (Man α1-3 (Man α1-6) Man α1-6) Man β1-4 GlcNAc β1-4 GlcNAc Man α1-2 Man α1-2 Man α1-3 (Man α1-2 Man α1-3 (Man α1-2 Man α1-6) Man α1-6) Man β1-4 GlcNAc β1- 4 GlcNAc NeuAc α2-3 Gal β1-3 (NeuAc α2-3 Gal β1-4 GlcNAc β1-6) GalNAc Représentation graphique Famille N-glycane complexe N-glycane hybride N-glycane oligomannose O-glycane Composition HexNAc(4) Hex(5) Fuc(1) NeuAc(1) HexNAc(4) Hex(6) HexNAc(2) Hex(9) HexNAc(2) Hex(2) NeuAc(2) Nomenclature Oxford FA2G2S1 M5A1BG1 M9 / ~ 40 ~ de la fragmentation au sein d’un hétérocycle (fragments dits « cross-ring »). Les fragments Ai, Bi et Ci désignent les fragments contenant l’extrémité non réductrice du glycane, et les fragments Xj, Yj et Zj, l’extrémité réductrice ; le nombre en indice indique la position relative de la liaison rompue par rapport à l’extrémité du sucre ; le nombre en exposant indique, le cas échéant, les liaisons intrasaccharidiques rompues. 1.3 Fonctions biologiques Du fait de leur omniprésence sur la majorité des protéines et de leur grande hétérogénéité, les glycanes sont susceptibles de remplir des fonctions extrêmement diverses.
Les glycanes peuvent être impliqués dans le repliement des protéines dans le réticulum endoplasmique, le caractère hydrophile et la solubilité des protéines, leur stabilité, l’adhésion cellulaire, ou encore le caractère pro- ou anti- inflammatoire ou immunogène de certaines protéines ou cellules. Ces propriétés biologiques sont généralement liées au caractère hydrophile, à la densité de charge ou à la reconnaissance des glycoconjugués par des récepteurs membranaires. Les glycoprotéines les plus étudiées pour leur fonction biologique sont probablement les immunoglobulines (de classe IgG) du fait de leur fort intérêt pharmaco-médical. En effet la glycosylation des immunoglobulines a un rôle structural et modulateur des fonctions effectrices de l’anticorps. Les anticorps ont un site de N-glycosylation conservé en position N297 de leur Fc (fragment cristallisable) et parfois un site de glycosylation dans leur région variable, les deux modifications étant retrouvées sur la chaine lourde de l’immunoglobuline (8). Sur ces glycoprotéines, les N-glycanes sont majoritairement des formes complexes biantennaires, sialylées et fucosylées. La simple absence de N-glycanes est associée à un taux d’agrégation plus important et une sensibilité aux traitements thermiques, chaotropiques (Guanidine-HCl), ou protéasiques (papaïne) augmentée, et donc une plus courte période de stabilité (9). La conformation du domaine CH2 des anticorps est particulièrement affectée par leur glycosylation, ainsi que leur affinité pour ~ 41 ~ les récepteurs anti-Fc et les protéines du complément.
Au-delà de la simple présence de N-glycanes, la composition de ceux-ci impacte également les fonctions effectrices des anticorps. En particulier, la présence de GlcNAc en position bissectrice a un effet pro-inflammatoire (activation de la voie ADCC), tandis que la fucosylation du core augmente l’activation du complément. Les Gal et NeuAc terminaux sont quant à eux anti-inflammatoires (10). Dans le cadre du design d’anticorps thérapeutiques ou d’ADCs (anticorps couplé à une molécule active), la maitrise de leur glycosylation permet donc d’optimiser leurs propriétés. (11,12) L’état anormal de glycosylation de certaines protéines est un promoteur de la progression et de l’évolution de cellules cancéreuses, et donc un excellent biomarqueur de ce type d’anomalie. Les modifications que subissent les Nglycanes et les O-glycanes sont les plus décrites, probablement du fait de la meilleure connaissance de ces familles. Du fait de l’altération des niveaux d’expression des enzymes liées à la glycosylation dans ces cellules, on observe alors des modifications structurales des cores O-glycosidiques et de l’état de ramification et de complexité des chaines polysaccharidiques.
Plusieurs motifs semblent conservés et associés à différentes formes de cancer. Notamment, la présence de structures O-glycosidiques particulières (antigènes T, Tn, STn) a été décrite dans des cas de cancers colorectaux (13,14), pour lesquels une augmentation de la concentration des mucines sialylées (α2-6) a également été observée et associée à la formation de métastases et l’échec des traitements (15,16). L’extension des antennes des N-glycanes complexes par des répétitions Gal-GlcNAc (poly-N-acétyllactosamine, ou polylacNAc) est également un marqueur de cancer pulmonaire et colorectal (17). Les polylacNAc ont en effet une haute affinité pour la galectine-3 qui est connue pour promouvoir la formation de métastases pulmonaires (18). L’état de glycosylation de la β-hCG semble lié au développement de cellules tumorales, les formes hyperglycosylées de la hCG étant plus prépondérantes chez les patients touchés par ces cancers (19). (20)