La protéomique par spectrométrie de masse
La spectrométrie de masse La spectrométrie de masse (MS) est une technologie permettant de déterminer le rapport masse sur charge (m/z) d’une molécule chargée à l’état gazeux. Les spectromètres de masse sont composés de trois parties : une source d’ion, un analyseur et un détecteur. La source d’ion permet de faire passer les molécules d’un état condensé (liquide ou solide) à un état gazeux en les ionisant. Ces ions peuvent être chargés négativement ou positivement. Une fois produites au niveau de la source, les molécules chargées en phase gazeuse peuvent être analysées grâce à un champ électrique ou magnétique dans l’analyseur. L’analyseur permet ainsi de les séparer en fonction de leur rapport masse/charge (m/z) avant qu’elles ne soient comptées par le détecteur. Le résultat se présente ensuite sous forme d’un spectre de masse qui n’est rien d’autres qu’un graphique représentant les intensités des signaux détectés en fonction des différents m/z mesurés. Il est possible d’associer plusieurs analyseurs de masse pour faire de la spectrométrie de masse en mode tandem ou MS/MS. Dans cette configuration, il est possible d’isoler des molécules, de les fragmenter et d’analyser les fragments. Ce mode de fonctionnement de la MS permet d’obtenir des informations structurales supplémentaires sur les molécules pour en déduire par exemple leur séquence dans le cas des polypeptides. L’utilisation de la spectrométrie de masse pour l’analyse des biomolécules a pris un essor important au début des années 1990 après le développement des méthodes d’ionisation douces l’ESI (ionisation par electrospray) et le MALDI (ionisation laser assistée par une matrice)124. En effet, ces deux méthodes sont capables d’ioniser des biomolécules fragiles en minimisant leur dégradation sans les fragmenter. Grâce à ces avancées, la MS est devenue une technique de choix pour l’étude des protéines. Les échantillons protéiques étant très complexes, les performances de la MS dépendent énormément de la technique de séparation avec laquelle elle est associée15. Indépendamment de la méthode de séparation utilisée, l’analyse des protéines par MS se fait selon deux principales approches : le bottom-up et le top-down (Figure 3). La protéomique par spectrométrie de masse ~ 28 ~ Figure 3 : Les deux principales approches en analyse des protéines par spectrométrie de masse En protéomique bottom-up, les protéines sont digérées (protéolyse) en molécules plus petites appelées peptides protéolytiques qui seront analysés par MS. En top-down, par contre, la protéine entière est injectée dans le spectromètre de masse où elle est fragmentée et ses fragments analysés pour son identification. Le mode de fragmentation est d’une grande importance dans l’identification des protéines quelle que soit l’approche (bottom-up ou top down). Différentes techniques de fragmentation existent en MS. Le choix d’un mode de fragmentation dépend principalement de l’approche choisie et de l’appareil utilisé. L’analyse des fragments d’un peptide génère un spectre MS/MS qui va être utilisé pour son séquençage. En principe, la détermination de la séquence du peptide se fait en considérant la différence en masse entre 2 pics voisins dans le spectre MS/MS. Un système de nomenclature des fragments a été mis en place pour faciliter la lecture des spectres de fragmentation29. Les fragments a, b, et c sont des fragments chargés comprenant le coté N-terminal du peptide fragmenté tandis que les fragments chargés contenant le coté C-terminal sont nommés x, y ou z. Les fragments N-ter sont nommés a, b ou c en fonction du type de la liaison rompue durant la fragmentation, pareil pour les fragments C-ter (x, y ou z) (Figure 4). Parmi les modes de fragmentation mis en œuvre en protéomique, le CID (Collision Induced Dissociation, dissociation induite par collision) est de loin le plus utilisé128. La fragmentation CID commence par l’isolement d’un ion précurseur suivi par une série de collision de ce dernier avec un gaz neutre (Hélium) présent dans la cellule de fragmentation à une pression variant entre 1 et 5 mbar124. Ces collisions conduisent à une augmentation de l’énergie vibrationnelle des ions précurseurs qui, une fois un certain seuil atteint, entraine la rupture de liaisons covalentes. Le CID est utilisé dans des appareils de type triple-quadripôle, piège quadripolaire et q-tof. Pour les appareils équipés d’un Orbitrap, c’est la fragmentation HCD Higher-energy C-trap Dissociation, dissociation induite par collision à plus haute énergie). La fragmentation HCD est similaire au CID, elle génère les mêmes types de fragments. Elle génère principalement des ions b et y. En dehors du CID, d’autres modes de fragmentation sont utilisés en protéomique comme l’ECD (Electron Capture Dissociation, dissociation par capture d’électron) ou l’ETD (Electron Transfer Dissociation, dissociation par transfert d’électron). Les modes de fragmentations diffèrent d’abord de par les appareils dans lesquels ils peuvent être mis en œuvre. La fragmentation ETD est mis en œuvre dans les appareils Q-TOF, Q-TRAPs ou LTQ-Orbitrap. On retrouve la fragmentation ECD dans des appareils de type FT-ICR (Analyse par Transformée de Fourier de la Résonance Cyclotronique des Ions). Ensuite, le CID diffère de l’ECD et de l’ETD de par le type de fragments générés. La fragmentation CID fournit des fragments b,y tandis que l’ECD ou l’ETD génère des fragments de type c, z.
Approche top-down
Dans une expérience top-down, les protéines purifiées et intactes sont séparées avant analyse en MS, détectées puis fragmentées par ECD ou ETD (ou autres) apportant ainsi des informations sur la masse intacte de la protéine et sur sa séquence en acides aminés. L’approche top-down réduit considérablement la préparation d’échantillon et préserve ainsi des informations importantes qui seraient perdues avec une approche bottom-up comme la détection simultanée de plusieurs PTMs distantes sur la séquence primaire. Il est possible avec cette technique, d’avoir une description complète de la séquence de la protéine si assez de fragments informatifs sont observés23. C’est une approche très utilisée dans l’étude des protéoformes et des systèmes biologiques ayant des combinaisons complexes de PTM24. Les sources d’ionisation ESI et MALDI peuvent être utilisées pour une analyse top-down. L’ionisation ESI est plus avantageuse car elle produit des ions ayant des états de charge plus élevés facilitant ainsi la fragmentation25, et parce que la gamme de masse de détection nécessaire est restreinte sur l’échelle des m/z. Du fait de la taille importante des protéines intactes et donc des états de charges atteints, une analyse des protéines par top-down se fait généralement avec des spectromètres de haute résolution du type FTICR ou Orbitrap. Cependant, des spectromètres de masse moins performants du type quadripôle associé à une fragmentation dans la source ESI ont été utilisés pour l’analyse en top-down d’une protéine intacte de plus de 60 kDa26. Malgré tous ses avantages, l’approche top-down est beaucoup moins utilisée que la protéomique bottomup. Ceci s’explique par plusieurs raisons. i) la solubilité des protéines est plus faible que celle des peptides. La solubilité des protéines, particulièrement les protéines membranaires est l’un des premiers challenges de la protéomique top-down. Il est en effet nécessaire, après leur extraction, de maintenir les protéines solubles avant, durant et après le fractionnement. Les détergents permettant de solubiliser ces protéines étant souvent incompatibles avec la MS, de nouveaux détergents sont proposés pour bien solubiliser les protéines sans gêner ensuite leur analyse en top-down mais s’avèrent souvent moins performants24. ii) Les peptides se prêtent mieux à la séparation chromatographique, à l’ionisation et à la fragmentation que les protéines. La chromatographie en phase liquide à polarité de phase inversée est la plus fréquemment utilisée pour le fractionnement des échantillons complexes de protéines intactes car elle est directement compatible avec le mode d’ionisation ES). Cependant, du fait d’une grande diversité des propriétés physico-chimiques d’un mélange de protéines intactes et de leur faible taux de récupération, la capacité de pics et la résolution de la séparation de protéines intactes est de loin plus faible que celles des peptides27. iii) les spectres issus d’une analyse top-down sont beaucoup plus complexes. L’ionisation en ESI des protéines intactes produit une large gamme d’états de charge. Ainsi, une protéoforme détectée sous différents états de charge aura un profil de fragmentation qui apporte des informations redondantes contenues dans des spectres très complexes qu’il faut déconvoluer. Ceci représente un véritable challenge de traitement du signal pour l’analyse bio-informatique qui devient plus complexe lorsque sont intégrées les combinaisons complexes de PTMs inconnues. Récemment, plusieurs outils bio-informatiques ont été développés pour ~ 31 ~ l’analyse des données issus d’une analyse top-down mais le challenge demeure notamment pour l’identification des protéines ayant une grande masse moléculaire.
Approche bottom-up
La protéomique bottom-up vise à l’identification d’une protéine en analysant les peptides protéolytiques issus de sa digestion. Les protéines sont digérées en peptides ayant des tailles comprises entre 500 et 3000 Dalton. On parle de shotgun proteomics quand la protéomique bottom-up est appliquée à un échantillon complexe. Ce qui implique généralement, dans le cas du shotgun proteomics, le couplage d’une étape de séparation du type chromatographie liquide (LC) à une ou 2 dimensions à la spectrométrie de masse. Les peptides issus de la digestion des protéines sont ainsi fractionnés par chromatographie liquide avant d’être détectés par spectrométrie de masse d’abord en mode MS et puis en tandem (MS/MS) pour obtenir leur spectre de fragmentation. On parle ainsi de LC-MS/MS. L’identification des peptides se fait ensuite par la comparaison du spectre MS/MS issu de la fragmentation des peptides aux spectres MS/MS théoriques de peptides issus de la digestion in silico d’une base de données de protéines. La digestion est l’étape la plus critique de la stratégie bottom-up. Elle peut être enzymatique ou chimique. Nous ne parlerons ici que la digestion enzymatique qui est de loin l’approche la plus utilisée. Un protocole typique d’une analyse bottom-up commence par l’extraction de protéines d’un échantillon biologique (cellules, tissus…). Cette étape consiste à extraire les protéines en détruisant la structure de la membrane cellulaire et en rompant les interactions physico-chimiques entre protéines ou avec d’autres biomolécules. Elle se fait souvent par dénaturation en présence d’un détergent comme le SDS (Sodium DodecylSulfate) dont le rôle est de solubiliser les protéines. Les protéines membranaires sont caractérisées par une faible solubilité. L’utilisation du SDS (ou autres détergents) est essentielle pour la solubilisation et l’extraction de ces dernières. Pour préparer les protéines extraites à la digestion, leurs ponts disulfures sont réduits par des agents réducteurs comme le dithiothréitol (DTT), le tris(2-carboxyethyl)phosphine ȋTCEPȌ ou le β-mercaptoéthanol. Ensuite, un agent alkylant comme l’iodoacétamide (IAM) ou le N-EthylMaléimide(NEM) est utilisé pour bloquer les cystéines et empêcher la reformation des ponts disulfures. Les réactifs en excès sont éliminés et un changement de tampon est opéré. Enfin, l’ajout d’une endoprotéase ayant des sites de coupure spécifiques (ou non) permettra de digérer les protéines en peptides. Arg-C, Lys-C, trypsine, chymotrypsine, pepsine, pronase… sont toutes des enzymes de digestion de protéines. Chacune possède des spécificités de sites de coupure et des conditions optimales de fonctionnement (température, pH…). Cependant, la trypsine est sans aucun doute l’enzyme qui est de loin la plus utilisée en protéomique bottom-up. La trypsine est une enzyme très spécifique qui coupe les liaisons peptidiques du côté C-terminal des résidus Arginine et Lysine si ces résidus ne sont pas suivis par la proline. En dehors de son coût abordable et de sa disponibilité en grande quantité, la large utilisation de la trypsine s’explique par l’abondance de la lysine et de l’arginine dans les séquences protéiques. De plus les peptides tryptiques portent au moins 2 charges positives, ce qui facilite leur ionisation et leur fragmentation en CID. Les spectres de fragmentation de ces peptides ~ 32 ~ sont d’une grande qualité, ce qui facilite leur identification par comparaison avec les spectres issus des bases de données de protéines.