Le protéome urinaire : caractérisation et intérêt pour la recherche de biomarqueurs de pathologies
Les fluides biologiques et leur rôle dans la découverte des biomarqueurs
Les fluides biologiques ou fluides corporels désignent d’une manière générale des liquides produits par un organisme vivant. On distingue deux types de fluides : les liquides au sein d’un circuit fermé tels que le sang ou le liquide cérébrospinal et les fluides dans un circuit ouvert tels que l’urine ou la sueur. Les deux fluides les plus couramment utilisés en protéomique clinique sont le sang et l’urine car il est facile de les collecter de manière peu invasive et en quantité suffisante pour réaliser différentes études à partir d’un seul prélèvement. Les fluides présentent un défi analytique considérable pour la protéomique en raison de leur gamme dynamique des concentrations protéiques, leur complexité (Adkins et al., 2002) ou la présence de composés interférents (tels que les sels ou les débris cellulaires,…). L’extrême complexité des fluides biologiques, tels que le plasma ou l’urine, représente un enjeu majeur pour la protéomique (N. L. Anderson & Anderson, 2002). Dans le cas du plasma, le rapport de concentration entre les protéines les plus abondantes (albumine) et les moins abondantes (cytokines) peut ainsi atteindre une valeur estimée à 1012, comme l’illustre la Figure I.8. L’albumine, à elle seule représente 55 % des protéines du plasma et les 9 protéines majoritaires constituent 90 % des protéines plasmatiques, alors qu’une vingtaine de protéines représentent, à elles seules, les 99% du contenu protéique total du plasma (Figure I.9). Figure I.8 : Intervalle de concentration de 70 protéines du plasma, d’après N.L Anderson. (N. L. Anderson & Anderson, 2002) Figure I.9 : Distribution des protéines représentant (A) 90% et (B) de 91-99% de la quantité totale de protéines du plasma. a) L’accessibilité aux cohortes d’échantillons Une des difficultés inhérentes à la protéomique clinique repose sur la constitution de cohortes en accord avec les exigences de l’analyse protéomique quantitative, en particulier lorsque l’on utilise des stratégies « Label Free ». Pour la phase de découverte des candidats biomarqueurs, il est nécessaire, d’analyser plusieurs dizaines d’échantillons (Rifai et al., 2006), collectés dans des conditions strictement contrôlées et de minimiser la variabilité entre les patients d’une même population en appariant l’âge, le sexe, les caractéristiques des tumeurs pour les populations pathologiques. Dans la plupart des études cliniques, il est difficile d’obtenir des cohortes de patients qui réunissent l’ensemble de ces caractéristiques. De plus, les performances des outils statistiques utilisés pour discriminer les protéines différentiellement abondantes dépendent du nombre d’analytes mesurés (les peptides) et du nombre d’échantillons considérés. Lorsque le nombre de peptide détectés est grand (typiquement plusieurs milliers), il est souhaitable d’avoir une cohorte importante (centaines de patients). Des méthodes statistiques ont été développées pour tenir compte de la variabilité des échantillons au sein d’une même population et du déséquilibre des matrices peptides-patients (Fu et al., 2008). Le fait que beaucoup d’études de protéomique clinique pour la découverte de biomarqueurs s’appuient sur l’analyse d‘une ou deux dizaines d’échantillons (Chen et al., 2010) met en évidence la difficulté de constituer des cohortes, mais aussi le défi de satisfaire les exigences de la protéomique tout en considérant les contraintes de la clinique. Le travail présentée dans cette thèse, s’appuie sur l’analyse d’une centaine d’échantillons en accord avec les recommandations de Rifai (Rifai et al., 2006). Ceci a constitué un travail considérable des équipes de protéomique et de clinique, pour établir un protocole qui satisfasse les Page 40 Chapitre I : Etat de l’art exigences des statisticiens et des protéomiciens en considérant la difficulté de préparer des échantillons en même temps que se déroule la collecte. Il est à noter, qu’en général, c’est la même personne qui assure la collecte et les premiers traitements de l’échantillon. b) De la collecte au traitement préanalytique des échantillons de fluide biologique Les fluides biologiques sont très sensibles à divers paramètres qui ne sont pas toujours en lien direct avec la pathologie. En particulier, les facteurs préanalytiques et notamment les protocoles de collecte peuvent avoir un rôle déterminant pour les analyses de protéomique quantitative en induisant des différences d’abondance de protéines indépendantes de la pathologie. Il en va de même pour les conditions de conservation des échantillons avant l’analyse. Par ailleurs, la variabilité physiologique inter et intra individuelle doit être prise en compte (Lambert, Berrahmoune, Herbeth, Siest, & Visvikis-Siest, 2007) lors de la conception du design d’une étude clinique. Pour cela, on évalue la variabilité inter individu en analysant une large cohorte de patients de manière à minimiser cet effet et à inclure cette variabilité dans l’analyse statistique. Le projet PPP Plasma Proteome Project, initié en 2002 par l’organisation HUPO, a permis, dans le cas du plasma, de définir des stratégies de collecte, des prérequis pour la préparation et l’analyse protéomique (Rai et al., 2005) tels que l’utilisation d’inhibiteurs de protéase, la température de stockage ou la durée écoulée avant le stockage des échantillons. En ce qui concerne l’urine, la plupart des recommandations sur les traitements préanalytiques se basent sur des études par gel2D (Thongboonkerd, 2007), et comme nous allons le voir par la suite, ne sont pas nécessairement applicables aux études basées sur la MS. Pour obtenir une large couverture de protéomes de fluides biologiques, il apparaît indispensable de fractionner l’échantillon avant l’analyse par spectrométrie de masse de manière à réduire la gamme dynamique. Ce problème de gamme dynamique est une caractéristique de tous les fluides biologiques et, même si elle est moindre dans l’urine, elle n’en reste pas moins un handicap pour les analyses protéomiques. Pour répondre à cette difficulté, il existe différentes approches basées sur le fractionnement protéique comme la séparation sur Gel 1D, l’isoélectrofocalisation ou sur l’immunodépletion des protéines majoritaires ou des méthodes plus originales comme la technologie d’égalisation : « Equalizer ». L’immunodéplétion : Pour la découverte de biomarqueurs dans les fluides complexes comme le plasma, le sérum ou le liquide céphalo-rachidien, il est parfois conseillé de dépléter les protéines de plus hautes abondances pour permettre de détecter les protéines minoritaires qui sont autant de potentiels biomarqueurs. La technique d’immunodéplétion qui consiste en la déplétion par immunoaffinité des protéines majoritaires d’un échantillon est réalisée à l’aide d’un mélange d’anticorps spécifiques immobilisés sur une matrice de chromatographie. Pour cela plusieurs kits commerciaux sont disponibles pouvant dépléter jusqu’à 20 protéines majoritaires du plasma selon le kit utilisé. Bien que l’intérêt de cette approche ait été démontré dans différentes études de protéomique (Pieper et al., 2003), cette méthode de déplétion peut également éliminer d’autres protéines que celles visées à l’origine, certaines protéines abondantes pouvant jouer un rôle de transporteur. et Pour le fractionnement de l’urine, il n’existe actuellement pas de kit commercial permettant d’éliminer une des protéines majoritaires qu’est l’uromoduline. La technologie « Equalizer » : Une autre stratégie, décrite pour la première fois par Thularsiraman en 2005 (Thulasiraman et al., 2005), est basée sur le principe d’affinité : les protéines de l’échantillon se lient à une banque combinatoire d’hexapeptides (206 soit 64 millions ligands) greffés sur des billes de polymethacrylate, pouvant théoriquement sélectionner toutes les protéines. Chaque ligand est présent en quantité identique, permettant de fixer un nombre identique de chacune des protéines du mélange. Sous un ratio billes/échantillon contrôlé, les protéines majoritaires saturent rapidement leur site et sont donc éliminées par lavage, tandis que les protéines moins représentées s’adsorbent sur les billes et se retrouvent plus concentrées dans l’éluat final. Cette technologie permet d’atténuer les différences de concentrations protéiques au sein des fluides biologiques et ainsi d’identifier un plus grand nombre de protéines (Righetti, Castagna, Antonioli, & Boschetti, 2005),(Righetti, Boschetti, Lomas, & Citterio, 2006). Castagna et collaborateurs ont utilisé cette méthode pour « égaliser » les concentrations protéiques d’un pool d’échantillons urinaires (Castagna et al., 2005). A partir de 200mL d’urine de 8 volontaires (soit au total 1.6 L d’urine), ils ont identifié 383 protéines non redondantes. En comparant leurs résultats avant et après égalisation (figure I.10), il apparaît que le traitement de l’urine par cette technique améliore de manière significative la couverture du protéome urinaire. Page 42 Chapitre I : Etat de l’art Figure I.10 : Nombre de protéines identifiées en fonction de leur poids moléculaire avant et après déplétion partielle des protéines majoritaire d’un pool d’urines de 8 patients (1.6 L) par la méthode Equalizer (Tiré de Castagna et al. 2005). La technologie IEF-OFFGEL : Dans la plupart des cas, le fractionnement d’un mélange peptidique complexe repose sur la combinaison de deux types de séparations chromatographiques d’affinité : les peptides sont tout d’abord séparés selon leur charge sur une colonne SCX (Strong Cation eXchange) sous l’application d’un gradient de sels puis ils sont séparés selon leur hydrophobicité sur une deuxième colonne de phase inverse (RP) sous l’application d’un gradient de phase organique. Ainsi, les technologies DALPC (Direct Analysis of Large Protein Complex) (Link et al., 1999) et MudPIT (multidimensional protein identification technology) (Wolters, Washburn, & Yates, 2001) ont émergé vers la fin des années 90, combinant ces deux types de phases afin de caractériser des protéomes complexes comme ceux du plasma humain ou encore du liquide céphalo-rachidien humain. Cependant, des gradients de sels combinés à des gradients de phases organiques sont bien souvent difficiles à concilier sur une même chaîne de chromatographie liquide et posent des problèmes de robustesse de la méthode analytique développée, tels que des dérives de temps de rétention, bouchages de colonnes. La technique d’IEF-OFFGEL introduite en 1982 par Bjellqvist (Bjellqvist et al., 1982), représente une alternative intéressante aux techniques de fractionnement MudPIT, permettant de contourner les problèmes de robustesses dues à l’utilisation combinée de gradients de sels et de phase organique. Elle représente la première dimension de l’électrophorèse bidimensionnelle permettant de séparer les peptides ou protéines selon leurs points isoélectriques dans un gradient de pH sous l’effet d’un champ électrique. Hubner et collaborateurs (Hubner, Ren, & Mann, 2008) ont utilisé cette technologie de fractionnement en amont de l’analyse LC-MS sur un lysat de cellules HeLa et sur un digestat de levure. Après une digestion en solution de l’échantillon, les peptides ont été séparés selon leur point isoélectrique. Une comparaison des résultats Page 43 Chapitre I : Etat de l’art obtenus par cette technique à une méthode plus conventionnelle qui consiste à séparer les protéines sur un gel SDS PAGE 1D et à les digérer avec la trypsine a été réalisée. La Figure (I.11), tirée de cette publication, montre une nette augmentation du nombre de protéines identifiées en utilisant la technologie IEF-OFFGEL, comparée à la technique plus classique de gel1D.
Introduction générale |