Le protéome urinaire : caractérisation et intérêt pour la recherche de biomarqueurs de pathologies

Le protéome urinaire : caractérisation et intérêt pour la recherche de biomarqueurs de pathologies

Les fluides biologiques et leur rôle dans la découverte des biomarqueurs

Les fluides biologiques ou fluides corporels désignent d’une manière générale des liquides produits par un organisme vivant. On distingue deux types de fluides : les liquides au sein d’un circuit fermé tels que le sang ou le liquide cérébrospinal et les fluides dans un circuit ouvert tels que l’urine ou la sueur. Les deux fluides les plus couramment utilisés en protéomique clinique sont le sang et l’urine car il est facile de les collecter de manière peu invasive et en quantité suffisante pour réaliser différentes études à partir d’un seul prélèvement. Les fluides présentent un défi analytique considérable pour la protéomique en raison de leur gamme dynamique des concentrations protéiques, leur complexité (Adkins et al., 2002) ou la présence de composés interférents (tels que les sels ou les débris cellulaires,…). L’extrême complexité des fluides biologiques, tels que le plasma ou l’urine, représente un enjeu majeur pour la protéomique (N. L. Anderson & Anderson, 2002). Dans le cas du plasma, le rapport de concentration entre les protéines les plus abondantes (albumine) et les moins abondantes (cytokines) peut ainsi atteindre une valeur estimée à 1012, comme l’illustre la Figure I.8. L’albumine, à elle seule représente 55 % des protéines du plasma et les 9 protéines majoritaires constituent 90 % des protéines plasmatiques, alors qu’une vingtaine de protéines représentent, à elles seules, les 99% du contenu protéique total du plasma (Figure I.9). Figure I.8 : Intervalle de concentration de 70 protéines du plasma, d’après N.L Anderson. (N. L. Anderson & Anderson, 2002) Figure I.9 : Distribution des protéines représentant (A) 90% et (B) de 91-99% de la quantité totale de protéines du plasma. a) L’accessibilité aux cohortes d’échantillons Une des difficultés inhérentes à la protéomique clinique repose sur la constitution de cohortes en accord avec les exigences de l’analyse protéomique quantitative, en particulier lorsque l’on utilise des stratégies « Label Free ». Pour la phase de découverte des candidats biomarqueurs, il est nécessaire, d’analyser plusieurs dizaines d’échantillons (Rifai et al., 2006), collectés dans des conditions strictement contrôlées et de minimiser la variabilité entre les patients d’une même population en appariant l’âge, le sexe, les caractéristiques des tumeurs pour les populations pathologiques. Dans la plupart des études cliniques, il est difficile d’obtenir des cohortes de patients qui réunissent l’ensemble de ces caractéristiques. De plus, les performances des outils statistiques utilisés pour discriminer les protéines différentiellement abondantes dépendent du nombre d’analytes mesurés (les peptides) et du nombre d’échantillons considérés. Lorsque le nombre de peptide détectés est grand (typiquement plusieurs milliers), il est souhaitable d’avoir une cohorte importante (centaines de patients). Des méthodes statistiques ont été développées pour tenir compte de la variabilité des échantillons au sein d’une même population et du déséquilibre des matrices peptides-patients (Fu et al., 2008). Le fait que beaucoup d’études de protéomique clinique pour la découverte de biomarqueurs s’appuient sur l’analyse d‘une ou deux dizaines d’échantillons (Chen et al., 2010) met en évidence la difficulté de constituer des cohortes, mais aussi le défi de satisfaire les exigences de la protéomique tout en considérant les contraintes de la clinique. Le travail présentée dans cette thèse, s’appuie sur l’analyse d’une centaine d’échantillons en accord avec les recommandations de Rifai (Rifai et al., 2006). Ceci a constitué un travail considérable des équipes de protéomique et de clinique, pour établir un protocole qui satisfasse les Page 40 Chapitre I : Etat de l’art exigences des statisticiens et des protéomiciens en considérant la difficulté de préparer des échantillons en même temps que se déroule la collecte. Il est à noter, qu’en général, c’est la même personne qui assure la collecte et les premiers traitements de l’échantillon. b) De la collecte au traitement préanalytique des échantillons de fluide biologique Les fluides biologiques sont très sensibles à divers paramètres qui ne sont pas toujours en lien direct avec la pathologie. En particulier, les facteurs préanalytiques et notamment les protocoles de collecte peuvent avoir un rôle déterminant pour les analyses de protéomique quantitative en induisant des différences d’abondance de protéines indépendantes de la pathologie. Il en va de même pour les conditions de conservation des échantillons avant l’analyse. Par ailleurs, la variabilité physiologique inter et intra individuelle doit être prise en compte (Lambert, Berrahmoune, Herbeth, Siest, & Visvikis-Siest, 2007) lors de la conception du design d’une étude clinique. Pour cela, on évalue la variabilité inter individu en analysant une large cohorte de patients de manière à minimiser cet effet et à inclure cette variabilité dans l’analyse statistique. Le projet PPP Plasma Proteome Project, initié en 2002 par l’organisation HUPO, a permis, dans le cas du plasma, de définir des stratégies de collecte, des prérequis pour la préparation et l’analyse protéomique (Rai et al., 2005) tels que l’utilisation d’inhibiteurs de protéase, la température de stockage ou la durée écoulée avant le stockage des échantillons. En ce qui concerne l’urine, la plupart des recommandations sur les traitements préanalytiques se basent sur des études par gel2D (Thongboonkerd, 2007), et comme nous allons le voir par la suite, ne sont pas nécessairement applicables aux études basées sur la MS. Pour obtenir une large couverture de protéomes de fluides biologiques, il apparaît indispensable de fractionner l’échantillon avant l’analyse par spectrométrie de masse de manière à réduire la gamme dynamique. Ce problème de gamme dynamique est une caractéristique de tous les fluides biologiques et, même si elle est moindre dans l’urine, elle n’en reste pas moins un handicap pour les analyses protéomiques. Pour répondre à cette difficulté, il existe différentes approches basées sur le fractionnement protéique comme la séparation sur Gel 1D, l’isoélectrofocalisation ou sur l’immunodépletion des protéines majoritaires ou des méthodes plus originales comme la technologie d’égalisation : « Equalizer ». L’immunodéplétion : Pour la découverte de biomarqueurs dans les fluides complexes comme le plasma, le sérum ou le liquide céphalo-rachidien, il est parfois conseillé de dépléter les protéines de plus hautes abondances pour permettre de détecter les protéines minoritaires qui sont autant de potentiels biomarqueurs. La technique d’immunodéplétion qui consiste en la déplétion par immunoaffinité des protéines majoritaires d’un échantillon est réalisée à l’aide d’un mélange d’anticorps spécifiques immobilisés sur une matrice de chromatographie. Pour cela plusieurs kits commerciaux sont disponibles pouvant dépléter jusqu’à 20 protéines majoritaires du plasma selon le kit utilisé. Bien que l’intérêt de cette approche ait été démontré dans différentes études de protéomique (Pieper et al., 2003), cette méthode de déplétion peut également éliminer d’autres protéines que celles visées à l’origine, certaines protéines abondantes pouvant jouer un rôle de transporteur. et Pour le fractionnement de l’urine, il n’existe actuellement pas de kit commercial permettant d’éliminer une des protéines majoritaires qu’est l’uromoduline. La technologie « Equalizer » : Une autre stratégie, décrite pour la première fois par Thularsiraman en 2005 (Thulasiraman et al., 2005), est basée sur le principe d’affinité : les protéines de l’échantillon se lient à une banque combinatoire d’hexapeptides (206 soit 64 millions ligands) greffés sur des billes de polymethacrylate, pouvant théoriquement sélectionner toutes les protéines. Chaque ligand est présent en quantité identique, permettant de fixer un nombre identique de chacune des protéines du mélange. Sous un ratio billes/échantillon contrôlé, les protéines majoritaires saturent rapidement leur site et sont donc éliminées par lavage, tandis que les protéines moins représentées s’adsorbent sur les billes et se retrouvent plus concentrées dans l’éluat final. Cette technologie permet d’atténuer les différences de concentrations protéiques au sein des fluides biologiques et ainsi d’identifier un plus grand nombre de protéines (Righetti, Castagna, Antonioli, & Boschetti, 2005),(Righetti, Boschetti, Lomas, & Citterio, 2006). Castagna et collaborateurs ont utilisé cette méthode pour « égaliser » les concentrations protéiques d’un pool d’échantillons urinaires (Castagna et al., 2005). A partir de 200mL d’urine de 8 volontaires (soit au total 1.6 L d’urine), ils ont identifié 383 protéines non redondantes. En comparant leurs résultats avant et après égalisation (figure I.10), il apparaît que le traitement de l’urine par cette technique améliore de manière significative la couverture du protéome urinaire. Page 42 Chapitre I : Etat de l’art Figure I.10 : Nombre de protéines identifiées en fonction de leur poids moléculaire avant et après déplétion partielle des protéines majoritaire d’un pool d’urines de 8 patients (1.6 L) par la méthode Equalizer (Tiré de Castagna et al. 2005). La technologie IEF-OFFGEL : Dans la plupart des cas, le fractionnement d’un mélange peptidique complexe repose sur la combinaison de deux types de séparations chromatographiques d’affinité : les peptides sont tout d’abord séparés selon leur charge sur une colonne SCX (Strong Cation eXchange) sous l’application d’un gradient de sels puis ils sont séparés selon leur hydrophobicité sur une deuxième colonne de phase inverse (RP) sous l’application d’un gradient de phase organique. Ainsi, les technologies DALPC (Direct Analysis of Large Protein Complex) (Link et al., 1999) et MudPIT (multidimensional protein identification technology) (Wolters, Washburn, & Yates, 2001) ont émergé vers la fin des années 90, combinant ces deux types de phases afin de caractériser des protéomes complexes comme ceux du plasma humain ou encore du liquide céphalo-rachidien humain. Cependant, des gradients de sels combinés à des gradients de phases organiques sont bien souvent difficiles à concilier sur une même chaîne de chromatographie liquide et posent des problèmes de robustesse de la méthode analytique développée, tels que des dérives de temps de rétention, bouchages de colonnes. La technique d’IEF-OFFGEL introduite en 1982 par Bjellqvist (Bjellqvist et al., 1982), représente une alternative intéressante aux techniques de fractionnement MudPIT, permettant de contourner les problèmes de robustesses dues à l’utilisation combinée de gradients de sels et de phase organique. Elle représente la première dimension de l’électrophorèse bidimensionnelle permettant de séparer les peptides ou protéines selon leurs points isoélectriques dans un gradient de pH sous l’effet d’un champ électrique. Hubner et collaborateurs (Hubner, Ren, & Mann, 2008) ont utilisé cette technologie de fractionnement en amont de l’analyse LC-MS sur un lysat de cellules HeLa et sur un digestat de levure. Après une digestion en solution de l’échantillon, les peptides ont été séparés selon leur point isoélectrique. Une comparaison des résultats Page 43 Chapitre I : Etat de l’art obtenus par cette technique à une méthode plus conventionnelle qui consiste à séparer les protéines sur un gel SDS PAGE 1D et à les digérer avec la trypsine a été réalisée. La Figure (I.11), tirée de cette publication, montre une nette augmentation du nombre de protéines identifiées en utilisant la technologie IEF-OFFGEL, comparée à la technique plus classique de gel1D.

Table des matières

Introduction générale
I. Chapitre I : Etat de l’art
A. La protéomique
1. Des gènes aux protéines
2. Le protéome et la protéomique
3. L’analyse Protéomique
a) De la chimie des protéines à la protéomique
b) Spectrométrie de masse, un outil de choix pour la protéomique
Principes de la technique
i. Source d’ionisation
ii. Les analyseurs
iii. La spectrométrie de masse en tandem
Approches protéomiques par spectrométrie de masse
Couplage chromatographie liquide et spectrométrie de masse en tandem
4. Protéomique quantitative
a) Les méthodes de quantification avec marquage isotopique différentiel
b) Les méthodes de quantification avec standard internes (marquage isotopique)
c) Les méthodes de quantification sans marquage « Label free »
Spectral count
Méthode AMT – Accurate Mass and Time Tags
B. Protéomique clinique
1. Les biomarqueurs
2. Les fluides biologiques et leur rôle dans la découverte des biomarqueurs
a) L’accessibilité aux cohortes d’échantillons
b) De la collecte au traitement préanalytique des échantillons de fluide biologique
C. Contexte clinique de la thèse (DECanBio)
1. La Vessie
2. Les tumeurs de la vessie
3. Les méthodes de détection des tumeurs vésicales
4. Biomarqueurs urinaires du cancer de la vessie
D. Etat de l’art en caractérisation du protéome urinaire
E. Conclusion
II. Chapitre II : Matériel et Méthodes
A. Introduction
B. Techniques de Biochimie
1. Protocole préconisé pour la collecte et le prétraitement des échantillons d’urine
2. Dosage des protéines urinaires
a) Nécessité d’une normalisation
b) Dosage de protéines
3. Préparation des échantillons en vue de l’analyse protéomique
a) Extraction des protéines urinaires
Précipitation à l’acide trichloroacétique
Ultrafiltration
b) Fractionnement – Gel SDS PAGE
c) Digestion des protéines urinaires
Digestion sur gel et extraction des peptides
Digestion en solution et dessalage des peptides
d) Répétabilité des méthodes d’extraction
4. Déplétion et fractionnement des protéines urinaires
a) Fractionnement par isoélectrofocalisation
b) Enrichissement Equalizer
5. Analyse en spectrométrie de masse
a) Reprise des échantillons peptidiques
b) Chromatographie liquide
c) Spectrométrie de masse
Analyses MS/MS
Analyses MS
d) Contrôles qualité des analyses
Calibration du spectromètre de masse Orbitrap XL
Echantillons de contrôles des performances instrumentales
Suivi des analyses
C. Traitement des données
1. Méthode AMT
a) Traitement des données MS/MS
Mascot Distiller
Recherche Mascot
Bases de données Decoy pour la détermination des Faux Positifs
IRMa (interprétation des Résultats Mascot)
hEIDI (Exploitation et Intégration des Données)
Page 6
b) Traitement des données de quantification MS
DeconTools
Viper
2. Qualification des données
3. Analyse statistique « Abundance Index »
4. Analyse des données « data mining »
D. Conclusion
III. Chapitre III : Travaux préliminaires
A. Etude préanalytique : conditions de collecte de l’urine
1. Utilisation d’additifs et stabilisateurs
a) Interférences potentielles dues aux inhibiteurs de protéases
b) Antibactériens
2. Optimisation des conditions de collecte
a) Design expérimental
b) Métriques pour l’évaluation
c) Résultats
B. Standardisation
1. Design de l’étude
2. Observations initiales
3. Etude comparative – AMT
4. Etude comparative – SRM
a) Rendement des méthodes de préparations
b) Gamme dynamique
5. Comparaisons AMT-SRM
C. Conclusion
IV. Chapitre IV : Caractérisation du protéome urinaire
A. Contexte général – Biomarqueurs de pathologies
1. Recherche de biomarqueurs
2. Méthodologie protéomique
B. Exploration du protéome urinaire
1. Fractionnement de l’échantillon
a) Au niveau protéique
b) Au niveau peptidique (IEF) Hors gel
2. Comparaison des techniques de fractionnement
C. Base de données des protéines urinaires
1. Description générale
2. Comparaison avec l’état de l’art
3. Intérêt de l’urine pour la découverte de biomarqueurs de pathologies
D. Conclusion
V. Chapitre V : Découverte de candidats biomarqueurs du cancer de la vessie dans l’urine
A. Constitution d’une cohorte de patients
1. Sélection des patients
2. Classification des patients cancers : facteurs de risque
3. Les cohortes multicentriques .
B. Analyse protéomique quantitative
1. Identification dans la base AMT : réalignement des temps de rétention
2. Quantification par spectral count dans des urines poolées.
3. Analyse semi-quantitative des échantillons individuels par la méthode AMT
C. Analyse des données pour la découverte de candidats biomarqueurs
1. Qualification des données
2. Filtrage des données
3. Résultats: Quantification d’un millier de protéines dans l’urine
4. Découverte de candidats biomarqueurs: statistiques différentielles
D. Candidats biomarqueurs du cancer de la vessie
1. Classification fonctionnelle des candidats
2. Les Exosomes
3. Evaluation critique de la liste de candidats
E. Conclusion