Structural characterization N-WASP domain V using MD simulations NMR SAXS data
La première protéine choisie pour notre étude combinée DM-SAXS/RMNest le domaine V de la protéine neuronale du syndrome de Wiskott-Aldrich (N-WASP), qui est impliquée dans la régulation de la polymérisation de l’actine. Son nombre de résidus est de 67, ce qui donne des temps de calcul raisonnables, et en fait un bon candidat pour mettre en place notre méthodologie.
Le premier problème qui se pose, quand on veut valider des résultats de si mulation en utilisant le SAXS, ou bien intégrer des courbes de diffusion dans des simulations, est de savoir calculer correctement l’intensité de diffusion des rayons X à partir d’une structure atomique. Nous avons donc dans un premier temps comparé plusieurs logiciels de calcul de l’intensité de diffusion I(q) et optimisé les paramètres ajustables.
Le calcul de I(q) passe par le calcul de trois amplitudes de diffusion : celle relative aux atomes de la macromolécule étudiée, celle relative au volume de solvant exclu par la présence de la macromolécule dans la solution, et celle relative à l’excès de la densité de solvant dans la couche d’hydratation par rapport au solvant dans le « bulk ». En ce qui concerne cette troisième quantité, il existe deux types d’approches,
les méthodes dites avec le solvant implicite et les méthodesaveclesolvant explicite (voir Tab. 1 de la Référence. [153] pour une liste des principaux logiciels). Les approches avec le solvant explicite prennent géné ralement beaucoup de temps et sont donc difficiles à appliquer à un très grand nombre de structures atomiques si l’on ne dispose pas de très bons moyens de calcul. Les logiciels basés sur les modèles implicites de solvatation réduisent les coûts de calcul, mais nécessitent de fixer des paramètres ajustables, en particu lier la densité de la couche d’hydratation du soluté.
De plus, comme indiqué par Grudinin et al. (Voir Tab. 9 de la Réf. [130]), ces paramètres ont généralement été optimisés en ajustant les courbes calculées aux courbes mesurées sur des pro téines bien structurées adoptant une seule conformation. Le défi consiste donc à trouver une valeur optimale pour la densité de la couche d’hydratation du domaine V de N-WASP intrinsèquement désordonné, qui peut adopter une grande variété
Chapitre 3. Structural characterization of N-WASP domain V using MD simulations with NMR and SAXS data de conformations. Nous avons ainsi décidé de déterminer la valeur de la densité de l’eau dans la couche d’hydratation, à introduire dans les logiciels avec solvant implicite, en faisant une comparaison avec les courbes calculées par un logiciel avec solvant explicite, qui ne nécessite pas d’ajustement de ce paramètre.
Deuxièmement, nous avons également identifié les champs de force les plus appropriés pour les simulations de DM pour cette IDP. En effet, puisque les champs de force et les modèles d’eau ont d’abord été développés pour les protéines glo bulaires (ayant leurs résidus hydrophobes à l’intérieur de la protéine) et au vu des études bibliographiques, il semble que de récents champs de force soient plus adaptés pour les IDPs.
C’est pourquoi, nous avons voulu savoir si pour le do maine V de N-WASP, il existait un ou plusieurs champs de force susceptibles de reproduire dans un premier temps une information globale, le rayon de giration. Une fois déterminés les paramètres d’ajustement ainsi que les champs de force les plus appropriés pour notre système, des ensembles conformationnels de cette IDP ont été crés par de multiples simulations de dynamiques moléculaires, et comparés avec les données locales de RMN et globales de SAXS.
Vous trouverez le détail des résultats dans ce chapitre. L’étape suivante pour caractériser l’ensemble conformationnel d’une IDP, dé taillée dans la revue [30], consiste à obtenir celui qui reproduit au plus près les données expérimentales. Comme indiqué dans la revue, il existe deux grands types d’approches pour sélectionner cet ensemble :
i) les méthodes utilisant le principe de maximum d’entropie qui, soit génèrent des conformations en incor porant directement les données expérimentales dans les simulations, soit fonc tionnent a posteriori en pondérant chaque conformation de l’ensemble confor mationnel obtenu par dynamique moléculaire, afin de reproduire les données expérimentales (les logiciels les plus utilisés dans ce cas étant EROS [295], COPER [195], ENSEMBLE [62]);
ii) les méthodes inspirées du principe du ra soir d’Ockham, aussi appelé principe du maximum de parcimonie, qui cherchent à obtenir le minimum de conformations permettant de reproduire les data (par exemple, les logiciels EOM [20, 343], ASTEROID [245], BSS-SAXS [320]). Nous avons utilisé le programme COPER [195] et le programme GAJOE de EOM [20, 343] pour ces deux approches, respectivement.