Le docking moléculaire
Le plus important dans l’étape de Docking est de parcourir le mieux possible l’espace conformationnel. La complexité dans cette mise en œuvre, réside dans le nombre de degrés de liberté, de translation, de rotation, en plus des conformations de départ possibles du ligand. Afin d’éviter des calculs que les machines ne peuvent résoudre ou seulement dans des temps bien trop importants, plusieurs approximations sont possibles. Les algorithmes de recherche de la flexibilité du ligand peuvent se classer en algorithme : combinatoire, stochastique, et déterministe.
Définition
Les interactions entre molécules sont à la base des mécanismes biologiques. Les détails de ces interactions, au niveau moléculaire sont donc d’un très grand intérêt et peuvent être étudiés par cristallographie aux rayons X ou résonnance magnétique nucléaire (RMN). Le docking moléculaire in silico a pour but de prédire la structure d’un complexe moléculaire à partir des molécules isolées[41], ce qui est considérablement plus facile à mettre en œuvre, moins cher et plus rapide que l’utilisation des méthodes expérimentales . Les logiciels de docking sont donc des outils très utilisés en chimie, biologie, pharmacie et en médecine, car la plus part des principes actifs sont des petites molécules (ligands) qui interagissent avec une cible biologique d’intérêt thérapeutique, généralement protéique (récepteur). Comprendre comment un ligand s’attache ou interagit avec une cible protéique afin de l’inhiber ou l’activer est d’une importance capitale dans la recherche et l’industrie pharmaceutique. C’est dans ce chapitre que nous allons présenter et illustrer l’état de l’art du Docking moléculaire.
Etat de l’art du Docking Moléculaire
Quel matériel faut-il pour le docking moléculaire ?
La première question est de savoir où se trouvent les structures chimiques des cibles visées à traiter. Afin de répondre à cette question, il est nécessaire d’aller directement à la Bank PDB [42] (http://www.pdb.org) et déterminer où sont déposées les structures de ces cibles. A présent, la PDB contient plusieurs milliers de structures protéiniques obtenues soit par cristallographie aux rayons X, soit par RMN. Si la cible n’est pas encore déposée au niveau de la Bank et cette dernière contenant une protéine avec des séquences similaires, la modélisation par homologie intervient afin de construire la structure 3D de la cible souhaitée. La deuxième question est de savoir où se trouve la structure du (ou des) ligand(s) utilisé(s) lors du docking moléculaire. Il y a deux grandes sources de structures chimiques des ligands. La première représente les programmes informatiques de modélisation moléculaire, où les différentes structures sont générées par optimisation de géométrie. Ces structures sont gouvernées par les lois de la chimie quantique. Ces structures peuvent être aussi obtenues par des langages comme SMILES [43] (Simplified Molecular Input line Entry System). Nous citons comme exemple les programmes qui génèrent des SMILES : (a) ChemDraw Ultra™ (http://www.cambridgesoft.com/) (b) KnowITALL chemWindow ™ (http://www.biorad.com/) (c) ISIS/Draw™ (http://www.mdli.com/) (d) ACD/ChemSketch™ (http://www.acdlabs.com/) …. etc. La seconde source de structures de ligands est parfois d’aspect commercial, où on trouve des bases de données de structures chimiques reliées à des critères générés par des programmes informatiques comme l’assignement de l’état correct de protonation, les charges partielles, les formes tautomériques ….etc. Nous citons des Banks comme : – The Availble Chemical director™ (http://www.mdl.com/product/experiment/availble_chem_dir) – The iResearch™ library (http://www.chemnavigator.com/one/products/iRL.asp) – The national Cancer Institute Database(http://129.43.27.140/ncidb2/download.html) – The ligand.Info database [44] (http://blaster.docking.org/Zinc/) Cette dernière base de données a un accès gratuit où on peut télécharger différentes structures de ligands. Elle représente une grande importance aux scientifiques qui s’intéressent au docking et au criblage virtuel du fait que les structures trouvées au sein de cette Bank sont assignées à des propriétés physico-chimiques telles que le poids moléculaire, logP, nombre de liaisons rotatables, nombre d’atome donneurs d’hydrogène, nombre d’atomes accepteurs d’hydrogène, nombre des centres chiraux, nombre de doubles liaisons chirales (isomérie Z/E), charges nettes, nombre de fragments rigides,….etc.
Comment fonctionne un programme de docking moléculaire ?
Un programme de docking moléculaire a pour but de prédire correctement le meilleur mode d’interaction entre deux entités chimiques. De ce fait, tout programme de docking repose sur deux composantes principales et majeures: d’une part, un algorithme de recherche ou encore heuristique d’échantillonnage, qui soit capable de rechercher et générer toutes les conformations possibles et donc générant les modes d’interaction possibles, et d’autre part, une fonction objective dite fonction de score capable d’identifier parmi tous les modes générés, le mode correspondant à la vraie interaction. Cependant, chaque programme de docking diffère par rapport aux autres par la manière de recherche de l’espace conformationnel et la fonction de score qui le guide. En analysant la structure 3D des complexes protéine-ligand plusieurs degrés de flexibilité peuvent être considérés. La première approche indique que les deux entités sont des corps rigides, et donc il n’y a aucun degré de liberté sur les liaisons. Ceci est la base de l’algorithme le plus simple de recherche conformationnelle, et de ce fait il est la base des premiers programmes de docking moléculaire [45] . L’approche la plus récente dans le traitement de la flexibilité, considère la cible protéique comme corps rigide, tandis que le ligand est flexible. En effet elle représente l’approche la plus utilisée dans la plupart des logiciels ou programmes de docking. Néanmoins, celle-ci reste approximative, du fait que le récepteur ne doit pas être considéré comme corps rigide (au moins la flexibilité du site d’interaction doit être prise en compte).
Obtention des structures
La majorité des structures protéiques sont disponibles via la «Protein Data Bank » [46], un grand nombre de structures d’une même molécule avec ou sans ligand permet d’avoir une information pertinente. Quand la méthode expérimentale n’est pas possible ou n’a pas été encore réalisée, la solution à envisager en premier est une approche par modélisation comparative [47] . Il s’agit de prédire un modèle d’après d’autres molécules, le plus proche possible de celle étudiée et dont les structures sont connues expérimentalement. La conformation d’une protéine étant codée par sa séquence en aminoacides, la première étape est d’effectuer un alignement de séquence pour identifier les molécules similaires. La recherche d’homologues peut s’effectuer principalement par trois voies. En premier lieu la méthode développée par Needleman et Wunsch qui utilise un algorithme de programmation dynamique pour réaliser un alignement global puis celle de Smith et Waterman, semblable à la précédente mais qui réalise des alignements locaux et enfin au moyen de recherches par heuristique, qui permettent de travailler avec un nombre de séquences beaucoup plus grand. Parmi ces méthodes, on peut citer les approches utilisées par les logiciels BLAST (Basic Local Alignment Search Tool) [48] et FASTA [49] . Il est possible d’obtenir une structure secondaire uniquement à partir de la séquence de la molécule en étudiant la composition locale des séquences et en la comparant à des bases de données dans lesquelles sont identifiées les tendances qu’ont certains acides aminés à former des structures particulières. Mais pour une simulation de Docking, cette structure n’est pas suffisante. Une fois l’étape d’alignement effectuée, il est possible de réaliser l’étape de modélisation comparative qui doit produire une structure représentative de la séquence fournie, à l’aide d’un modèle choisi grâce aux homologies qu’il présente avec cette séquence. Plusieurs logiciels existent, nous citons par exemple les programmes Jackal [50] et Modeller [51] Jackal est composé d’une suite de logiciels permettant la construction d’une structure basée sur une méthode d’évolution artificielle. Modeller permet une modélisation comparative par satisfaction des contraintes spatiales. La précision de la structure obtenue dépend principalement du degré de similarité avec les séquences de référence sélectionnées, ce qui peut poser des problèmes pour la structure globale de la protéine, le taux de similarité n’étant pas constant sur toute la séquence. Ces restrictions font que ces modèles ne sont pas toujours exploitables en Docking moléculaire.