MODELISATION DU PROBLEME ETUDIE
Analyse de la durée d’exécution des tâches de criblage virtuel
Description des jeux de données utilisés
Comme évoqué dans le chapitre 2, le criblage virtuel a pour objectif de calculer l’énergie de liaison d’un ligand au site actif d’une protéine d’intérêt dans le traitement d’une maladie. Nous avons choisi différents jeux de données pour analyser les propriétés des tâches de docking. Toutes nos analyses ont été menées avec le logiciel Autodock (Morris et al, 2009), qui fait partie des logiciels libres de référence pour le criblage virtuel. Développé au Scripps Research Institute (http://autodock.scripps.edu), il est distribué avec une suite d’outils graphiques pour préparer les expériences de criblage virtuel, ainsi que plusieurs tutoriels, améliorant ainsi son accessibilité.
Cité dans plusieurs articles scientifiques (Park, Lee et Lee, 2006)(Lin et al, 2002) (Lin et al, 2003), il a joué un rôle majeur dans le développement préclinique de la molécule Raltegravir (inhibiteur de l’intégrase du VIH), dont la distribution sur le marché américain a été autorisée fin 2007 par la FDA (Schames et al, 2004). Nous avons utilisé pour nos tests la version Autodock Vina (Trott & Olson, 2010) bénéficiant notamment d’une nouvelle fonction de score de l’ancrage entre ligand et cible. La base de données fournie par l’INPC rassemble un total de 323 ligands de composés extraits à partir des plants vietnamiens.
Au démarrage de la thèse, cette base de données n’était pas encore disponible et nous avons choisi pour nos tests d’utiliser la base de données ZINC (Irwin, Sterling, Mysinger, Bolstad, & Coleman, 2012) qui fournit gratuitement les structures de composés disponibles dans le commerce pour le criblage virtuel. ZINC contient plus de 35 millions de composés dans des formats compatibles avec les logiciels de docking les plus courants. ZINC est fourni par le Laboratoire Shoichet au département de chimie pharmaceutique à l’Université de Californie, San Francisco (UCSF).
Criblage virtuel sur une cible biologique de la dengue
La figure 4-1 présente un histogramme des temps d’exécution sur un ordinateur personnel du criblage de 2108 ligands extraits de la librairie ZINC contre la protéine 1OKE d’intérêt pour le traitement de la dengue avec le logiciel Autodock Vina. La plupart des temps de calcul sont 78 compris entre 12’ et 22’ (85,58%) avec un temps de calcul le plus court observé de 6’13’’ et le plus long de 29’14’’. Figure 4-1: Histogramme du temps de calcul de docking contre la protéine 1OKE (virus de la dengue)
La figure 4-2 présente la variation du temps de calcul en fonction de la taille du fichier de ligand. Elle fait clairement apparaître une forte corrélation. Figure 4-2: Relation entre la taille de fichier de ligand et le temps de calcul dans le projet de criblage virtuel contre la dengue Le meilleur ajustement d’une corrélation linéaire entre la taille du fichier de ligand et le temps de calcul est représenté sur la figure 4-2: y = 0.422x – 344,51 0 50 100 150 200 250 300 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Fréquence Temps de calcul (min) Histogramme du temps de calcul (Dengue) y = 0.422x – 344.51 R² = 0.9639 0 200 400 600 800 1000 1200 1400 1600 1000 1500 2000 2500 3000 3500 4000
Temps de calcul (seconds) Taille de fichier ligand (octet) Le temps de calcul vs la taille de fichier de ligand (Dengue) 79 avec R2 = 0,9639 (R2 est le coefficient de détermination qui représente l’accord entre la fonction et la donnée réelle. La définition de R2 est représentée dans [70]. 4.2.3 Criblage virtuel sur une cible biologique de la maladie d’Alzheimer La figure 4-3 présente la distribution des temps de calcul de criblage virtuel de 1392 ligands extraits de ZINC sur la protéine 1EVE d’intérêt pour le traitement de la maladie Alzeihmer. Les temps de calcul varient pour la plupart (95,85%) entre 4 et 12 minutes. Le temps de calcul le plus long observé est de 25’8’’, le temps le plus court de 4’21’’.