Toxicité des phénols : Approche QSAR

Toxicité des phénols : Approche QSAR

Collecte de données et méthodologie

L’ensemble de données relatives aux phénols (tiré de Schultz et al [99] comme pour les anilines précédemment traités) a été divisé au hasard en un ensemble d’apprentissage (62 objets), utilisé pour développer le modèle QSAR, et un ensemble de validation (33 objets), utilisé uniquement pour la validation statistique externe (tableau 13). Les structures de toutes les molécules ont été pré-optimisées à l’aide du champ de force MM+ de la mécanique moléculaire (algorithme Polak-Ribiere) en utilisant le programme HyperChem 6.03 [102]. Les géométries finales d’énergie conformationnelle minimale ont été obtenues par la méthode semi-empirique AM1. Les géométries ainsi optimisées ont été transférées dans le logiciel DRAGON [103] pour calculer 1664 descripteurs. Les descripteurs avec des valeurs constantes ou quasi constantes dans chaque groupe ont été rejetés. Pour chaque paire de descripteurs corrélés (avec un coefficient de corrélation r ≥ 0,95), celui présentant la plus forte corrélation des paires avec les autres descripteurs a été exclu. La structure chimique de chaque composé a été introduite sur un PC en utilisant le programme E-CALC [113] pour calculer les indices d’état électrotopologique (E–state indices) de Kier et Hall [114, 115]. La sélection des variables a été effectuée sur l’ensemble d’apprentissage, en utilisant l’algorithme génétique (AG) dans la version de MobyDigs de Todeschini [105] en maximisant la variance expliquée par validation croisée par omission d’une observation 2 QLOO .en utilisant la régression par les moindres carrés ordinaires pour la sélection de sous-ensembles. Dans le logiciel MobyDigs les processus de croisement et de mutation de l’algorithme génétique sont contrôlés par un paramètre T variant de 0 à 1. Les paramètres de l’algorithme génétique ont été fixés comme suit : population des modèles Pop = 100 ; valeur de T fixée à 0,5 pour équilibrer les rôles des deux processus de croisement et de mutation.

Présentation et discussion du modèle QSAR

Qualités internes du modèle QSAR : Parmi plus de 100 modèles simples avec deux variables explicatives, nous avons choisi le modèle avec la meilleure valeur du paramètre de prédiction 2 QLOO . Ce dernier a été construit en utilisant : logkow et s-CH3. Les valeurs de ces descripteurs sont aussi résumées dans le tableau

Toxicité des phénols

Approche QSAR 66 Tableau 13. Valeurs de log KOW , 3 S CH et de la concentration inhibitrice de la croissance 50 pIGC pour l’ensemble des 95 phénols. Les 33 derniers composés sont l’ensemble de validation.L’équation du modèle optimal peut s’écrire comme suit : pIGC K S CH 50 3 1,136 0,078 0,701 0,031 log 0,089 0,013 OW (68) Ici : log KOW est tiré de la littérature [99] et s-CH3 est calculé avec le logiciel E-CALC. Le tableau 14 résume le teste de corrélation concernant les variables du modèle. Aucune anomalie n’est à signalée. Tableau 14 Matrice de corrélation des descripteurs du modèle 50 pIGC log KOW log KOW 0,919 3 S CH 0,345 0,602 Les paramètres statistiques pertinents sont rapportés dans le tableau ci-dessous : Tableau 15 Paramètres statistiques pour l’ensemble de calibrage (Phénols) tr n 2 R 2 QLOO 2 QLMO/50 2 QBOOT 2 Radj SDEC SDEP S F 62 91,15 90,16 89,57 89,43 90,85 0,238 0,251 0,244 303,81 Les valeurs 2 R et 2 Radj attestent des bonnes performances d’ajustement du modèle qui, de plus, est très fortement significatif (grande valeur du paramètre de Fisher F). Le modèle est robuste, la différence entre 2 R et 2 Q est faible. Le modèle montre une très bonne stabilité dans la validation interne (la différence entre 2 QLOO et 2 QLMO/50 est d’environ 1%), tandis que le bootstrap confirme la prédictive interne et la stabilité du modèle.

Toxicité des phénols

Approche QSAR 68 Les valeurs prédites expérimentales et calculées des deux ensembles (calibrage et validation) sont dans le tableau 16, en plus des valeurs des leviers et des résidus standardisés de prédictions. Tableau 16. Valeurs de 50 pIGC expérimentales prédites et calculées, leviers et résidus standardisés de prédictions des 95 phénols

Qualité externe du modèle QSAR

L’application du modèle au 33 composés de validation conduit aux statistiques du tableau 17 où on constate que ext SDEP est un peu différent de SDEP (tableau 15) ; le modèle fonctionne un peu moins bien dans la prédiction interne que dans la prédiction externe. Tableau 17. Paramètres statistiques pour l’ensemble de validation pour les 33 phénols ext n 2 Qext ext SDEP 33 91,84 0,229 Les résultats de la validation externe selon (Golbraikh et Tropsha 2002) confirment la validité du modèle et sont comme suit : 1) 2 EXT Q 0 9 ,868 > 0,5 2) 2 R 0, 6 869 > 0,6 .