Comparaison entre les modèles obtenus par les différentes répartitions:

Comparaison entre les modèles obtenus par les différentes répartitions:

Dans ce chapitre nous allons comparer les paramètres statistiques obtenus par les différentes répartitions c’est-à-dire les cinq choix aléatoires et le choix effectué à l’aide de l’algorithme DUPLEX.tableaux 12, 13, 14, 15 et 16) on trouve qu’il y a une différence notable, visible dans les figures 17, 19, 21, 23, et 25. On remarque aussi que l’intervalle de variation pour les paramètres statistiques R², R²adj, Q²LOO, Q²Boot, et Q²LMO (10%,20%,30%et 50%) varie d’une manière constante selon le choix. Par contre, l’intervalle de variation pour les différentes valeurs de Q²ext est plus grand. Il est presque le double des premiers (R², R² adj, Q²LOO, Q²Boot et Q²LMO). Le tableau-19 montre les variations des paramètres selon les choixLes choix aléatoires peuvent donner de bons ou de mauvais résultats, mais l’algorithme DULEX donne un unique résultat. La grande différence entre les valeurs de Q²ext (ΔQ²ext = 10%), par rapport aux autres paramètres est expliquée par la manière de sélectionner des deux ensembles (validation, calibration), les figures 18, 20, 22, 24, et 26 montrent la distribution des points de validation et calibration. Dans le cas du DUPLEX, les points sont répartis de façon homogène il sont distribués et représentes presque dans tout le domaine de définition des variables explicatives.

Mais pour les choix aléatoires les points sont regroupés soit aux centre ou bien dans une seule région. On conclut que le modèle par DUPLEX est validé sur un ensemble de composés homogène, qui explique l’utilisation de l’algorithme DUPLEX pour la sélection de l’ensemble de validation. L’ensemble de calibration lui aussi est plus homogène, pour cette raison on a des paramètres statistiques de quelques choix aléatoires meilleurs que celui de DUPLEX, ce sont des choix heureux, on dit que ces modèle (choix aléatoire) sont construits et validés sur des ensembles serrés.D’après les principes de base pour l’établissement des modèles QSAR, les valeurs des descripteurs doivent être obtenues de la même source ou calculées en utilisant le même logiciel, donc il est impératif de sélectionner, dés le départ une seule méthode théorique sur laquelle on calcule un descripteur qui peut donner les meilleurs résultats. Pour cela, et comme on a utilisé quatre logiciels différents qui sont basés sur différentes approches théoriques pour calculer les valeurs de logP, on fait une comparaison ente les différent modèles (MLOGP, ALOGP, CLOGP et LOGKowwin) afin d’obtenir le meilleur modèle. Le modèle LOGKow, puisé dans la littérature, est employé comme référence.

En conclusion, les QSAR constituent un outil puissant d’information sur les caractéristiques probables d’une substance à condition d’être maniés et interprétés par un utilisateur averti. Ils peuvent permettre d’éviter des tests expérimentaux ou de ne les effectuer que lorsque l’interprétation des résultats laisse planer une suspicion. Ils peuvent permettre aussi de compléter l’information expérimentale. Les QSAR sont faciles à mettre en oeuvre, ils fournissent un résultat immédiat et leurs coûts sont sans commune mesure avec ceux engendrés par la réalisation de tests expérimentaux.La validation des QSAR passant d’abord (dans notre cas) par le choix des ensembles de training et test, vu que ce choix peut influencer les résultats. On utilisé la méthode décrite par R. D. Snee pour cet éclatement. La méthode DUPLEX éprouve autant que possible (les données disponibles) les modèles construits. Il reflète avec plus de justesse, que les choix aléatoire, la qualité des modèles discutés.

Finalement, les objectifs principaux de cette thèse ont donc été remplis dans le sens où ils ont permis de mettre en évidence des méthodologies efficaces, en accord avec les règles mises en place par l’OCDE quant à la validation des modèles QSAR :Puisque la sélection des deux ensembles (19 pour calibration et 74 pour validation), avec l’algorithme DUPLEX donne des résultats stables et uniques, nous allons utilisés les modèles précédemment développer.D’après les principes de base pour l’établissement des modèles QSAR, les valeurs des descripteurs doivent être obtenues de la même source ou calculées en utilisant le même logiciel, donc il est impératif de sélectionner, dés le départ une seule méthode théorique sur laquelle on calcule un descripteur qui peut donner les meilleurs résultats. Pour cela, et comme on a utilisé quatre logiciels différents qui sont basés sur différentes approches théoriques pour calculer les valeurs de logP, on fait une comparaison ente les différent modèles (MLOGP, ALOGP, CLOGP et LOGKowwin) afin d’obtenir le meilleur modèle. Le modèle LOGKow, puisé dans la littérature, est employé comme référence.

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *