METHODES STATISTIQUE ET NEURONALE POUR LA PREDICTION DE QUELQUES PROPRIETES PHYSIQUES (Teb, Tc, Pc)

METHODES STATISTIQUE ET NEURONALE POUR LA PREDICTION DE QUELQUES PROPRIETES PHYSIQUES (Teb, Tc, Pc)

LA MÉCANİQUE MOLÉCULAİRE

Si une molécule est trop grosse pour subir un traitement semi-empirique, il est toujours possible de modéliser son comportement en évitant complètement la mécanique quantique. Les méthodes désignées par mécanique moléculaire, établissent une expression algébrique simple de l’énergie d’un composé, sans avoir à calculer une fonction d’onde ou une densité électronique totale [23]. L’expression de l’énergie consiste en des équations classiques simples, comme l’équation de l’oscillateur harmonique, dans le but de décrire l’énergie associée à l’étirement de liaison, de flexion, de rotation, et aux forces intermoléculaires, telles que les interactions de Van der Waals et de liaison hydrogène. Toutes les constantes apparaissant dans ces équations doivent être obtenues à partir de données expérimentales ou d’un calcul ab initio. Dans une méthode de mécanique moléculaire, la base de données des composés utilisés pour paramétrer la méthode (un ensemble de paramètres et de fonctions est appelé un champ de force) est cruciale pour son succès. La méthode de mécanique moléculaire peut être paramétrée à partir d’une classe spécifique de molécules, telles que des protéines, des molécules organiques, organo-métalliques, etc… La mécanique moléculaire permet la modélisation de très grosses molécules, comme les protéines et des segments de DNA, la faisant le premier outil de la biochimie computationnelle. Le défaut de cette méthode est qu’il y a beaucoup de propriétés chimiques qui n’y sont pas définies, comme par exemple les états électroniques excités. De plus, pour travailler avec des systèmes très grands et très compliquées, les logiciels doivent être très puissants et faciles dans l’utilisation des interfaces graphiques. III-1. Pas de calculs de champ de force sans définition préalable des types d’atomes. La géométrie de la molécule traitée (caractérisée par les coordonnées internes ou les coordonnées cartésiennes), le numéro atomique de chaque noyau, et l’état général de charge et de spin, constituent le nombre minimal d’entrées préalable à un calcul par mécanique moléculaires. Les informations concernant les distributions des électrons, en terme de densité électronique ou de fonction d’onde, ou les charges atomiques partielles, sont mieux interprétées sur la base de la géométrie moléculaire. Dans le contexte de la méthodologie du champ de force, l’entrée de la charge totale et du spin d’une molécule n’est pas obligatoire car ces types de calculs ne traitent  pas des électrons. Pour représenter l’aspect électrostatique, il n’est même pas besoin des charges atomiques partielles si l’on utilise, par exemple, des dipôles de liaisons. Au contraire de la mécanique quantique, la mécanique moléculaire nécessite plus d’informations que le numéro atomique seul. En fait, chaque atome doit être décrit de manière plus détaillée. Le concept de types d’atomes permet une différenciation en termes d’environnement local, d’état d’hybridation, ou de conditions spécifiques telle que la tension dans les systèmes comportant un petit anneau. Allinger et ses co-auteurs, qui ont développé les champs de force MM2, MM3, et MM4 pour les « petites molécules » [cf : III-3] ont défini dans la paramétrisation de MM3 plus de 15 types d’atomes différents pour le seul carbone. A savoir, alcanes sp3 , alcènes sp2 , cyclopropanes sp2 , carbonyles sp2 , alcynes sp etc…, tous nécessaires pour rendre MM3 applicable (ce qui signifie l’obtention de résultats raisonnables) pour un ensemble de molécules diverses. On peut constater immédiatement la difficulté de cette approche : le plus d’atomes définis, le plus de paramètres de contribution à la fonction énergie potentielle (liaisons, angles, dièdres…) doivent être développés. Des champs de force plus généraux affecteront donc, un seul type d’atome de carbone générique sp2 , sacrifiant en faveur d’une application générale. Une autre tendance consiste à utiliser pour les champs de force de classes spécifiques des types d’atomes plus importants en nombres, qu’on ne le ferait dans le cas de paramétrisations pour une application générale.

Forme fonctionnelle des champs de force courants

Un champ de force ne consiste pas uniquement en une expression mathématique qui décrit l’énergie d’une molécule en fonction des coordonnées atomiques. La deuxième partie indispensable est le jeu de paramètres lui-même. Deux champs de force différents peuvent présenter la même forme fonctionnelle, mais utilisent un paramétrage complètement différent. D’un autre côté, différentes formes fonctionnelles peuvent conduire à des résultats presque identiques, en fonction des paramètres mis en jeu. Cette comparaison montre que les champs de force sont empiriques : il n’y a pas de forme « correcte ». Parce que certaines formes fonctionnelles donnent de meilleurs résultats que d’autres, la plupart des implémentations dans les logiciels disponibles (académiques et commerciaux) sont très similaires.  Une hypothèse importante est que le champ de force déterminé à partir d’un ensemble de molécules est transférable à d’autres molécules. Notons qu’un ensemble de paramètres développés et testés sur un nombre relativement petit de cas est encore applicable à une plus large gamme de problèmes. En outre, les paramètres développés à partir de données relatives à de petites molécules peuvent être utilisés pour étudier des molécules plus grandes telles que les polymères. III-3. Quelques exemples Parmi les champs disponibles nous citerons les plus répandus largement utilisés pour le traitement de petites molécules. -MM2, MM3, et MM4 : (http://europa. chem. uga. edu/allinger/mm2mm3.html). Introduit par Allinger et al.[24-27], largement utilisé pour le traitement de petites molécules. -AMBER : (Assisted Method Building and Energy Refinement) (http://amber. scripps. edu) Introduit par Cornell et al. [28] très largement utilisé dans le traitement des protéines et des acides nucléiques. -CHARMM : (Chemistry at Harvard molecular Modeling) (http://yuri. harvard. edu) Développé par Mackerall, Karplus et al., [29-31] qui est largement utilisé pour la simulation de petites molécules et jusqu’aux complexes solvatés de grandes macromolécules biologiques. CHARMm est une version commerciale disponible de CHARMM qui est également applicable aux petits composés organiques [32]. -MMFF : (MerckMolecular Force Field) Développé par Halgren [33-34], il est similaire à MM3 dans la forme, mais en diffère par son application focalisée sur les processus de condensation de phases (en dynamique moléculaire). Il reproduit l’exactitude MM3 pour les petites molécules, et est applicable aux protéines et autres systèmes d’importance biologique. Les différents champs de force se distinguent par trois aspects principaux : 1) La forme de la fonction de chaque terme énergétique. 2) Le nombre de termes croisés (qui reflètent le couplage entre coordonnées internes) inclus. Partie théorique Page 28 3) Le type d’information utilisé pour ajuster les paramètres. III-4. Représentation simple d’un champ de force Beaucoup de champs de forces utilisés actuellement pour la modélisation moléculaire peuvent s’interpréter en termes d’une représentation relativement simple à quatre composantes des forces intra et intermoléculaires internes au système considéré. Les pénalités énergétiques sont associées aux écarts des liaisons et des angles par apport à leurs valeurs de ‘référence’ ou ‘d’équilibre’, il y a une fonction qui décrit la façon dont l’énergie change lors de la rotation des liaisons, et finalement le champ de force contient des termes décrivant l’interaction entre des parties non liées du système. Des champs de forces plus sophistiqués peuvent comporter des termes additionnels, mais ils présentent invariablement ces quatre composantes. Un fait intéressant lié à cette représentation est qu’on peut imputer les variations à des coordonnées internes spécifiques telles que les longueurs et les angles de liaisons, la rotation des liaisons ou les mouvements des atomes relativement les uns aux autres. Ce qui permet de comprendre facilement comment les changements des paramètres du champ de force affectent ses performances, et aident également dans le processus de paramètrisation.

Table des matières

PARTIE THEORIQUE
I-LA MODÉLİSATİON MOLÉCULAİRE
II-OPTİMİSATİON DE LA GÉOMETRİE DES MOLÉCULES
II-1- La Méthode de HARTREE-FOCK-ROOTHAAN (Méthode de HFR
II-1.1. Energie d’un micro système représenté par un déterminant de Slat
II-1-2. Détermination des Orbitales ou équations de Hartree-Fock
II-1-3. Equations de Roothaan et Hall.
II-1-4. Quelques remarques sur les processus de résolution des équations de Hartree-FockRoothaan
II-1-5. Détermination des intégrales de la méthode de Hartree-Fock-Roothaan (HFR).
II-2.Les méthodes semi-empiriques
II-2-1. Définition du semi-empirisme
II-2-2. Quelques théories semi-empiriques
II-2-3. Limites et avantages des méthodes semi-empiriques
II-3. Analyse des distributions de charges.
II-3-1. Analyse de population de Mulliken
II-3-2. Calcul du moment dipolaire
II-3-3. Application
III- LA MÉCANİQUE MOLÉCULAİR
III-1. Pas de calculs de champ de force sans définition préalable des types d’atomes
III-2. Forme fonctionnelle des champs de force courants
III-3. Quelques exemples
III-4. Représentation simple d’un champ de force
III-5. Champ de force MM2 et MM+
III-5- 1. Champ de force MM2
III-5-2. Champ de force MM+
IV-LA DYNAMİQUE MOLÉCULAİRE
IV-1. Principe de la dynamique moléculaire
IV-2- Application de la dynamique moléculaire
V- LES ÉTUDES QSAR/QSPR
V-1. Les descripteurs moléculaires : Que sont-ils ?
V-1-1. Définition
V-1-2. Caractéristiques d’un descripteur idéal
V-2. Les types de descripteurs
V-3. Analyse des descripteurs
VI. Relations quantitatives structures activités/propriétés (QSAR/QSPR)
VI.1-Introduction
VI.2. Historique
VI.3. Définition
VI.4. Principe
VI.5. Stratégie globale
VII. Base de données
VII.1. Source de données
VII.2. Homogénéité de la distribution des valeurs
VII.3. Les propriétés ciblées dans ce travail
VIII.1. Sélection d’un sous- ensemble de variables par algorithme génétique (GA- VSS)
VIII.2. Méthodes utilisées pour le développement de modèles QSAR/QSPR
VIII.2. 1. La régression linéaire multiple
VIII.2.2. Réseaux de Neurones Artificiels
VIII. 2.2.2. Propriétés des réseaux de neurones
VIII.2.2.3. Les différents types de réseaux de neurones
VIII.2.2.4. Les réseaux multicouches ou perceptron multicouches (PMC)
VIII.2.2.5. Apprentissage
IX – Paramètres d’évaluation de la qualité de l’ajustement
IX – 1 Robustesse du modèle
IX – 2 Test de randomisation
IX – 3 Validation externe
PARTIE APPLICATION
I-Modélisation de la température critique68
I-1- Introduction
I-2-Résultats et discussion
I-2-1- Régression linéaire multiple
I-2-2- Régression par les réseaux de neurones artificiels RNA
II-Modélisation de la température d’ébullition
II-1- Introduction
II-2-Résultats et discussion
II-2-1- Régression linéaire multiple
II-2-2- Régression par les réseaux de neurones artificiels RNA
III- Modélisation de la pression critique
III-1-Introduction
III-2- Résultats et discussion
III-2-1- Régression linéaire multiple
III-2-2- Régression par les réseaux de neurones artificiels RNA
CONCLUSION GENERALE
REFERENCRS BIBLIOGRAPHIQUES
ANNEXES

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *