Modèles QSAR pour la prédiction de la toxicité aquatique

Modèles QSAR pour la prédiction de la toxicité aquatique

OPTIMISATION DE LA GEOMETRIE DE LA MOLECULE 

GENERALITES Les techniques de calcul qui peuvent fournir la valeur de l’énergie d’une géométrie, aussi particulière que l’état fondamental, appartiennent à plusieurs catégories: – méthodes ab initio, – méthodes semi-empiriques, – méthodes empiriques, – mécanique moléculaire. Concernant les deux premières méthodes, elles sont fondées sur l’évaluation des interactions électroniques complètes ou partiellement négligées. Le terme ab initio est réservé aux calculs déduits directement des principes théoriques, sans faire intervenir de données expérimentales. Deux méthodes fondamentales sont proposées pour la résolution de l’équation de Schrödinger à partir des principes de base. La théorie des orbitales moléculaires (OM) tend à établir une expression pour la fonction d’onde ψ, alors que dans la théorie de la fonctionnelle de la densité (DFT), la distribution de la densité électronique (ρ) joue ce rôle. Le fondement de la DFT est associé à un théorème dû à Hohenberg et Kohn [1] qui ont démontré que toutes les propriétés d’un système dans un état fondamental non dégénéré sont complètement déterminées par sa densité électronique. Le type le plus courant de calcul ab initio, ou calcul Hartree-Fock (HF), repose sur l’approximation principale du champ central. Le calcul variationnel mis en œuvre conduit à des énergies supérieures aux énergies réelles (Théorème de Eckart) et tendent vers une valeur limite appelée limite de Hartree Fock. La seconde approximation dans les calculs HF consiste à décrire la fonction d’onde par une « fonction utile » qui est connue exactement pour quelques systèmes mono-électroniques. Les fonctions les plus souvent utilisées sont des combinaisons linéaires d’orbitales de type Slater (e – a x ) ou d’orbitales gaussiennes �e�- a x2� �, dont les abréviations sont, respectivement, STO (pour Slater Type Orbitals) et GTO (pour Gaussian Type Orbitals). La fonction d’onde est obtenue à partir de combinaisons linéaires d’orbitales, ou plus souvent à partir de combinaisons de fonctions d’un ensemble de base. A cause de cette approximation, la plupart des calculs HF conduisent à des énergies supérieures à la limite HF. L’ensemble exact de fonctions de base utilisé est souvent spécifié par une abréviation du genre STO – 3G ou 6 – 311 + + g **.  L’utilisation de bases de fonctions gaussiennes permet de calculer toutes les intégrales de la méthode sans autres approximations que celles inhérentes à la méthode elle-même. Réservées initialement au traitement de petites molécules (une dizaine d’atomes), les méthodes ab initio ont été étendues, ces dernières décades, à des systèmes de quelques centaines d’atomes, comme conséquence de l’augmentation de la puissance des ordinateurs (hardware et software). Une approximation sur l’hamiltonien est considérée comme une méthode semiempirique. Les méthodes semi-empiriques sont moins contraignantes en moyens de calculs. De plus, l’incorporation de paramètres déduits des données expérimentales dans certaines de ces méthodes permet de prédire quelques propriétés avec une meilleure précision que celle obtenue avec les méthodes ab initio les plus élaborées. Les méthodes de champ de force ne demandent pas de temps excessifs de calcul pour donner des informations sur l’énergie de la molécule étudiée. La mécanique moléculaire (M M), appelée parfois : calcul par champ de force empirique, (empirical Force Field, EFF, en anglais), permet le calcul de la structure et de l’énergie d’entités moléculaires [2-4]. D’une part, les distributions électroniques ne sont pas explicitement détaillées (à quelques exceptions près), d’autre part, la recherche de l’énergie minimale par optimisation de la géométrie joue un rôle primordial. L’énergie de la molécule est exprimée sous la forme d’une somme de contributions associées aux écarts de la structure par rapport à des paramètres structuraux de référence. Les variables de calcul sont alors les coordonnées internes du système : longueur de liaison, angles de valence, angles dièdres et distances entre les atomes non liés. Un calcul de MM aboutit à une disposition des noyaux telle que la somme de toutes les contributions énergétiques est minimisée ; ses résultats concernent surtout la géométrie et l’énergie de système utilisées étant des re-paramétrisations de la méthode MNDO, nous présenterons ces trois méthodes, en rappelant au préalable le cadre des équations (ab initio) HFR (Hartree-Fock-Roothaan) sur lequel elles sont basées et les approximations supplémentaires auxquelles il est fait recours.

Le cadre Hartree – Fock – Roothaan.

Les méthodes ab initio utilisent l’équation de Schrödinger électronique obtenue après séparation des mouvements électroniques et nucléaires (approximation de BornOppenheimer) [6, 7]. Dans la méthode Hartree – Fock la fonction d’onde ψ d’un système à N électrons est représentée par un déterminant de Slater ψ0 de spin orbitales φ unique. Les spin orbitales consistent en des produits d’orbitales moléculaires (OM) φ et de fonctions de spin (α ou β), ϕa= φa α , ϕ�= φa β. On représentera ψ0 par : 0 11 2 2 M M Ψ ΦΦ ΦΦ Φ Φ = …… (1) pour un système à couches complètes comportant N électrons (auquel cas M = N 2 ). Chaque OM est développée sous forme d’une combinaison linéaire de fonctions de base, appelées conventionnellement orbitales atomiques (OM-CLOA, combinaison linéaire d’orbitales atomiques), quoiqu’elles ne soient pas généralement, solutions du problème HF atomique. m φ =a ∑ μ a μ μ c χ (2) En tenant compte de (1), on obtient après multiplication à gauche par une fonction spécifique, intégration et application du principe variationnel, un système d’équations linéaires, ou équations de Roothaan – Hall (pour un système à couches complètes) [8, 9]. Signalons que la résolution des équations de Roothaan – Hall fournit un total de m (= nombre de fonctions de base) orbitales moléculaires (OM) dont n sont occupées et (m – n) libres ou virtuelles. Celles-ci sont orthogonales à toutes les orbitales occupées, mais n’ont 19 PARTIE II Optimisation de la géométrie de la molécule pas d’interprétation physique directe exceptée comme affinité électronique (via le théorème de Koopmans [10]). Elles servent dans la description des états excités. L’équation (3) condense, sous forme matricielle, les équations de Roothaan – Hall. F C = S C ε (3) où: – la matrice F de Fock est l’opérateur hamiltonien effectif, – C est la matrice des coefficients des OM, cμa, – S est la matrice de recouvrement, – et ε une matrice diagonale comportant les énergies orbitalaires. La matrice de Fock, F , comporte toutes les informations relatives au système quantomécanique, c’est – à – dire toutes les interactions prises en compte dans les calculs. Sa formulation ab initio est la suivante : 1 F = H + J – K 2 µν µν µν µν n m 1 F = H + P – 2 µν µν ρσ ρ σ   µν ρσ µσ ρν     ∑∑ (4) Avec : H = 1 h 1 d ( ) ( ) 1 ∗ µν µ ∫ χ χτ ν  (5) ( ) ( ) 12 ( ) ( ) 12 1 = 1 1 2 2 d d r ∗ ∗ µν ρ σ χ χ χ χ τ τ ∫∫ µν ρν (6) m a a a P CC = 2 ∗ ρν ∑ ρ ν (7) où μ, ν, ρ et σ désignent des orbitales atomiques, et H𝜇𝜇ν des intégrales monoélectroniques représentant les valeurs moyennes de l’opérateur associé à l’énergie cinétique et l’opérateur énergie potentielle d’interaction noyau – électron (Ven )  . Les µν ρ σ sont des intégrales de répulsion bi-électroniques représentant Ve e  (opérateur d’interaction entre les électrons eux – mêmes), et les Pρ ν sont les éléments de la matrice densité P . et  Jµ ν et Kµ ν sont les représentations matricielles des opérateurs coulombien Ĵ et d’échange K� respectivement. L’énergie électronique (Eel) peut être exprimée au moyen des valeurs propres a ε : m m el a a 1 1 E = 2 P J K 2 2 µν µν µν µ ν   ε −   −   ∑ ∑ (8) Comme la matrice de Fock dépend des coefficients des orbitales, les équations de Roothaan doivent être résolues de façon itérative en utilisant la procédure du champ autocohérent ou SCF (pour : Self Consistent Field) [11]. Une étape importante de la procédure SCF est la conversion de l’équation générale aux valeurs propres (3) en une équation ordinaire par une transformation orthogonale (méthode d’orthogonalisation de Löwdin) [12, 13]. 1 2 F C = S F λλ − 12 12 F = S F S λ− − (9) et : 1 2 C = S C λ Notons que 1 2 S− qui est obtenue à partir de la matrice de recouvrement S qui n’est jamais singulière, n’est jamais singulière non plus. Signalons que les approximations électronique et CLOA (utilisation d’un nombre limité d’orbitales atomiques) et un problème de corrélation limitent la méthode HFR. On dépasse ces limitations par l’utilisation de fonctions corrélées ou en faisant intervenir l’interaction de configuration.

LIRE AUSSI :  La culture fruitière dans le monde

Analyse de population de Mulliken 

L’analyse de population répond à la question de savoir comment, lors de la formation d’une molécule à N électrons, répartir équitablement ces électrons entre les atomes, de telle sorte que la notion d’atome dans la molécule ne disparaisse pas complètement, sans enfreindre toutefois les principes de la mécanique ondulatoire et en tenant compte de la géométrie particulière de la molécule.

Table des matières

PARTIE I : Généralités
I-Le benzène et ses dérivés
I-1- Introduction et aperçu historique
I-2 Utilisation du benzène et de ses dérivés
I -3-Influence du benzène et ses dérivés sur l’environnement
I-4-1-Définition
I-4-2- Forme de toxicité
I-4-2-a Toxicité aiguë
I-4-2-b Toxicité subaiguë
I-4-2-c Toxicité à long terme
I-4-3- Utilisation de la dose létale
I-4-4-Identification de la toxicité
I-4-5- Identification du pouvoir pathogène
II- Les alcools et les amines
II-1 Introduction
II-2 Les alcools
II-2-1 Utilisation
II-2-2 Propriétés
II-2-3 Toxicité
II-3 Les amines
II-3-1 Utilisation
II-3-2 Propriétés
II-3-3 Toxicité
II-4 Concentration d’inhibition de la croissance
II-4-1 Définition
II-4-2 Pourquoi 50%
Référencés bibliographiques
PARTIE II : Aspects théoriques de la modélisation moléculaire
I-Optimisation de la géométrie de la molécule
I-1-Généralités
I-2-Méthodes semi- empiriques utilisées
I-2-1 Le cadre Hartree Fock -Roothaan
I-2-2 Analyse de population de Mulliken
I-2-3 Les méthodes semi-empiriques.
I-3- Champ de force
I-3-1-Définition
I-3-2- Quelques exemples
I-3-3-Représentation simple d’un champ de force
I-3-4-Exemple de calcul
I-3-5 Champs de force MM2 et MM+
I-3-5-1 Champ de force MM2
I-3-5-2 Champ de force MM+
I-Modélisation et évaluation des modèles
II-1 Modélisation
II-1-1 La régression linéaire multiple
II-1-1 Modelle QSXR
II-1-3 Les réseaux de neurones artificiels
II-1-4 Régression machines à vecteur de support
II-2 Développement et évaluation de modèle
II-2-1 Sélection d’un sous- ensemble de descripteurs
II-2-2 Principe
II-2-3 Initiation aléatoire du modèle
II-2-4 Etape de croisement
II-2-5 Etape de mutation
II-2-6 Condition d’arrêt
II-3 Développement des modèles
II-3-1 Paramètre d’évaluation de la qualité de l’ajustement
II-3-2 Robustesse du modèle
II-3-3 Domaine d’application
II-3-4 Test de randomisation
II-3-5 Validation externe
Référencés bibliographiques
CHAPITRE III : Résultats et discussions
I- Modélisation de la concentration d’inhibition 50 de la croissance
I-1 INTRODUCTION
I-2 Coefficient de partage
I-2-1 Propriété de partage
I-2-2 Détermination expérimentale de logP
I-2-3 Méthode d’ estimation de logP
I-2-3-1 ClogP
I-2-3-2 AlogP
I-2-3-3 MlogP
I-3 Collecte des données expérimentales
I-3-1 Le protozoaire (Tetrahymena pyriformis)
I-3-2 Test de toxicité (méthode et matériels)
I-3-3 Mécanisme de l’action toxique
I-3-4 Narcose apolaire
I-4 Résultats et discussion
I-5 Conclusion
II-Modélisation de la concentration létale
II-1 Introduction
II-2 Matériels et méthode
II-2-1 Ensemble des données
II-2-2 Calcul des descripteurs
II-2-4 Sélection des descripteurs
II-3- Résultats et discussion
II-3-1 Résultats de la régréssion linéaire multiple
II-3-1-1 Analyse de contribution des descripteurs
II-3-1-3 Signification des descripteurs sélectionnées
1 – Polarisabilité
2 – Indice d’autocorrélation de Moran de distance
topologique 1 pondéré par les masses atomiques m :MATS 1m
3- RDF020v
4- Descripteurs de charge
5- E1s
6- Clogp
II-3-1-4 Droite d’ajustement
II-3-1-5 Domaine d’application
II-3-1-6 Test de randomisation
II-3-2 Machine à support vecteur
II-3-3 Réseaux de neurones artificiels
II-4 Conclusion
Références bibliographique

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *