La Chemoinformatique: concepts & outils
La chemoinformatique est une discipline scientifique qui a évolué dans les 10 dernières années à l’interface entre la chimie et l’informatique. Il a été constaté que, dans de nombreux domaines de la chimie, l’énorme quantité de données et d’informations produites par la recherche en chimie ne peut être traitée et analysée que par les méthodes assistées par ordinateur. Ainsi, les méthodes ont été développées pour la construction des bases de données sur les composés chimiques et leurs réactions, pour la prédiction des propriétés physiques, chimiques et biologiques des composés et des matériaux à l’échelle de l’atome et de la molécule, dans tous les secteurs de l’activité humaine, la conception des médicaments, pour élucider la structure, pour la prévision des réactions chimiques et de la conception de synthèse organique. La recherche et le développement sont essentiels en chemoinformatique d’une part pour accroître notre compréhension des phénomènes chimiques et d’autre part pour que l’industrie reste compétitive dans une économie mondiale. C’est une branche de la chimie et/ou de la physico-chimie qui utilise les lois de la chimie théorique exploitées dans des codes informatiques spécifiques afin de calculer structures et propriétés d’objets chimiques (molécules, solides, clusters, surfaces ou autres), en appliquant autant que possible ces programmes à des problèmes chimiques réels. Nous commençons par la définition de la chemoinformatique et les concepts de base pour comprendre le monde chimique, par la suite nous présentons brièvement quelques méthodes et outils ainsi que les logiciels utilisés dans ce domaine. En fin nous présentons un panorama des applications de la chemoinformatique existantes en mettant particulièrement l’accent sur les applications de prédiction de propriétés et d’activités des molécules. La chemoinformatique, également dénommée chemoinformatique (anglicisme) ou chimioinformatique, est le domaine de la science qui consiste en l’application de l’informatique aux problèmes relatifs à la chimie. Elle a pour objectif de fournir des outils et des méthodes pour l’analyse et le traitement des données issues des différents domaines de la chimie. Chapitre 1 La Chemoinformatique: concepts & outils 8 Elle est notamment utilisée en pharmacologie pour la découverte de nouvelles molécules actives et la prédiction de propriétés à partir de structures moléculaires. Certaines applications de la chemoinformatique reposent sur les équations de la physique quantique. Elles permettent ainsi de modéliser les conformations des molécules [3]. Cette très belle image qui représente des atomes liés par des liaisons chimiques n’est qu’une des innombrables possibilités de la chemoinformatique. Fig.1.1 : Atomes liés par des liaisons chimiques. La recherche et le développement en chemoinformatique sont essentiels pour : L’amélioration de la compréhension des phénomènes chimiques. Permettre à l’industrie chimique de rester compétitive dans le marché mondial.
Historique
La chemoinformatique est une nouvelle discipline apparue il y a environ 40 ans. Au début des années soixante, dans le but d’élucider la structure de composés chimiques inconnus, les données provenant des méthodes existantes (spectroscopie) ont été mises en commun sur informatique, C’était la naissance de la chemoinformatique. Le projet DENDRAL initié en 1964 à l’université de Stanford a été le premier à développer des générateurs de structures chimiques à partir de spectres de masses. Ce n’est qu’à la fin des années 60 que Sasaki à l’université de technologie de Toyohashi et Munk à l’université d’Arizona ont utilisé plusieurs méthodes de spectroscopie afin d’élucider la structure chimique de leurs composés. En 1969, Corey et Wipke ont présenté un travail similaire concernant les systèmes de représentation des molécules. Peu après d’autres groupes comme Ugi, Hendrickson et Gelernter ont développés des systèmes pour représenter des molécules organiques. La chemoinformatique (qui n’avait pas encore de nom) a été reconnue à la fin des années 60 comme une méthode utile d’analyse des données. Dès lors, beaucoup d’articles concernant cette discipline ont commencé à apparaître dans les journaux scientifiques. C’est seulement en 1998 que F.K Brown a défini pour la première fois cette discipline comme étant la chemoinformatique [5].
Concepts de base
La chimie
La chimie est une science de la nature divisée en plusieurs spécialités, à l’instar de la physique et de la biologie avec lesquelles elle partage des espaces d’investigations communs ou proches. Chapitre 1 La Chemoinformatique: concepts & outils 10 Pour reprendre un canevas de présentation proposée par la plus grande association de chimistes au monde, l’American Chemical Society, la chimie étudie [6] :1. les éléments chimiques à l’état libre, atomes ou ions atomiques, et les innombrables et diverses associations par liaisons chimiques qui engendrent notamment des composés moléculaires stables ou des intermédiaires plus ou moins instables. Ces entités de matière peuvent être caractérisées par une identité reliée à des caractéristiques quantiques et des propriétés précises. 2. les processus qui changent ou modifient l’identité de ces particules ou molécules de matière, dénommés réaction, transformation, interaction… 3. les mécanismes intervenant dans les processus chimiques ou les équilibres physique entre deux formes. Leurs définitions précises permettent de comprendre ou d’interpréter avec des hypothèses l’évolution matérielle avec en vue une exploitation des résultats de façon directe ou induite. 4. les phénomènes fondamentaux observables en rapport avec les forces de la nature qui jouent un rôle chimique, favorisant les réactions ou synthèse, addition, combinaison ou décomposition, séparation de phases ou extraction. L’analyse permet de découvrir les compositions, le marquage sélectif ouvre la voie à un schéma réactionnel cohérent dans des mélanges complexes.
Une science segmentée en de multiples disciplines
La recherche et l’enseignement en chimie sont organisés en disciplines qui, souvent en absence de services, de coopération ou d’aides réciproques, s’ignorent et se développent en toute autonomie [7] : la biochimie qui étudie les réactions chimiques dans des milieux biologiques (cellules…) et/ou avec des objets biologiques (protéines…). la chimie analytique est l’étude des méthodes d’analyses qualitatives et/ou quantitatives qui permettent de connaître la composition d’un échantillon donné ; ses principaux domaines sont : la chromatographie et la spectroscopie; la chimie des matériaux est la préparation et l’étude de substances avec une application en tant que matériau. Ce domaine intègre des éléments des autres domaines classiques de la chimie avec un intérêt particulier pour les problèmes fondamentaux concernant les matériaux. la chimie inorganique ou chimie minérale, concerne la description et l’étude des éléments chimiques et des composés sans squelette carboné. la chimie organique est la description et l’étude des composés comportant un squelette d’atomes de carbone (composés organiques) ; la chimie physique dont l’objet est l’étude des lois physiques des systèmes et procédés chimiques ; ses principaux domaines d’étude comprennent : la thermochimie, la cinétique chimique, l’électrochimie, la radiochimie, la sonochimie et les spectroscopies. la chimie théorique est l’étude de la chimie à travers un raisonnement théorique fondamental (habituellement à l’aide des mathématiques et de la physique). En particulier, l’application de la mécanique quantique à chimie a donné naissance à la chimie quantique. Depuis la fin de la seconde guerre mondiale, le progrès des ordinateurs a permis le développement de la chimie numérique (ou computationnelle).
L’atome
est formé d’un noyau atomique contenant des nucléons qui maintient autour de lui un nombre d’électrons équilibrant la charge positive du noyau.
L’élément chimique
est l’ensemble des atomes qui ont un nombre donné de protons dans leur noyau. Ce nombre est son numéro atomique. Par exemple, tous les atomes avec 6 protons dans leurs noyaux sont des atomes de l’élément carbone. Ces éléments sont représentés dans le tableau périodique (Figure 1.2), qui rassemble les éléments de propriétés similaires.