Pipeline de reconstruction de réseaux à partir de données hétérogènes

Pipeline de reconstruction de réseaux à partir de données hétérogènes

Modèle d’application : Ectocarpus siliculosus

Le réseau test sur lequel nous avons testé les différentes méthodes de reconstruction puis proposé des améliorations est le réseau métabolique d’Ectocarpus siliculosus, l’organisme modèle pour l’étude de la biologie des algues brunes [HCP+10]. Sur ce modèle, biologique, différentes sources d’informations sont disponibles. Génome Les algues brunes sont des straménopiles jouant un rôle important dans la zone intertidale. Le génome d’E. siliculosus ayant été séquencé et annoté en 2010.

Ce génome est constitué de 1.561 supercontigs (ou scaffolds) de plus de 2.000 paires de bases. 97,4% des séquences d’ARN messagers précédemment séquencés sont retrouvés dans ce génome, indiquant une bonne couverture du séquençage réalisé. Durant tout ce chapitre, le terme « annotation » consistera en l’annotation fonctionnelle du produit d’un gène et non de la recherche de modèles de gènes dans le génome. Les annotations du génome d’Ectocarpus siliculosus sont une combinaison d’annotations automatiques, réalisée avec le logiciel EuGene, et manuelles [CSR+10].

On a à disposition des numéros EC, des termes GO, des noms de fonctions, de domaine et les séquences protéiques. Tout cela est disponible via une interface web sur le site ORCAE (http://bioinformatics.psb.ugent.be/orcae/overview/ 69 Pipeline de reconstruction de réseaux à partir de données hétérogènes 70 Pipeline de reconstruction de réseaux à partir de données hétérogènes Ectsi) qui est régulièrement mis à jour avec de nouvelles annotations fonctionnelles de gènes. Pour la reconstruction du réseau, l’ensemble des données a été téléchargé à partir ce site web le 21 juin 2013. Ces informations vont constituer une première sources pour reconstituer le réseau métabolique d’Ectocarpus siliculosus

Réseau métabolique de référence

En complément aux annotations du génome d’Ectocarpus siliculosus, pour exploiter les méthodes de reconstruction de réseau métabolique s’appuyant sur un réseau de référence, nous avons recherché un réseau métabolique de bonne qualité (incluant une curation manuelle étendue) et pas trop éloigné phylogénétiquement parlant de l’espèce étudiée. Nous avons choisi d’utiliser le réseau réseau métabolique d’Arabidopsis thaliana, AraGEM [dODQP+09], un réseau global qui satisfait les critères listés précédemment.

Ce choix a été réalisé car, au moment de la réalisation de l’étude, ce réseau était le plus complet des réseaux d’Arabidopsis thaliana. Il est composé de 1.567 réactions et 1.748 métabolites. Ce réseau a été reconstruit en se basant sur des études bibliographiques et un réseau précédent et a été réalisé en utilisant les identifiants présents dans KEGG.

Il eut été plus aisé pour la suite de l’étude d’utiliser le réseau AraCyc [MZR03] étant donné que les identifiants auraient été les mêmes entre notre réseau métabolique, basé sur la base de données MetaCyc, et ce réseau basé sur la même base de données. Cependant le réseau AraGEM a été choisi pour sa plus grande qualité, il intègre en effet la plupart des informations contenues dans AraCyc, une curation manuelle étendue ayant été réalisée en plus.

Définition du milieu de culture

Ectocarpus siliculosus est un organisme vivant dans de l’eau de mer. L’identification de l’ensemble des métabolites présents dans ce milieu de croissance étant compliquée, nous avons choisi de prendre comme milieu de croissance l’eau de mer artificielle utilisée en laboratoire pour cultiver cette algue. Il s’agit d’un milieu de culture nommé Provasoli et dont la composition est détaillée en annexe A dans la colonne « Graines » en association avec quelques cofacteurs.

Ce Provasoli contient essentiellement des ions, du nitrate et des vitamines. Profilage métabolique Des données de profilage métabolique ont été obtenues au cours de plusieurs études [TEP+11] et ont permis d’identifier 51 métabolites que l’on sait être productibles par l’algue (des acides aminés, des acides gras, des sucres, et des polyalcools). Ces métabolites sont listés en annexe A.

La productibilité de ces métabolites par le réseau métabolique sera le critère principal de validation de la fonctionnalité du réseau. Cependant, en étudiant la base de données MetaCyc v17.0 nous nous sommes aperçus que trois d’entre eux (l’acide eicosadienoique, l’acide docosanoique et l’acide erucique) n’étaient produits par aucune réaction de cette base de données.

En revanche, deux réactions de KEGG (R08190 et R08184) permettent la production de l’acide eicosadienoique et de l’acide docosanoique mais n’était pas présentes dans la base MetaCyc. Ces deux réactions ont donc été ajoutées à la base de données de référence. Au final, 50 métabolites, parmi les 51 caractérisés chez Ectocarpus siliculosus, doivent être productibles par le réseau.

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *