Sommaire: Analyse génomique d’une séquence nucléotidique de Mycobacterium aurum
Partie 1 : REVUE BIBLIOGRAPHIE.
Introduction
A. Identification de la séquence
I. Blast
1. Alignement des séquences
2. Catégories d’alignements
3. Le Système de Score
4. Les Matrices de Substitution
a) Matrices de Scores pour l’ADN
i. La matrice Identité
ii. La matrice de Transition/Transversion
b) Matrices de score BLOSUM 62
5. Algorithme du blast
6. Statistique du Blast
II. Utilisation du programme ORF finder
III. Utilisation du programme GeneMark
IV. Recherche de promoteur
B. Etude phylogénétique
1) Phylogénie : Définition
2) Phylogénie moléculaire
3) Reconstruction phylogénétique
a. Méthode de maximum de vraisemblance (ML)
C. Les mycobactéries
1. Classification des mycobactéries
2. La tuberculose
3. La résistance mycobactérienne
4. Les systèmes de transport membranaire
a. Système d’efflux actif
5. La superfamille des MFS
Partie 2 : MATERIELS ET METHODES
A. Séquences utilisées
1. Séquence de Mycobacterium aurum
B. Méthodes bioinformatiques utilisées
I. Recherche de similarité
a. Les types du BLAST
a. BLAST N
b. BLAST P
c. BLAST X
II. Recherche des cadres de lectures ouverts
1. ORF Finder
2. GeneMark
III. Identification du promoteur
IV. Analyse phylogénétique
a. Analyse phylogénétique des séquences
Partie 3 : RESULTATS ET DISCUSSIONS
I.Analyse de la séquence étudiée avec le programme Blast N
II. Détermination des cadres de lecture ouverts et identfication de la fonction du (des) gène (s)
1. Etude de la séquence avec ORF Finder et BLAST P
a. Analyse de la séquence étudiée avec le programme ORF Finder
b. Analyse des ORF détectés par le programme BLAST P
2. Etude de la séquence étudiée avec les programmes GeneMark et
BLASTP
a. Analyse de la séquence étudiée avec le programme GeneMark
b. Analyse des ORF détectés par le programme BLAST P
III. Localisation des gènes identifiés sur la séquence étudiée
IV. Recherche de promoteur
V. Analyse phylogénétique
Conclusions et perspectives
Références bibliographiques
Webographie
Annexe
Extrait du mémoire analyse génomique d’une séquence nucléotidique de Mycobacterium aurum
A. Identification de la séquence :
L’étude de notre séquence est réalisée à l’aide de plusieurs outils bioinformatique, à savoir :
BLAST, ORF Finder, GeneMark. Cette analyse va permettre la détection du gène et la prédiction de la fonction du gène.
II. BLAST :
L’alignement de séquences constitue souvent le premier lien entre l’ADN ou la protéine nouvellement séquencée et les séquences déjà classées dans la base de données. Basic Local Alignment Search Tool (BLAST) est l’un des choix les plus populaires pour la recherche et l’alignement de séquences. Le BLAST compare une séquence de nucléotides ou de protéines comme entrée contre une base de données de séquences de nucléotides ou des séquences de protéines, (Grzegorz M. Boratyn et al., 2013), et calcule la signification statistique des résultats. BLAST peut être utilisé pour déduire les relations fonctionnelles et évolutives entre les séquences ainsi que pour aider à identifier les membres de familles de gènes [http://BLAST .ncbi.nlm.nih.gov/BLAST .cgi#].
L’analyse de notre séquence par le BLAST a pour but de comparer des séquences requêtes (de types nucléiques ou protéiques) à des séquences présentes dans les bases de données afin de trouver des similarités entre ces séquences. (Thomas Le Calvez et al., 2009).
Analyse génomique
7. Alignement des séquences :
L’alignement permet de mesurer la similarité entre deux séquences génomiques. En général, on associe un score à cette similarité, ce score représentant la somme des coûts d’opérations élémentaires pour passer d’une séquence à l’autre (Van-Hoa Nguyen, 2009). Ainsi, à chaque position dans l’alignement correspond une des trois situations suivantes :
• Un appariement ou match quand le même caractère apparaît dans les deux séquences ; une valeur positive est associée ;
• Une substitution (ou mis-match) lorsqu’il y a deux caractères différents ; une valeur négative est associée ;
• Un gap (Indel), c’est à dire une insertion d’un caractère dans seulement une séquence ou symétriquement une délétion dans une des deux séquences ; une valeur négative est assignée.
Analyse génomique
8. Catégories d’alignements :
L’alignement de séquences peut se diviser en deux catégories : l’alignement global et l’alignement local. Le premier est utilisé pour calculer la similarité totale entre deux séquences. Les séquences sont alignées sur toute leur longueur. L’algorithme qui effectue cet alignement est appelé algorithme de Needleman-Wunsch et a été introduit en 1970. Le second détecte simplement les régions locales de fortes similarités entre deux séquences. Cet algorithme a été proposé par Smith-Waterman en 1981.
En fonction des problématiques étudiées, on choisira le type d’alignement le mieux adapté. Par exemple, pour des études phylogénétiques qui consistent à déterminer des distances entre séquences de même nature, les alignements globaux seront considérés.
Par contre, pour rechercher des zones fonctionnelles identiques entre protéines, les alignements locaux seront mieux appropriés (Van-Hoa Nguyen, 2009).
………
Mémoire Online: Analyse génomique d’une séquence nucléotidique de Mycobacterium aurum (778.17 KB) (Cours PDF)