Préparation de l’échantillon
Extraction et purification des ARNm : Cette étape est réalisée avec le kit NEBNext Ultra pour Illumina (Illumina Inc., San Diego, CA). L’extraction et la purification ont pour but d’isoler la mitochondrie de la cellule pour extraire l’ARNm. Il y a destruction de la membrane cellulaire et isolement de la mitochondrie par centrifugation à une vitesse de 15000 tours/minutes pendant 5minutes. Il s’ensuit l’extraction des acides nucléiques et protéines de la mitochondrie. L’ADN et les protéines sont éliminés pour ne conserver que les ARN. La caractéristique polyadénylée (polyA) des ARNm est utilisée pour les piéger sur une sonde à nucléotide Thymine (T) ou oligo-dT complémentaire de la queue polyA.
Quantification des ARNm : Pour déterminer la concentration en ARNm en ng/ml, la méthode de fluorescence a été utilisée. Cette méthode est possible par l’emploi de Qubit HS (Qubit Hight Sensitive, version 3) . Elle consiste à la fixation des colorants ou fluorochromes sur les paires de bases des ARNm. L’intensité de la fluorescence émise par ces colorants, lorsque excités avec des faisceaux lumineux, correspond à la quantité d’ARNm présente dans la solution.
Synthèse des ADNc : Une réaction enzymatique avec le kit NEBNext Ultra pour Illumina (Illumina Inc., San Diego, CA) a été effectuée pour la transcription inverse. L’enzyme transcriptase inverse converti les ARNm en ADNc.
Séquençage
La détermination de la séquence des ADNc a fait appel à la technologie NGS, «Illumina Hi-seq RNA-seq run» (Illumina Inc., San Diego, CA) qui utilise le séquençage par synthèse .
Préparation des templates : Les templates sont symbolisés par l’association d’un fragment d’ADN avec des adaptateurs. Les adaptateurs sont des nucléotides synthétiques à séquences connues, complémentaires à ceux du FC. Pour préparer les templates, il faut sectionner des petits fragments d’ADNc par des enzymes de restriction suivant la direction 5’ et 3’, afin de respecter la taille désirée pour la technologie NGS. Cette taille se situe entre 25 et 450pb. Les adaptateurs sont ajoutés aux deux extrémités des fragments d’ADNc pour former des templates. Ces Adaptateurs permettent la fixation des fragments d’ADNc sur la lame du FC en vue de leur amplification par PCR et de leur séquençage .
Amplification des templates par PCR : La PCR avec la technologie NGS, « Illumina Hi-seq », utilise l’amplification par pont sur phase solide. Une amplification par PCR permet l’obtention de plusieurs fragments de séquence identique, aussi appelés « clusters ». La synthèse des groupes de séquence commence au niveau d’un adaptateur fixé sur le FC et se termine au niveau d’un adaptateur libre . Les nucléotides (dNTP) sont insérés successivement pour former le nouveau fragment de sorte que celui-ci atteigne un adaptateur du FC. Ceci entraine une courbure du fragment d’origine pour former des liaisons hydrogènes avec le nouveau. On parle d’amplification par pont ou « bridge amplification ». Lorsque ce dernier se fixe sur l’adaptateur du FC les deux fragments se détachent. Le nouveau fragment synthétisé porte à son extrémité libre la séquence complémentaire de la partie fixée du fragment originelle et à son extrémité fixée celle qui était libre.
Nettoyage des séquences après exploration
Pour améliorer la qualité des séquences, il est nécessaire, pour la suite des étapes,de convertir les données fasta provenant d’Illumina en un fichier fasta de Sanger. Ceci se fait à l’aide de FASTQ Groomer. Ensuite les séquences multiples comme AAAAs ou TTTTs sont enlevées en utilisant l’outil bioinformatique Remove Sequencing Artifact. Puis la coupure des bases à la fin de chaque séquence considérée comme séquences des adaptateurs est effectuée à l’aide de Trim Galore. On procède par la suite à un Trimming, c’est-à-dire à la coupure des adaptateurs et à celle des bases de mauvaise qualité. Finalement, une longueur spécifique de séquence est supprimée en utilisant Trimmomatic . L’exploration des séquences est suivie de nettoyage puis vérification des résultats obtenus après nettoyage. Puis il y a ré-nettoyage en cas de ré-détection de problèmes au niveau des séquences et ré-explorations des modifications apportées aux séquences. Ces étapes ce font en boucles jusqu’à l’obtention de séquences de bonne qualité.
Finalement, les modifications apportées aux séquences sont confirmées avec un nouveau fichier Fasta . Toutes les étapes d’exploration de données sont refaites afin de vérifier les nouvelles modifications .
Assemblage des séquences
Une fois que la banque de séquence a été nettoyée, les séquences consensus sont assemblées pour reconstruire le génome . Premièrement, les séquences consensus sont divisées en K-mers (exemple : ATGGAAG, TGGAAGT, GGAAGTC…) qui sont arrangés suivant l’ordre des nucléotides pour obtenir des morceaux de séquences appelés «contigs». L’assemblage des «contigs» en «clusters», d’après la présence de régions similaires ou l’appartenance à des familles de gènes très proches, est effectué. Il en résulte ce qu’on appelle « scaffolds ». Une des méthodes d’organisation des « scaffolds » est la construction de graphe comme celle de Bruijn. Ce graphe retrace les « scaffolds » à partir de leur connectivité pour reconstruire la séquence reflétant la molécule originale .
MITObim (mitochondrial baiting and iterative mapping) (Hahn et al., 2013) a servi pour vérifier et comparer l’alignement. Pour cela, des séquences références qui sont, la portion de l’ADN mitochondrial de Mantella baroni (numéro d’accession AB239567– AB239568) et la totalité de la séquence de l’ADN de M. madagascariensis disponible sur la banque de gènes, ont été comparées à chaque portion du génome obtenu.
Evolution de l’organisation des gènes chez Mantella baroni
Le mitogénome de M. baroni est caractérisé par : Deux gènes ARNt Glycine : La première copie G1 de 69pb, placée entre CO3 et ND3, est rencontrée chez les Archéobatraciens et les Néobatraciens. Mais la duplication du gène ARNt-Gly rencontrée chez M. baroni, n’a jamais été rapportée auparavant. En effet, la deuxième copie G2 de 70pb positionnée entre Cytb et CR1 est uniquement observée chez M. baroni. Cependant, la portion du mitogénome de l’espèce M. baroni, allant du Cytb à ND2, obtenue de Maromizaha et séquencée par Kurabayashi et sescollaborateurs en 2006 ne présente pas ce G2. Le mitogénome de M. baroni résultant de cetteétude et présentant ce G2 est séquencé par la transcriptomique c’est-à-dire séquençage de l’ADN provenant des ARN transcrits. Cette existence de G2 s’explique par l’expression de ce gène révélée par la méthode utilisée. Il est sure que les protéines qui ont dans leur chaîne polypeptidique l’acide aminé Glycine porté par ce gène ARNt interviennent dans l’adaptation de l’espèce dans son environnement. Alors, il est possible que la population de M. baroni à= Bekalalao soit différente de celle à Maromizaha. Il existerait donc une différenciation= génétique entre les populations de M. baroni à Maromizaha et à Bekalalao. La cause de la= différence dans le mitogénome entre ces deux populations mérite d’être étudier plus en détail.
Une interruption du flux génétique conduisant à l’apparition de deux lignées différentes est supposée à l’origine de ce phénomène. Pour confirmer cette hypothèse il est recommandé d’effectuer une étude de génomique des populations de M. baroni à Maromizaha et à Bekalalao. La présence de M2 dans CR2 : M. baroni possède la deuxième copie de M2 dans la région de contrôle CR2. On suppose que la présence de G2 a décalé la position de M2 dans CR2 afin de maintenir les vingt-deux (22) gènes ARNt caractéristiques des métazoaires.
Table des matières
INTRODUCTION
GENERALITES
MATERIELS ET METHODES
I. Etudes sur terrain
I.1 Site de capture
I.2 Echantillonnage de tissu
I.3 Conservation et préservation de tissu
II. Etudes en laboratoire
II.1 Préparation de l’échantillon
II.1.1 Extraction et purification des ARNm
II.1.2 Quantification des ARNm
II.1.3 Synthèse des ADNc
II.1.4 Quantification des ADNc
II.2 Séquençage
II.2.1 Préparation des templates
II.2.2 Amplification des templates par PCR
II.2.3 Séquençage
III. Etudes bioinformatiques
III.1 Contrôle qualité
III.1.1 Exploration des données
III.1.2 Nettoyage des séquences après exploration
III.2 Alignement multiple des séquences
III.3 Assemblage des séquences
III.4 Annotation du génome
RESULTATS ET INTERPRETATIONS
I. Séquences générées
II. Résultats bioinformatiques
II.1 Contrôle qualité
II.2 Génome mitochondrial de Mantella baroni
II.2.1 Les régions non codantes
Origines de réplication
Régions de contrôle
II.2.2 Les régions codantes
Gènes codants pour les protéines
Gènes ARNt
DISCUSSION
CONCLUSION
BIBLIOGRAPHIE
WEBOGRAPHIE