Comment les CNV sont-ils formés ?
Les mécanismes de formation des CNV sont encore peu connus, mais de nombreuses études ont permis d’observer que les CNV étaient significativement plus présents dans les régions répétées du génome telles que les duplications segmentaires, les Long Interspersed Nuclear Element (LINE), ou encore les Long Terminal Repeat (LTR) (Iafrate et al., 2004 ; Sharp et al., 2005 ; Perry et al., 2006 ; Redon et al., 2006 ; Lee et al., 2008 ; She et al., 2008 ; Nicholas et al., 2009). A partir de cette observation les chercheurs ont émis l’hypothèse que les CNV seraient principalement formés par recombinaison homologue non allélique, phénomène par lequel une recombinaison se produit entre deux régions dont les séquences nucléotidiques sont très similaires mais non alléliques (Gu et al., 2008 ; Henrichsen et al., 2009 A). C’est, par exemple, ce qui se produit dans les régions présentant des duplications segmentaires. Les duplications segmentaires sont des blocs d’ADN d’au moins un kilobase de longueur, dupliqués dans le génome et qui ont un degré remarquable d’identité de séquence (>90 %). Ces blocs peuvent être intrachromosomiques (situés sur le même chromosome), ou interchromosomiques (situés sur des chromosomes différents) (Turleau et Veckemans, 2005). Certaines régions du génome, plus particulièrement les régions péricentromériques et subtélomériques des chromosomes, sont enrichies en ce type de séquences (Bailey et al., 2002). La forte homologie de séquence des duplications segmentaires en font un substrat moléculaire de recombinaison homologue non-allélique. Cette recombinaison anormale entre des segments répétés spécifiques d’une région ou d’un chromosome entraîne la perte ou la duplication du segment génomique compris entre les deux duplicons (Turleau et Veckemans, 2005 ; Wain et al., 2009) (Figure 1).
Figure 1. Recombinaison entre deux séquences homologues non alléliques de même orientation, entraînant une délétion ou une duplication (Turleau et Veckemans, 2005).
Les deux séquences homologues non alléliques sont représentées par les rectangles signalés par des étoiles. Ces deux séquences sont reconnues comme homologues par la machinerie cellulaire. Il se produit une recombinaison entre les deux brins d’ADN, produisant soit une délétion, soit une duplication.
Différents facteurs incluant la taille des répétitions, l’intervalle qui les séparent, leur degré d’homologie et leur orientation relative influencent la probabilité de mésappariement et le type de remaniement généré. D’une façon générale, plus les segments sont grands et plus leur degré d’homologie est élevé, plus la probabilité de survenue d’un échange anormal est grande (Turleau et Veckemans, 2005). Une recombinaison homologue non allélique entre deux duplications segmentaires intrachromosomiques de même orientation va entraîner une délétion ou une duplication du segment intermédiaire (Figure 1). Si les séquences sont en orientation opposée, ce même phénomène peut entraîner une inversion du segment intermédiaire (Turleau et Veckemans, 2005) (Figure 2).
Figure 2. Recombinaison homologue non allélique entre deux duplications segmentaires intrachromosomiques d’orientation opposée, entraînant une inversion du segment intermédiaire (Turleau et Veckemans, 2005).
Les deux duplications segmentaires sont représentées par les rectangles incluant une flèche. L’orientation du segment d’ADN est repérée par les lettres a et b. Les deux séquences homologues sont reconnues par la machinerie cellulaire et il se produit une recombinaison entre les deux brins d’ADN non allèles, produisant une inversion du segment d’ADN a-b.
Cependant, les CNV peuvent apparaître même en l’absence de régions répétées. Une perte ou un ajout de nucléotides peut survenir lors d’une réparation imprécise de l’ADN par exemple (Wain et al., 2009).
Les CNV représentent un dynamisme du génome. L’évolution des CNV est constante. Chaque génération d’individus (homme ou animal) voit apparaître et disparaître des CNV (Wain et al., 2009). Ce dynamisme dépend des régions du génome. Les régions répétées, par exemple, sont favorables aux remaniements, des CNV de novo y apparaissent fréquemment, contrairement à d’autres régions plus stables où l’apparition d’un variant est un événement rare. Dans les régions stables du génome, les CNV seraient généralement mono-alléliques, fixés dans la population et transmis de manière mendélienne (Wain et al., 2009). Alors que les régions fréquemment remaniées présenteraient des CNV multi-alléliques résultant de mutations récurrentes.
Une synténie a été observée pour 22% des CNV entre le Chimpanzé et l’Homme et pour 25% des CNV entre le Macaque rhésus et l’Homme (Perry et al., 2006; Lee et al., 2008). Les CNV fréquents chez le macaque étaient souvent retrouvés chez l’humain (Lee et al., 2008), ce qui suggérait que certains CNV étaient apparus chez un ancêtre commun et ont été conservés dans les deux espèces, mais aussi que certaines régions du génome (comme les régions répétées) étaient favorables à la formation des CNV, quelle que soit l’espèce (Henrichsen et al., 2009 A).
Des CNV de novo peuvent se former dans les cellules, à des stades précoces du développement, mais aussi tout au long de la vie d’un individu. Si les cellules de la lignée germinale sont touchées par le CNV, celui-ci sera transmis. Il se pourrait que de nombreux individus soient mosaïques pour certains CNV, ce qui compliquerait l’analyse des CNV et l’étude de leurs effets (Wain et al., 2009).
Cartographier les CNV/Comment détecte-t-on les CNV ?
La détection des CNV s’effectue en deux temps : le passage de l’ADN des individus à tester sur des puces (CGH pour Comparative Genomic Hybridization, SNP pour Single Nucleotide Polymorphism, séquençage) puis l’analyse des données issues de ces puces à ADN, par des logiciels qui prédisent la localisation des CNV dans le génome.
La plupart des techniques employées aujourd’hui permettent de détecter les CNV sur l’ensemble du génome. Trois méthodes majeures sont utilisées pour détecter les CNV : l’hybridation génomique comparative (CGH), le génotypage de SNP et le séquençage.
Les méthodes de détection des CNV
L’hybridation génomique comparative (CGH)
La méthode de CGH array utilise un ensemble de sondes (molécules simple brin d’ADN) représentant l’ensemble du génome, qui sont ancrées sur une surface solide (array) ou puce. Cette méthode permet de comparer deux génomes : un témoin et un à tester. Le génome de référence est marqué avec une molécule fluorescente et le génome à tester avec une autre molécule fluorescente. Ces deux génomes sont hybridés simultanément sur les sondes présentes sur la puce. Pour chaque sonde, le rapport de fluorescence des deux fluorochromes est calculé, ce qui permet de détecter les délétions et duplications dans le génome à tester par rapport au génome de référence (Figure 3).