CRIBLAGE DU GENOME DE LA DMO POUR DES INDIVIDUS NON-APPARENTES

Télécharger le fichier original (Mémoire de fin d’études)

Marqueurs génétiques

Des marqueurs génétiques sont des séquences polymorphes d’ADN dont les positions exactes sur le génome sont connues. On dit qu’un locus est polymorphe s’il existe au moins deux allèles dans la population. Parmi les marqueurs les plus utilisés on trouve les Short Tandem Repeat Polymorphisms (STRPs ou microsatellites), ce sont des enchaînements de quelques bases qui se répètent uncertain nombre de fois. Un autre type de marqueurs couramment utilisé est le polymorphisme d’une seule base, les Single Nucleotide Polymorphisms (SNPs). Ils sont de manière générale bi-alléliques.
Un marqueur peut apporter de l’information à deux n iveaux :
• au niveau familial, si les allèles des deux loci se transmettent de façon non indépendante au cours des générations. On évalueindépendancel’ de transmission des allèles à l’aide d’une analyse de liaison génétique. Les marqueurs utilisés pour l’analyse de liaison sont en général des marqueurs très polymorphes comme par exemple les microsatellites.
• au niveau de la population, s’il existe une association préférentielle (le déséquilibre de liaison) entre les allèles du variant génétiquecausal et les allèles de marqueurs génétiques. On évalue la force de cette associationà l’aide d’une analyse d’association . On utilise en général des SNPs (Single NucleotidePolymorphisms).

Liaison génétique et recombinaison génétique

Considérons deux loci A et B. Ces deux loci peuvent être sur la même paire de chromosomes ou sur des paires de chromosomes différents. Si les deux loci sont situés sur des chromosomes différents ou lorsqu’ils sont situés sur le même chromosome mais éloignés l’un de l’autre alors on dit que les locisont indépendants.En revanche, si ces deux loci sont proches l’un de l’autre, et donc lor squ’ils sont localisés dans la même région chromosomique, on dit que les deux loci sont liés génétiquementLa. liaison génétique reflète cette distance entre les loci. Cette distance génétique est le résultat du phénomène de recombinaisonou crossing-over.
La recombinaison est un phénomène résultant du mélange de matérielgénétique qui se produit par enjambement entre chromosomes. Elle survient au cours de la méiose, le processus de formation des gamètes mâles, les spermatozoïdes, et des gamètes femelles, les ovules. Chaque chromosome a alors la possibilité d’échanger une partie d’ADN avec son chromosome homologue. Plus les deux loci sont proches, moins il y a de chances qu’il y ait une recombinaison entre les deux.
On représente la probabilité de recombinaison sur neu distance donnée par l’unité de distance génétique : centiMorgan (cM). 1 cM correspond à environ 1% de recombinaison c’est-à-dire une recombinaison en moyenne pour 100 méioses.
L’équivalence entre la distance génétique et distance physique entre deux loci varie selon l’espèce considérée. Chez l’homme, on admet :1 cM 1 Mb (Méga Base).
On note A1/A2 les allèles de A et B1/B2 ceux de B. On peut distinguer deux cas selon les combinaisons des allèles sur les deux chromosomes de la paire. Ces deux cas correspondent à deux phases alléliques possibles:
Les allèles A1 et B1 sont sur le même chromosome dela paire, on dit que A1 et B1 sont en « coupling » ; ou encore phasés.
Les allèles A1 et B1 sont chacun sur un chromosome différent, A1 et B1 sont alors en « répulsion ».
Supposons que les allèles A1 et B1 soient en « coupling ». Les gamètes A1B1 et A2B2 produits par cet individu sont dits parentaux ; les gamètes A2B1 et A1B2 sont dits recombinés. Il s’est produit entre les loci A et B un nombre impair de phénomènes de recombinaison. Plus les loci A et B sont proches, moins on observera de gamètes de type A1B2 (ou A2B1).
L’arrangement des allèles à ces deux loci définit un haplotype.
Lorsque les deux loci sont liés génétiquement, la robabilitép d’observer les différents gamètes dépend du phénomène de recombinaison mesurépar le paramètre , taux de recombinaison entre les loci A et B.
q est la proportion de gamètes recombinés sur l’ensemble des gamètes transmis par le parent :
q = nombre de gamètes recombinés nombre de gamètes transmis.

Association allélique

Le phénomène d’association allélique correspond à une combinaison préférentielle entre les allèles de deux ou plusieurs loci. Considéronsdeux loci, l’un A1/A2 (avec PA2 la fréquence de l’allèle mineur A2) et l’autre B1/B2 (avec PB 2 la fréquence de l’allèle mineur B2). Si l’on note PA2 B 2 la fréquence de la combinaison A2B2, alors le phénomène d’association allélique.

Comment se produit l’association allélique ?

Plusieurs événements dans l’histoire génétique despopulations sont susceptibles de créer de l’association entre les allèles à différents loci :
– L’évolution démographique de la population :
– La migration : lorsqu’il y a mélange de deux populations et que celles-ci ont des fréquences alléliques différentes pour les deuxloci concernés, il y a alors apparition d’association.
– La réduction momentanée de la taille de la population peut également créer de telles situations. C’est un phénomène de dérivegénétique.
– La sélection naturelle, favorisant certaines combinaisons alléliques.
– L’apparition d’une mutation sur un chromosome peut entraîner une association. Lorsqu’une mutation apparaît, une association préférentielle va se créer entre la mutation et les allèles aux autres polymorphismes situés sur ce même brin de chromosome. Le maintien de cette association au cours du temps dépend de la distance génétique entre ces loci.

Méthodes d’analyses

Pour mettre en évidence l’effet d’un gène, on peut utiliser ou non l’information apportée par un marqueur génétique. Dans le cas où l’on ne dispose pas des génotypes aux marqueurs, on cherche à expliquer la manière dont le phénotype se répartit à l’intérieur des familles en caractérisant l’effet du gène. Cecise fait par une analyse de ségrégation que nous allons brièvement décrire un peu plus loin. La connaissance des génotypes aux marqueurs est un outil puissant pour caractériser la composante génétique des traits complexes. A partir de l’information génotypique aux marqueurs, on peut regarder s’il existe une corrélation entre le trait et les marqueurs étudiés. S’il existe une relation entre le trait et le marqueur, dans le cas d’un trait quantitatif, on parlera d’un locus de trait quantitatif (QTL pour Quantitative Trait Locus). Généralement, on tiliseu dans un premier temps les études de liaison pour identifier des régions du génome pouvant contenir un gène expliquant une part de la variabilité du trait ou de la maladie, puis dans un deuxième temps les études d’association pour préciser plus finement l’emplacement du gène. Nous allons brièvement décrire le principede ces méthodes pour identifier des régions chromosomiques en utilisant l’information apportée par les marqueurs aux niveaux de la liaison et de l’association.

Analyses de ségrégation

L’analyse de ségrégation constitue une des premières étapes permettant de caractériser l’effet d’un gène majeur dans un échantillon de familles, sans aucune information apportée par les marqueurs génétiques. L’analyse deségrégation vise à mettre en évidence l’effet d’un gène (gène majeur) transmis de façon mendélienne parmi l’ensemble des facteurs génétiques et environnementaux causant les concentrations familiales du phénotype étudié.
Ces analyses utilisent comme unité d’échantillonnage un groupe d’individus apparentés : la famille. Le principe général est de déterminer,par des hypothèses statistiques emboîtées, le mode de transmission expliquant le mieux les distributions familiales observées du trait étudié.
Nous allons décrire brièvement le modèle régressif(Bonney 1984) car c’est celui qui a été utilisé dans le cadre de l’étude NEMO.
Nous reprenons les notations définit par le système(1.1). Le gène majeur G à deux allèles A1 (de fréquence p) et A2. Les effets du gène sontcaractérisés par 4 paramètres qui sont la fréquence p et les trois moyennes génotypiques( A1 A1 , A1 A 2 ,A 2 A2 ).
Pour un individu ayant ses parents dans l’échantillon, la probabilité de son génotype est conditionnelle au génotype de son père et de sa mère. Cette probabilité est fonction des trois taux de transmission : ( A1 A1 , A1 A 2 , A 2 A2 ) . Ce sont les probabilités de transmettre l’allèle A1 à un enfant conditionnellement aux génotypes du parent qui est soit A1A1, A1A2 ou A2A2. Sous l’hypothèse de transmission mendélienne, ces probabilités sont égales à (1,1 2 , 0 ). Dans le modèle général de transmission, elles peuvent prendre n’importe quelle valeur entre 0 et 1.
Le trait observé résulte de l’effet de G et des corrélations familiales (noté CF) entre époux (FM ), entre le père et l’enfant (FO ), entre la mère et l’enfant (MO ) et entre les germains (SS ). La variance des effets résiduels est notée 2 . Elle est égale à la variance totale du trait moins la variance de l’effet de G.
Les sous-modèles sont testés par le test du rapportdes vraisemblances maximales.
La caractérisation de l’effet d’un gène se fait en testant les différentes hypothèses suivantes :
– La présence de corrélations familiales est mise enévidence si le modèle (I) est rejeté par rapport au modèle (II).
– S’il existe des corrélations familiales, la présenc d’un gène majeur est recherchée.
Celui-ci est mis en évidence si le modèle (II) estrejeté par rapport au modèle (IV).
– Dans le cas où un facteur majeur est détecté, l’existence de corrélations familiales en plus de ce facteur est testée en comparant le modèle (III) au modèle (IV).
– Pour s’assurer que le facteur majeur est bien un gène, transmis de façon mendélienne, deux tests sont effectués :
• Comparaison de (IV) et (V)
• Comparaison de (VI) et (V).
Si le modèle de transmission mendélienne (IV) n’estpas rejeté par rapport au modèle général de transmission (V) et si le modèle d’absence de transmission (VI) est rejeté par rapport au modèle général de transmission (V), on ourrap conclure à la présence d’un gène majeur.

Méthodes de liaison

Prenons l’exemple simple de la transmission à deux marqueurs. Cela revient à supposer qu’à partir du phénotype on peut en déduire le génotype du locus causal sans ambiguïté. Soit les génotypes à deux marqueurs génétiques, l’un A1/A2 et l’autre B1/B2 .

Critère de décision 

La procédure de test est de type séquentiel. On accumule de l’information (des familles), jusqu’au moment ou il sera possible de trancher entre les hypothèses H0 et H1. La valeur du LOD score indique les probabilités relatives d’observer l’échantillon sous H et sous H0. Ainsi, un LOD score de 3 signifie que la probabilité d’observer l’échantillon est 1 000 fois plus grande sous H1 que sous H0.
Les seuils de décision sont fixés à -2 et +3, c’est-à-dire que si :
– si Z1 > 3 on rejette H0 et on conclut à la liaison pour1
– si Z1 ≤ -2 on exclut la liaison génétique à1
– si -2 < Z1 ≤ 3 on ne peut trancher entre ces deux hypothèses, il faut continuer d’accumuler de l’information.
Remarque :
On peut montrer que les familles sont informatives, (c’est-à-dire que la vraisemblance est une fonction non constante de ) pour la liaison génétique lorsque l’un des parentsest double hétérozygote et lorsqu’elles contiennent aumoins deux enfants.
En pratique, les études ne rapportent pas la valeurdu LOD score étant donné une valeur de, mais le maximum du LOD score : Z () , où est la valeur qui maximise la vraisemblance du modèle de liaison. Dans ces cas, la statistique Z () suit sous l’hypothèse nulle, un mélange de 2 à 0 et 1 degré de liberté.
Des erreurs sur la valeur des paramètres génétiquesaugmentent le biais sur l’estimation de et diminuent la puissance de détecter une liaison (Clerget-Darpoux, Bonaiti-Pellie et al. 1986). De plus, nous ne savons pas spécifier a priori un tel modèle dans le cas des maladies multifactorielles. C’est pour cela que des méthodes (méthodes dites « model-free ») ne faisant aucune hypothèse sur le modèle génétique ont été développées.

Méthodes non-paramétriques, « model-free »

Le principe général de ces méthodes de liaison estde rechercher s’il existe une corrélation entre la ressemblance au trait et la ressemblance au marqueur entre apparentés. Dans ces approches, le test de liaison ne dépend, généralement que d’un seul paramètre. La similarité des allèles au marqueur est représentéepar la proportion du nombre d’allèles partagés par descendance. On représente ce nombre arp le statut IBD (Identity by Descent). Dans le cas de germains, le nombre d’allèles IBD est 0, 1 ou 2 (Tableau 2).
Parmi les méthodes de liaison « model-free » qui ont été développées, une des plus connues est celle proposée par Haseman & Elston (Haseman and Elston 1972), basée sur des paires de germains (frères/sœurs). Nous la décrivons ici brièvement. Elle a été « revisitée » afin de tenir compte de la covariance phénotypique entre les germains (Elston, Buxbaum et al. 2000). D’autres méthodes permettent d’utiliser tous les types de familles, comme les méthodes basées sur la décomposition de la variance (Amos 1994). Cette dernière approche est décrite plus en détaildans le chapitre 2.1.1.2

Table des matières

INTRODUCTION GENERALE
1. GENETIQUE DE TRAITS QUANTITATIFS : DEFINITIONS ET NOTATIONS
1.1. RELATION TRAIT – GENE
1.2. MARQUEURS GENETIQUES
1.3. METHODES D’ANALYSES
1.3.1. Méthodes de liaison
1.3.2. Méthodes d’association
1.4. ANALYSE GENETIQUE DE TRAITS CORRELES
1.5. GENETIQUE DE LA DENSITE OSSEUSE : GENERALITES ET REVUE DE LA LITTERATURE
1.6. CONCLUSIONS SUR LA GENETIQUE DE LA DENSITE OSSEUSE ET PROJET NEMO
2. RECHERCHE DE QTLS PAR ANALYSES DE LIAISON UNIVARIEE ET BIVARIEE
2.1. CRIBLAGE DU GENOME DE LA DMO
2.1.1. Matériel et méthodes
2.1.1.1. Les données NEMO
2.1.1.2. Méthodes d’analyse de liaison de traits quantitatifs
2.1.2. Problématique : distributions asympotiques des tests VC bivariés
2.1.3. Analyses de liaison des données NEMO
2.1.4. Résultats
2.2. ÉTUDE EMPIRIQUE DES TESTS DE LIAISON BIVARIES
2.2.1. Matériel et méthodes
2.2.2. Résultats
2.3. CONCLUSIONS DE L’ETUDE DE LIAISON DANS LES DONNEES NEMO
3. RECHERCHE DE QTLS PAR ANALYSE D’ASSOCIATION BIVARIEE
3.1. INTRODUCTION
3.2. CRIBLAGE DU GENOME DE LA DMO POUR DES INDIVIDUS NON-APPARENTES
3.2.1. Matériel et méthodes
3.2.1.1. Les données
3.2.1.2. Méthode d’association bivariée : le modèle SUR
3.2.2. Résultats
3.3. PERFORMANCES DU TEST D’ASSOCIATION BIVARIE SUR
3.3.1.1. Modèles de simulations
3.3.1.2. Résultats
3.4. CONCLUSIONS DE L’ETUDE D’ASSOCIATION POUR DES INDIVIDUS NON APPARENTES
4. METHODES D’ASSOCIATION DANS DES DONNEES FAMILIALES
4.1. MATERIEL ET METHODE
4.1.1. Les données GAW16
4.1.2. Méthodes d’association pour données familiales
4.2. STRATEGIES D’ANALYSE
4.3. RESULTATS
4.4. CONCLUSIONS DE L’ETUDE GAW16
CONCLUSIONS ET PERSPECTIVES
ANNEXE 1 : FIGURES ET TABLEAUX
ANNEXE 2 : ARTICLES PUBLIES ET EN REVISION
ANNEXE 3 : LISTE DES PRODUCTIONS SCIENTIFIQUES
BIBLIOGRAPHIE

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *