Optimisation des schémas de sélection génomique des truites arc-en-ciel

 Optimisation des schémas de sélection génomique des truites arc-en-ciel

Le choix d’ outils de génotypage pertinents

Utilisation de puces LD

Tout d’abord, notons que les coûts de génotypage peuvent être significativement réduits par l’utilisation de puces LD (≤ 10K SNPs). Cette réduction de coût peut être d’autant plus forte que de gros volumes de puces sont achetés par un même consortium et/ou que des puces LD de basse densité (≤ 3K SNPs) ou à très basse densité (≤ 300 SNPs) peuvent être exploitées.

Par ailleurs, rappelons que des génotypages LD de 6 à 10K SNPs permettent d’obtenir des précisions très proches de celles obtenues en génotypage MD et donc des gains de précision par rapport à une évaluation sur pedigree encore utiles : selon les caractères, les gains attendus sont de 7 à 27% pour les puces 6K et de 10 à 29% pour les puces 10K considérées dans nos études (Tableau 30).

Plusieurs pistes sont envisageables pour optimiser le design de ces puces LD.Souvent, une stratégie visant à choisir des marqueurs uniformément distribués le long du génome (en distance physique) et à MAF élevée est considérée dans le choix des marqueurs des puces LD. Il a toutefois été montré qu’une stratégie basée sur le DL pouvait permettre une imputation plus précise (Herry et al. 2018) et que la densification en marqueurs au niveau des points chauds de recombinaison et des télomères améliorait la précision (Wellmann et al. 2013; Bolormaa et al. 2015).

Dans la thèse, nous avons privilégié le fait de limiter le DL local entre marqueurs dans des fenêtres de quelques centaines de kb afin d’éliminer les marqueurs trop redondants, tout en Chapitre 6: Le choix d’ outils de génotypage pertinents 211 respectant une répartition relativement homogène le long du génome. Nous avons aussi testé l’intérêt de ne conserver que des marqueurs à MAF moyennes ou fortes (MAF > 25%) avant de pratiquer un tri sur le DL pour améliorer l’informativité des marqueurs retenus.

Mais, à nombre de marqueurs retenus constants, ce tri sur la MAF ne s’est généralement pas avéré plus intéressant que de faire un choix plus sévère pour éliminer les marqueurs en fort DL. Toutefois, un tri moins sévère sur la MAF (par exemple à un seuil de 10 ou 15%) aurait peut-être pu se révéler intéressant. Dans la littérature, il a été également proposé de choisir les marqueurs pour leurs effets sur les caractères importants à améliorer (Moser et al. 2010; Vallejo et al. 2017), mais ceci limite l’intérêt de l’outil de génotypage ainsi construit à une seule population et à un nombre restreint de caractères.

Ce choix ne peut réellement se justifier que lorsque des QTLs à effets forts (et si possible partagés entre populations) sont identifiés. Au-delà du choix des marqueurs les plus informatifs pour une population, se pose la question du choix des marqueurs pour une utilisation dans les diverses populations trutticoles. En effet, des outils génériques sont nécessaires pour réduire significativement les coûts du génotypage par des achats en gros volumes d’un même design.

Dans le chapitre 4 de cette thèse, nous avons montré qu’établir une puce générique par simple mise en commun des SNPs partagés entre outils de génotypage dédiés à des populations spécifiques n’a pas permis d’améliorer la précision comparée à l’utilisation d’une puce basée uniquement sur le LD et les MAF d’une population autre que la population d’application. Des travaux supplémentaires sont donc nécessaires pour proposer une stratégie optimale pour bien couvrir le génome en SNPs informatifs pour toutes les populations.

Au lieu d’utiliser des puces spécifiques à plus haute densité de marqueurs (>> N) pour définir une puce générique à N SNPs, une stratégie à tester serait de constituer cette puce générique à N SNPS par ajout des SNPs de puces spécifiques à moindre densité (<< N). Une autre possibilité serait de choisir les marqueurs avec la MAF la plus importante sur l’ensemble des populations puis de compléter par des SNPs d’intérêt pour chacune des populations en vérifiant qu’une couverture homogène du génome est respectée.

Intérêt du séquençage ou du génotypage à haute densité

Par ailleurs, nous avons aussi vu que la qualité de la couverture du génome de la truite arc-enciel était hétérogène non seulement avec les puces LD, mais aussi avec la puce commerciale MD dont seulement 30 à 35 K SNPs sont utiles pour la SG et où de nombreuses zones de plus de 1Mb ne sont absolument pas couvertes. Pour faire évoluer cette puce MD puis développer des puces LD plus performantes, il serait utile de développer et utiliser des séquences et/ou des génotypages à très haute densité (HD > 100K SNPs) sur les populations d’intérêt en SG.

Cela permettrait d’identifier de nouveaux marqueurs informatifs dans de nombreuses populations et localisés dans les régions peu couvertes par les outils de génotypage actuels. S’il semble évident que des puces HD ne permettront pas de réels gains de précision de la SG par rapport à des puces MD dans les espèces de salmonidés (Ødegård et al. 2014; Tsai et al. 2015b), tout comme cela a aussi été montré chez les bovins avec des puces très haute densité (777K) (Gunia et al. 2014) ou des séquences (Van Binsbergen et al. 2015), on peut toutefois espérer les utiliser pour identifier les polymorphismes causaux.

S’il ne semble pas pertinent d’utiliser l’ensemble des variants de la séquence pour accroître la précision de la SG, le choix de variants causaux ou de marqueurs très proches des variants causaux peut en effet améliorer la précision de la SG en la rendant plus robuste au manque de relations étroites entre population de référence et candidats à la sélection (MacLeod et al. 2016), et cela d’autant plus que les MAF des variants causaux sont faibles (Druet et al. 2014). De tels variants peuvent être inclus dans de nouvelles versions de puces LD ou MD permettant une meilleure efficacité de la SG.

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *