Analyse multivariée de la variabilité de la qualité de viande de porc selon la race et le système d’élevage

Analyse multivariée de la variabilité de la qualité de viande de porc selon la race et le système d’élevage

Les avancées technologiques permettent aujourd’hui de générer des données issues de plateformes différentes. Ainsi l’analyse de données interdisciplinaires visant à mieux comprendre et maîtriser les différentes fonctions biologiques à tous les niveaux d’intégration auxquels elles se manifestent au niveau du même système biologique est maintenant possible. Cette approche analytique globale, appelée biologie intégrative, a pour but d’étudier un ou des organismes en intégrant des données de sources multiples, et ainsi de mieux appréhender les différents processus cellulaires très complexes inhérents au système.  données biologiques sont très souvent des méthodes classiques de projection multivariées, puisqu’elles permettent de projeter les données dans des espaces de dimension plus petite. Le biologiste peut alors plus facilement interpréter les résultats grâce à des représentations graphiques résumant l’information.  Il existe de nombreuses méthodes dites d’analyse multivariées : analyse en composantes principales (ACP), analyse factorielle des correspondances (AFC), analyse des correspondances multiples, analyse factorielle multiples (AFM)…Le lecteur pourra se référer à Escofier et Pagès (1988 et 1998) pour une description de ces approches. Rappelons que le but de l’ACP est de trouver des combinaisons linéaires des variables initiales appelées composantes principales, qui maximisent la variance du jeu de données. Les composantes principales sont orthogonales entre elles et représentent de nouvelles variables artificielles non corrélées. Ainsi, nous recherchons les vecteurs unitaires v1 …vH tels que :

où les vh, h = 1…H, H < p, sont les vecteurs appelés facteurs principaux ou « loadings » et les composantes principales associées sont les Xvh. La plus grande partie de la variance est, par construction, expliquée par les premières composantes principales H. Notons une propriété très utile des facteurs principaux qui est la correspondance directe entre leur coordonnées et l’importance des variables dans le modèle, dans le cas de variables homogènes ou réduites. Dans le cadre de données à très grandes dimensions, nous nous sommes inspirés d’une variante dite sparse PCA qui permet de réduire le nombre de variables en fixant des simple seuillages, et qui consiste, de manière empirique, à annuler les coefficients des variables dont les valeurs absolues sont inférieures à un seuil donné (Cadima et Joliffe, 1995). Dans le cadre de notre travail, l’approche sparse PCA choisie était celle proposée par Zou et al. (2006) : sparse PCA Elastic Net. L’AFM propose une représentation superposée des nuages partiels. Le cœur de cette analyse est constitué par une ACP effectuée sur le tableau complet X, dont les variables sont pondérées. La pondération utilisée consiste à diviser le poids initial de chaque variable du groupe j par j nombre de variables habituellement utilisées pour l’évaluation de la qualité de viande de porc, un dispositif expérimental incluant 50 animaux provenant de deux races contrastées a été utilisé : une race classique (Large White, LW), et une race locale (basque, B) du sud-ouest de la France qui est génétiquement éloignés des autres races européennes (Laval et al., 2000). Les animaux ont été élevés dans trois systèmes d’élevage différents : le système conventionnel, alternatif et extensif. Ces systèmes sont connus par leur impact sur les paramètre de la qualité de viande (Guéblez et al., 2002; Alfonso et al., 2005; Lebret et al., 2006).

Les analyses multivariées, notamment l’ACP et l’AFM, semblent les plus appropriées pour explorer les relations existant entre ces variables tout en considérant l’ensemble des données simultanément. Ainsi, et après avoir analysé les corrélations entre les groupes de variables de manière globale par le biais de l’ACP, nous nous sommes concentrés sur cette structure des corrélations qui discriminent les classes de race x système d’élevage, indépendamment de la variance résiduelle en considérant les moyennes des classes. Enfin, nous avons cherché à identifier quels sont les groupes de variables qui expliquent la variabilité intra-classes en appliquant une AFM sur les résidus.  Nos résultats ont montré que les variables discriminant les cinq classes de race x système d’élevage étaient les mêmes que celles qui discriminaient les individus entre eux, en l’occurrence les variables transcriptomiques, chimiques, technologiques et celles de mesure des acides gras. Le groupe composé des variables relatives à la réactivité à l’abattage discriminaient principalement les systèmes d’élevage, en particulier la classe des porcs basques élevés dans le système extensif.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *