SPSS Analyse en composante principale

Cours SPSS analyse en composante principale, tutoriel & guide de travaux pratiques en pdf.

ANALYSE EN COMPOSANTE PRINCIPALE

Analyse factorielle des données /Construction du premier plan factoriel et interprétation des résultats (question 2)
Facteurs
L’analyse en composantes principales propose 14 facteurs qui déterminent la structure sous-jacente de la répartition des données.
Facteurs retenus
Les facteurs retenus présentent les caractéristiques suivantes :

  • Une valeur propre supérieure à 1 selon la « Règle de Kaiser » (Facteurs isolés : Facteurs 1 à 5) Dans la mesure où l’ACP propose 14 facteurs, une valeur propre de 1 représente 1/14% de la variance, soit environ 7,14%
  • Elles répondent au « Scree Test » ( Graphique 1 ci-après). Après observation du graphique des valeurs propres, on ne retient que les valeurs qui se trouvent à gauche du point d’inflexion. Le dessin d’une droite reliant les points à droite presque alignés permet d’isoler les axes qui sont au dessus de cette ligne. Le test ainsi réalisé nous invite à retenir les facteurs 1, 2, 3 et 4 qui semblent pertinents pour notre analyse.

Graphique 2 – « Test du coude »

Les 4 premiers facteurs permettent une restitution d’information de 72% environ. (Cf. Tableau 3 ci-après : « Variance totale expliquée »)On s’intéressera cependant plus particulièrement aux facteurs 1 et 2 qui présentent la restitution marginale de l’information la plus élevée et totalisent une restitution d’information d’environ 43% (Respectivement 22. 726% et 20.254% pour les composantes principales 1 et 2). On peut souligner que ce score est relativement faible et que, de ce fait, l’analyse de la dispersion des données dans l’espace qui suit est basée sur une perte importante d’informations.
Il s’agit ici de construire les deux premiers axes factoriels qui s’établissent à partir des variables et des composantes principales. L’observation de la matrice des composantes permet d’amorcer un début de compréhension et d’explication de la dispersion des données de départ.

  • Premier axe principal et première composante principale

Les variables « Ferme » et « Juteuse » sont fortement et positivement corrélées à la première composante principale et concourent ainsi le plus à la construction de l’axe 1. Les variables « Acidulée » et « Très sucrée » sont, quant à elles, négativement corrélées à la première composante, mais permettent de comprendre la nature du premier facteur pratiquement à la même hauteur. Il est à noter que la variable « Ferme » concoure de façon excessive à la construction de l’axe 1 (Corrélation avec composante principale 1 proche de 1). La variable pourrait être écartée de l’analyse, dans la mesure où sa proximité trop importante du facteur 1 risque de se traduire par une absence de gain d’informations (indispensables à l’interprétation), et pourrait constituer un biais à l’analyse.

  • Deuxième axe principal et deuxième composante principale

Les variables « Douce » et « Croquante » sont fortement corrélées à la deuxième composante principale. Elles seront privilégiées pour l’interprétation du facteur 2. Il faut souligner que, malgré le fait que la variable « Très croquante » soit fortement et négativement corrélée à la deuxième composante principale, elle constitue un biais évident à l’interprétation. En effet, nous avons retenu une typologie binaire lors de la constitution du tableau des données (0=Absence de caractéristique, 1=Présence). Lorsqu’il s’agit d’évaluer les corrélations sous-jacentes entre les individus et les variables sur des caractéristiques non diamétralement opposées » (ex : Très croquante, croquante), il est logique que les variables apparaissent in fine traitées et représentées quasiment de manière opposées. Mais là encore, la corrélation, positive pour l’une, négative pour l’autre, qu’elles entretiennent avec une autre variable apporte très peu à l’analyse. On retiendra donc que les deux variables qui concourent de manière la plus significative à la construction de l’axe 2 sont les variables « Douce » et « Croquante ». De façon plus secondaire, les variables « Acidulée », « Très acidulée » et Rafraîchissante » sont négativement corrélées à la seconde composante principale, alors même que, parallèlement, la variable « Légèrement acidulée » est positivement corrélée à la même composante. L’opposition est ici significative et pertinente pour l’analyse, on décide donc de privilégier plus particulièrement cette variable pour la suite de l’interprétation.
L’observation de la nouvelle matrice des composantes permet de renforcer les tendances perçues dès le départ :

Variables à retenir pour la composante principale 1 :

  • Ferme (Corrélation ++)
  • Juteuse (Corrélation +)
  • Acidulée (Corrélation -)

Variables à retenir pour la composante principale 2 :

  • Douce (Corrélation +)
  • Parfumée (Corrélation +)
  • Acidulée (Corrélation -) (Rappel : On a fait le choix plus haut d’écarter de l’interprétation la variable « Très croquante » du fait du biais inhérent à une typologie binaire sur des variables non diamétralement opposées)

Pour des questions d’échelle, un calcul s’impose pour pouvoir positionner sur un même plan variables et individus. Nous avons repris les coordonnées des caractéristiques de pommes par rapport aux composantes principales 1 et 2 tels qu’ils ressortaient de la première analyse en composantes principales. Les valeurs des coordonnées des variablesn caractéristiques » par rapport aux facteurs 1 et 2 « composantes principales » sont calculées directement dans SPSS en utilisant la fonction d’aggrégation « moyenne ». La consolidation des données nous permet d’obtenir le tableau suivant, qui sert de base au lancement sous SPSS de la fonction graphique « Dispersion simple des données ». Nous obtenons le biplot inséré à la suite du tableau.

Introduction
Statistiques descriptives
Analyse en composante principale
Classification ascendante hiérarchique
Interprétation des classes obtenues
Annexes

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *