Deux problèmes se posent :
1) Le critère de la justesse de l’analyse est en partie subjectif (Est-ce que le regroupement fait du sens?). Il faut faire particulièrement attention à la tendance qu’ont certains chercheurs à donner aux facteurs des noms qui font du sens et qui impressionnent mais qui ne reflètent pas ce qui a été mesuré.
2) Il y a une infinité de solutions possibles après rotation; il n’y a donc pas une seule « bonne » solution. Il est alors difficile de décréter que la solution présentée est « la solution ». Il faut la présenter comme une solution plausible qui n’est pas contredite par les données.
Outils de diagnostic de la solution factorielle :
Si le principal critère d’un bonne solution factorielle demeure sa justesse au plan théorique, au plan du sens, il demeure que plusieurs outils statistiques nous guident dans la recherche de la meilleure solution possible. Voici une brève présentation des principaux outils diagnostiques utilisés. L’exemple présenté permettra d’en comprendre l’utilisation de façon plus poussée.
A) adéquation de la solution globale
a) Le déterminant de la matrice:
Un déterminant égal a zéro signifie qu’au moins une variable est une combinaison linéaire parfaite d’une ou de plusieurs autres variables. Il y a donc une variable qui ne rajoute aucune information nouvelle au-delà de celle fournie par les autres variables. Dans ce cas l’analyse ne peut procéder pour des raisons mathématiques (Il est impossible d’inverser la matrice). Notons que nous recherchons un déterminant très petit, ce qui constitue un bon indice de l’existence de patrons de corrélations entre les variables, mais non égal à zéro.
On obtient le déterminant
– en indiquant DéTERMINANT dans la fenêtre CARACTéRISTIQUES (SPSS Windows).
– en indiquant DET dans la sous-procédure /PRINT (SPSS syntaxe)
b) La mesure de Kaiser-Meyer-Olkin
Plus communément appelé le KMO, la mesure de Kaiser-Meyer-Olkin est un indice d’adéquation de la solution factorielle. Il indique jusqu’à quel point l’ensemble de variables retenu est un ensemble cohérent et permet de constituer une ou des mesures adéquates de
concepts. Un KMO élevé indique qu’il existe une solution factorielle statistiquement acceptable qui représente les relations entre les variables.
Une valeur de KMO de moins de .5 est inacceptable
.5 est misérable
.6 est médiocre
.7 est moyenne
.8 est méritoire
.9 est merveilleuse (ref: SPSS professional statistics)
Le KMO reflète le rapport entre d’une part les corrélations entre les variables et d’autre part, les corrélations partielles, celles-ci reflétant l’unicité de l’apport de chaque variable.
On obtient le KMO
– en indiquant Indice KMO et test de Bartlett dans la fenêtre CARACTéRISTIQUES (SPSS Windows).
– en indiquant KMO dans la sous-procédure /PRINT (SPSS syntaxe)
c) Le test de sphéricité de Bartlett:
Ce test vérifie l’hypothèse nulle selon laquelle toutes les corrélations seraient égales à zéro. On doit donc tenter de rejeter l’hypothèse nulle i.e. que le test doit être significatif (la probabilité d’obtenir la valeur du test doit être plus petite que .05). Toutefois le test est très sensible au nombre de cas; il est presque toujours significatif lorsque le nombre de cas est grand. Ses résultats sont donc intéressants presque uniquement lorsqu’il y a moins de 5 cas par variable.
On obtient le test de sphéricité automatiquement
– avec l’indication Indice KMO et test de Bartlett dans la fenêtre CARACTéRISTIQUES (SPSS Windows).
– avec l’indication KMO dans la sous-procédure /PRINT (SPSS syntaxe)
1. Qu’est-ce que l’analyse factorielle? A quoi çà sert?
Les équations
Type de questions auxquelles l’analyse factorielle permet de répondre
Analyse en composantes principales et analyse factorielle:
Analyse exploratoire et analyse confirmatoire:
2. Considérations théoriques et pratiques
3. Les types d’extraction d’une solution factorielle.
4. Les types de rotation
5. Les étapes de l’analyse factorielle de type exploratoire
6) Outils de diagnostic de la solution factorielle
A) adéquation de la solution globale
a) Le déterminant de la matrice
b) La mesure de Kaiser-Meyer-Olkin
c) Le test de sphéricité de Bartlett
d) Le Graphique des valeurs propres
e) La matrice reproduite et les résidus
f) La structure obtenue
B) Pertinence de garder une variable dans la solution
a) Les statistiques descriptives des variables
b) La qualité de la représentation (communality) de chaque variable avec la solution factorielle initiale
c) La simplicité ou la complexité de chaque variable dans la solution factorielle finale
d) Un cas spécial: le Heywood case
7) Commandes pour l’analyse factorielle avec SPSS
8) Qu’est ce que l’analyse de fidélité?
Deux concepts clés: La fidélité et la validité
Plusieurs types de validité
La fidélité
9) L’analyse de fidélité : aspects pratiques et outils diagnostiques
10) L’analyse de fidélité avec SPSS
11) Notes additionnelles
a) Relation entre l’analyse factorielle, l’analyse en composantes principales et l’analyse de fidélité
b) Attention aux valeurs manquantes
Bibliographie
Factor analysis and Principal components analysis, what’s the difference? (L. Tarkkonen)
Cours sur l’analyse factorielle et l’analyse de fidélité avec SPSS (128 KO) (Cours PDF)