Les étapes à suivre pour une analyse factorielle confirmatoire
Ensuite, nous avons eu recours aux analyses factorielles confirmatoires. L’objectif de l’analyse factorielle confirmatoire est de confirmer statistiquement une structure prédéfinie ou de valider un modèle, contrairement aux analyses factorielles qui, elles font émerger une structure (d’après la revue de la littérature, les pré-enquêtes, l’analyse de contenu et les analyses factorielles exploratoires). La démarche est donc inverse à celle de l’analyse factorielle exploratoire puisque ce sont les données qui confirment les facteurs sans les construire.
« L’analyse factorielle confirmatoire permet, par l’analyse des matrices de covariance, de confirmer la structure des échelles, et d’en étudier la fiabilité et la validité. En ce qui concerne l’étude des relations entre les variables, l’apport de l’analyse des structures de covariance est double: d’une part elle permet de vérifier si les corrélations mises en évidence correspondent à des liens de causalité significatifs, d’autre part elle montre l’enchaînement des relations entre les différentes variables » (Sirieix, 1996).En d’autres termes, ces analyses sont des méthodes d’analyse multivariée dites de la deuxième génération. On les appelle aussi modèles d’analyse des structures de covariance (Valette Florence, 1988) ou encore path analysis (Jöreskog et Sörbom, 1989). En effet, le premier intérêt de l’analyse structurelle, qui a été développée au début des années 70 par des chercheurs comme Jöreskog (1973), Keesling (1972) et Wiley (1973), est qu’elle permet d’examiner simultanément plusieurs relations causales entre des variables latentes. Roussel et al. (2002) définissent la variable latente comme étant un construit non directement observable nécessitant un ensemble d’indicateurs (nommés également variables manifestes, observables ou de références) afin de pouvoir être mesurée. Les variables latentes incluent les variables indépendantes, dépendantes et médiatrices. Il faut noter que les variables « exogènes » sont des variables indépendantes qui n’ont pas des variables causales antécédentes. Les variables « endogènes » sont des variables médiatrices ou dépendantes.
Le second intérêt de l’analyse structurelle est qu’elle permet de prendre en compte dans une même analyse l’ensemble des relations linéaires entres variables dépendantes, qu’elles soient unidirectionnelles ou réciproques. Il est donc possible d’évaluer un effet médiateur partiel ou total, un effet modérateur lien par lien, une influence réciproque, tout en associant à chacun de ces résultats un seuil de confiance. Dans une analyse factorielle confirmatoire, on pose à priori des relations entre les facteurs et les indicateurs. Ces relations sont réflexives. On développe ainsi un modèle pour lequel on cherche confirmation dans les données.
Pour réaliser les analyses factorielles confirmatoires nous avons utilisé le logiciel AMOS 6.0 (Analysis of Moment Structures).Plusieurs autres logiciels existent sur le marché et permettent l’utilisation des équations structurelles. Nous citons à titre d’exemple CALIS, EQS, PLS, LISREL, SEPATH, etc. Valette-Florence (1993) précise qu’il y a en général antagonisme entre deux méthodes qui permettent d’effectuer une analyse de modèles à équations structurelles : L’approche PLS (Fornell et Bookstein 1982, Lohmöller 1989) orientée vers la prédiction (Fornell et Cha, 1994) et l’approche ASC (Analyse des Structures de Covariance) popularisée par le logiciel LISREL et qui est quant à elle orientée vers l’explication des liens de causalité (Bollen 1989, Hayduk 1996). Les analyses factorielles confirmatoires présentées dans ce chapitre ont été réalisées sous AMOS 6.0, logiciel d’ASC. Nous avons fait le choix de nous référer à AMOS plutôt que LISREL car il offre une alternative conviviale par ses interfaces graphiques et ses liens avec SPSS (Evrard Pras et Roux, 2000). De plus, il est commode pour des estimations par des procédures Bootstrap. Pour le test du modèle conceptuel, nous présentons dans le chapitre suivant plus en détail les forces et les faiblesses de l’ASC et de PLS, et nous exposons pourquoi dans notre cas le logiciel PLS a été choisi.
Selon Chin (1998), les modèles à équations structurelles qu’ils soient estimés sous ASC ou sous PLS permettent :
1- d’établir des relations entres plusieurs variables prédictives et prédites ;
2- d’introduire des variables latentes, c’est à dire non observables directement ;
3- de tenir compte de l’erreur de mesure des variables observables ;
4- de tester statistiquement des relations spécifiées d’un point de vue théorique.
Nous détaillerons les différences entre la méthode PLS et la méthode ASC dans le chapitre 19.
Nature des construits
Avant de procéder aux choix des méthodes de validité et de fiabilité, il est crucial de se pencher sur la nature même des construits mobilisés dans notre modèle. Il faut rappeler que c’est la nature des construits qui dicte le choix de la méthode statistique à adopter. Par exemple, si un construit est formatif, il est impossible de recourir à une AFC. Pour ce faire, il faut définir les caractéristiques qui distinguent un construit formatif d’un construit réflexif. Nous avons remarqué au cours de nos recherches et de nos réflexions que peu d’études dans le passé ont accordées une attention à ce sujet. Pourtant, il a été prouvé qu’une spécification erronée de la direction de causalité entre un construit et ses mesures peut mener à tirer des conclusions fausses sur les relations structurelles entres les construits (Law et Wong 1999, Jarvis Mackenzie et Podsakoff 2003).
Normalité des variables
Avant que les échelles fassent objet d’une analyse factorielle confirmatoire, nous avons vérifié la normalité des variables. Pour ce faire, deux indicateurs visent à comparer la distribution observée à celle de la loi normale ou courbe de Gauss. Il s’agit du coefficient de symétrie (Skewness) et du coefficient d’aplatissement (Kurtosis).Le coefficient de symétrie « indique si les observations sont réparties équitablement autour de la moyenne (le coefficient est alors nul) ou si elles sont plutôt concentrées vers les valeurs les plus faibles (coefficient positif) ou si elles sont plutôt concentrées vers les valeurs les plus élevées (coefficient négatif) » (Evrad Pras et Roux, 2000).Le coefficient de concentration quant à lui, compare « la forme de la courbe de distribution des observations à celle de la loi normale : un coefficient positif indique une plus forte concentration des observations alors qu’un coefficient négatif indique une courbe plus aplatie » (Evrard et al. 2000).Pour être considérée comme normale, la valeur de ces indicateurs doivent se rapprocher de 0 ce qui est rarement le cas dans la pratique. Plusieurs seuils sont avancés dans la littérature. Pour que les données soient considérées comme modérément non normales, le coefficient de symétrie doit etre inférieur à 1 en valeur absolue et le coefficient de concentration doit être inférieur à 1,5. Roussel et al. (2002) quant à eux, précisent que le coefficient « skewness » ne doit pas être supérieur à 3 en valeur absolue alors que le coefficient « Kurtosis » ne doit pas excéder 8 en valeur absolue.