L’analyse en composantes principales et le test de fiabilité
L’analyse en composantes principales (ACP) est une technique statistique multi-variée utilisée par presque toutes les disciplines scientifiques. Il est également susceptible d’être la plus ancienne technique multi-variée, mais son instanciation moderne a été formalisée par Hotelling (19331144) qui a également inventé le terme «composante principale». L’ACP analyse une table de données représentant des observations décrites par plusieurs variables dépendantes, qui sont, en général, inter-corrélées. Son but est de (Abdi, H., & Williams, L. J. 20101145): (a) extraire les informations les plus importantes de la table de données ; (b) compresser la taille des données établies en ne gardant que les informations importantes ; (c) simplifier la description de l’ensemble de données ; et (d) analyser la structure des observations et des variables. 1144 Hotelling, H. (1933). Analysis of a complex of statistical variables into principal components. Journal of educational psychology, 24(6), 417. 1145 Abdi, H., & Williams, L. J. (2010). Principal component analysis. Wiley interdisciplinary reviews: computational statistics, 2(4), 433- 459. L’analyse en composantes principales et le test de fiabilité L’analyse en composantes principales (ACP) est une technique statistique multi- Chapitre II : Présentation du cadre conceptuel et les hypothèses de recherches 156 Pour illustrer la démarche d’analyse de l’ACP, nous allons nous baser sur la procédure par étapes de Hair et al. (19981146). II.7.1.1 Conditions à vérifier par l’analyse en composantes principales L’ACP doit vérifier certaines conditions pour être significative: • La taille de l’échantillon: d’une façon générale, il est préférable, que la taille de l’échantillon soit de 100 individus ou plus (Hair et al., 19981147) ; • Le caractère « factorisable » des données: Deux tests permettent d’évaluer le caractère factorisable des données : II.7.1.1.1 L’indicateur de Kaiser-Meyer-Oklin (KMO) La mesure de Kaiser-Meyer-Olkin est un indice d’adéquation de la solution factorielle. Il indique jusqu’à quel point l’ensemble de variables retenu est un ensemble cohérent et permet de constituer une ou des mesures adéquates de concepts. Un KMO élevé indique qu’il existe une solution factorielle statistiquement acceptable qui représente les relations entre les variables. Cet indicateur varie entre 0 et 1. Pour que l’ACP soit pertinente, le KMO de l’analyse factorielle doit tendre vers 1. Le caractère factorisable des données est excellent si le KMO est supérieur à 0,9, très bon entre 0,8 et 0,9 ; bon entre 0,7 et 0,8 et moyen entre 0,6 et 0,7 (Hair et al., 19981148).
Le test de sphéricité de Bartlett
Le test de Bartlett repose sur la détection de corrélations significatives entre les items. Il vérifie l’hypothèse nulle selon laquelle toutes les corrélations seraient égales à zéro.si le Chi-2 du Bartlett’s Test est suffisamment grand avec une signification nulle : les variables sont suffisamment corrélées. • Un nombre minimal de trois items par facteur est enfin souhaitable pour que l’ACP soit significative (Evrard et al., 19931149).
Extraction des facteurs et épuration de l’échelle
Lors d’une analyse factorielle exploratoire, la description des dimensions des construits étudiés implique deux tâches concomitantes : l’extraction des facteurs et l’épuration de l’échelle, afin de faciliter leur identification. 1146 Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (1998). Multivariate data analysis (Vol. 5, No. 3, pp. 207-219). Upper Saddle River, NJ: Prentice hall. 1147 Idem. 1148 Idem. 1149 Evrard, Y., Pras, B., Roux, E., Choffray, J. M., & Dussaix, A. M. (1993). Market: études et recherches en marketing: fondements et méthodes. F. Nathan. Chapitre II : Présentation du cadre conceptuel et les hypothèses de recherches
L’extraction des facteurs
Les facteurs retenus doivent restituer un seuil suffisant de variance totale, c’est-à-dire généralement plus de 50% (Igalens et Roussel, 19981150). Pour se faire, C’est le critère proposé par Kaiser (1960), et c’est sans doute le critère le plus couramment utilisé. La règle de Kaiser qui veut qu’on ne retienne que les facteurs aux valeurs propres supérieures à 1. (Facteurs qui expliquent une part importante de la variance).
La rotation des facteurs
Si l’ACP ne produit pas de structure factorielle claire et qu’il est difficile d’interpréter les axes factoriels dégagés, le chercheur peut avoir recours à une rotation des axes pour faciliter leur interprétation. La rotation peut être orthogonale lorsque les facteurs sont pressentis comme étant des dimensions indépendantes les unes des autres ou encore oblique lorsque les facteurs peuvent être corrélés entre eux. Dans la pratique, on utilise très régulièrement la méthode de rotation orthogonale VARIMAX et la rotation oblique PROMAX. Le chercheur devrait se demander si cette solution sans rotation fournit de l’information pour une bonne interprétation des données. Si c’est le cas, le chercheur n’a pas besoin de faire de rotations (Hair et al., 19981151, p. 106). II.7.1.3 La mesure de la fiabilité de cohérence interne La fiabilité se définit comme « le degré selon lequel des mesures sont exemptes d’erreurs et produisent, par conséquent, des résultats robustes » (Peter, 19791152). Il s’agit d’erreurs aléatoires dues au changement d’humeur des répondants et aux circonstances d’administration du questionnaire (Evrard et al., 19931153). La fiabilité interne est généralement mesurée par le coefficient alpha de Cronbach. C’est l’indicateur le plus utilisé (Peterson, 19951154). Il s’agit d’un coefficient de corrélation intragroupe généralisé, c’est-à-dire qu’un alpha de Cronbach satisfaisant signifie que les items sont corrélés entre eux, et suffisamment cohérents pour pouvoir être additionnés et former un score d’échelle (Pedhazur et Pedhazur-Schmelkin, 19911155). L’interprétation du 1150 Igalens, J., & Roussel, P. (1998). Méthodes de recherche en gestion des ressources humaines. Economica. 1151 Hair et al., (1998). Op, Cit. 1152 Peter, J. P. (1979). Reliability: A review of psychometric basics and recent marketing practices. Journal of marketing research, 6-17. 1153 Evrard, Y. et al., (1993). Op, Cit. 1154 Peterson, R. A. (1995). Une méta-analyse du coefficient alpha de Cronbach. Recherche et Applications en Marketing (French Edition), 10(2), 75-88. 1155 Pedhazur, E. J., & Schmelkin, L. P. (1991). Measurement, design, and analysis: An integrated analysis. Chapitre II : Présentation du cadre conceptuel et les hypothèses de recherches 158 coefficient alpha de Cronbach repose sur des règles empiriques variables. La règle la plus citée est celle qui fixe un niveau minimal recommandé à 0,7 (Cortina, J. M. (19931156).
Méthodologies de test des hypothèses
La méthode d’équation structurelle
L’usage des modèles des équations structurelles en marketing constitue une solution adéquate à la conception des modèles théoriques. Ces méthodes qui ont été développées dans les années 70 du 20ème siècle, (Schumacker et Lomax, 20041157), sont devenues couramment adoptées au niveau des travaux empiriques. Elles s’intègrent dans le cadre des analyses multi-variées de deuxième génération et constituent des méthodes avancées pour la recherche (Valette Florence, 19881158 ; Evrard et al, 20031159). Sur le plan académique, les analyses structurelles contribuent énormément à l’évolution de la théorie et de la démarche méthodologique en marketing (Baumgartner et Homburg, 19961160). Selon Hoyle (19951161), la modélisation par les équations structurelles représente « une approche statistique globale permettant de tester des hypothèses traitant des relations entre les variables observées et les variables latentes ». Un modèle d’équations structurelles se compose traditionnellement de deux parties : le modèle de mesure et le modèle structurel. Le modèle de mesure renvoie à l’identification et l’estimation des variables latentes à partir des indicateurs, et le modèle structurel renvoie à la détermination des relations causales entre les variables latentes et qui permet de tracer le sens des hypothèses composant le modèle de recherche à tester. Le traitement des modèles d’équations structurelles comprend plusieurs étapes standardisées suivantes (Kline, 2005, p. 631162) :