Le choix de la méthode des équations structurelles et méthodologie adoptée
Les modèles d’équations structurelles sont des méthodes de seconde génération, introduits en Marketing par Baggozzi (1977). Aujourd’hui, ces modèles sont répandus dans les travaux de recherche en sciences de Gestion. Les méthodes d’équations reposent sur la notion de variables latentes, c’est-à-dire de variable « qui n’est pas directement observable, mais déduite d’une ou plusieurs variables observables (ou indicateurs) appartenant aux champs d’observations empiriques » (Valette Florence, 1988).
Le modèle global résulte de la conjonction d’un modèle de structure défini sur les variables latentes et d’un modèle de mesure reliant les variables observées aux variables latentes (Evrard et al ,2003) : – Le modèle de structure présenté sous forme d’un système d’équations linaires décrivant un ensemble de relations linaires reliant les variables latentes exogènes et les Variables latentes endogènes – Le modèle de mesure présenté également sous formes d’équations linaires reliant les variables latentes aux variables observées qui leur correspondent respectivement.
Précautions à prendre
La question de la taille de l’échantillon
Pour le nombre d’observations qu’il est nécessaire d’avoir pour estimer les paramètres d’un modèle, il n’y a pas réellement de consensus. Selon Roussel et al (2002), l’idéal serait un minimum de 5 observations par paramètre à estimer. Ils considèrent aussi que les procédures d’estimation ont un impact fort sur les tailles d’échantillons. Par exemple, pour la méthode du maximum de vraisemblance qui est la plus régulièrement utilisée, les auteurs recommandent une taille de l’échantillon d’un minimum de 100 à 150 individus et d’un maximum de 400 à 500 individus. Pour eux, la taille idéale de l’échantillon serait de 200 à 300 individus ce qui correspond à notre échantillon. Pour d’autres méthodes d’estimations telles que ADS ou WLS des tailles d’échantillons très importantes (supérieures à 1000) sont exigées.
La question de la normalité des données
Pour vérifier la normalité des données, il existe deux indicateurs qui visent à comparer la distribution observée à une distribution normale : le coefficient de symétrie (skewness) et le coefficient de concentration (kurtosis) (Evrard et al, 1997). Le coefficient de symétrie ne doit pas dépasser 3 en valeur absolue et le coefficient de concentration 7. Ces deux indicateurs permettent de vérifier que chaque variable a bien une distribution proche d’une distribution normale. Dans notre cas, la normalité des données est respectée.
Vérification de la possibilité d’utilisation de la méthode du maximum de vraisemblance
L’estimation des paramètres du modèle se fait habituellement par la méthode du Maximum de vraisemblance (ML) qui est la technique la plus répandue dans l’analyse des structures de covariances. La méthode du Maximum de vraisemblance, fournit des estimations robustes à condition que les variables observables suivent une loi multinormale et que l’on dispose d’un échantillon de taille supérieure à 200 ce qui est notre cas.