INSTRUMENT DE MESURE DE L’ERGONOMIE D’UN SITE
METHODOLOGIE
Plusieurs méthodes évaluent l‟utilisabilité et l‟ergonomie des sites (Agarwal, et al. 2002 ; Baccino et al. 2005 ; Brookhuis et al. 2008 ; Hinderer et al. 1998 ; Ivory et al. 2002 ; Ivory, et al. 2001 ; Jeffries et al. 1991 ; Kantner 1998 ; Kantner, et al. 1998 ; Nielsen 1992 ; Nielsen 1994c ; Scheffelmaier 2003 ; Tullis, et al. 2004). Nous avons opté pour l‟élaboration d‟une grille d‟heuristique « hybride » (Baccino et al. 2005 ; Kantner et al. 1997 ; Kantner et al. 2002 ; Nielsen 1992 ; Nielsen 1994b ; Nielsen 2005) : elle est hybride en ce sens où elle prend pour base de départ des heuristiques pour devenir liste de recommandations ergonomiques (annexes : tableau 59). Cette grille est à mi-chemin entre les guideline reviews ou ensemble de recommandations, et les méthodes dites de standard inspection aux concepts plus abstraits puisque les critères ergonomiques, notre base de départ, sont compris comme des abstractions d‟ensemble de recommandations (Bastien, et al. 1998). Cette grille a donné lieu à un pré-test (deux entretiens qualitatifs7 ) puis elle a été remplie par des experts. Pour notre travail de recherche, nous avons choisi de partir des critères ergonomiques (Bastien, et al. 1998 ; Leulier, et al. 1998) détaillés en première partie de cette recherche ; nous avons étoffé les huit dimensions de 49 items ergonomiques sélectionnés de par leur fréquence de citation dans la littérature, c’est-à-dire que ceux qui étaient le plus souvent cités comme facteur ergonomique ont été retenus. Le critère 4 d‟adaptabilité n‟a pas été inclus suite aux résultats des pré-tests d‟experts. La grille a été envoyée à 102 experts francophones dont le repérage a été effectué par mots-clés sur méta-moteurs (Clusty, polymeta) et sur Google annuaire. On a recherché l‟expertise en utilisabilité, et dans la mesure du possible, la double expertise (Dykstra 1993). Les experts qui ont accepté de participer étaient des universitaires spécialisés en ergonomie, des ergonomes de l‟interface web ou des designers de sites web. Trente-six experts seulement ont répondu, ce qui n‟a pas été suffisant pour conduire une ACP sur la totalité de la grille : nous l‟avons donc scindée par critères ergonomiques. En théorie, la taille de l‟échantillon devrait réunir de 5 à 10 fois plus d‟individus qu‟il n‟y a d‟items soumis à une même analyse factorielle, ce qui, dans le cadre de notre expérience aurait nécessité un minimum de 245 répondants. Cependant, dans le cas où l‟on ne peut réunir le nombre de questionnaires, Roussel (2005) considère qu‟il est « nécessaire de prendre du recul par rapport à ces préconisations normatives ». Dans ce cas, l‟auteur propose de traiter de façon séparée les échelles qui constituent un questionnaire et il encourage à prendre en considération le type de population visée ainsi que les caractéristiques de cette population. Dans le cadre de notre recherche, nous avons souhaité interroger les experts en utilisabilité, une population rare puisque nous n‟avons pu en recenser que 102 dans le monde francophone. C‟est la raison pour laquelle nous nous sommes limités à 36 questionnaires ; nous avons ensuite suivi les recommandations de Roussel (2005) et nous avons scindé le questionnaire selon les critères ergonomiques lorsque nous avons procédé au calcul des ACP. Il a été demandé aux experts d‟évaluer deux sites seulement : ils ont ainsi répondu à moins de questions. Nous avons eu recours à un plan de présentation des produits avec évaluation des sites en blocs incomplets équilibrés ou plan produit. Nous avons choisi de procéder selon un 7 Il a été demandé aux experts de remplir deux grilles, pour deux sites, parmi les huit sites qui ont été retenus, de noter le temps mis pour compléter chaque grille, de relever les questions jugées peu compréhensibles et d‟inscrire les points manquants. Les deux experts ne se connaissent pas, il n‟y a pas eu de communication sur les grilles.carré latin : en fin d‟expérience, nous avons donc obtenu le même nombre d‟observations par site. Le plan produit (annexes : tableau 60) a été réalisé sur le logiciel Fizz (Software Solutions for Sensory Analysis and Consumer Tests).
CRITERE 1 : LE GUIDAGE
ANALYSE DES DONNEES GUIDAGE/INCITATION
L‟étude de la matrice de corrélation montre que la factorisation est possible puisque plusieurs variables sont corrélées (> 0.5) (Le Moal 2002) (annexes : tableau 61). L‟indice d‟adéquation KMO (mesure d‟adéquacité de l‟échantillonnage de Kaiser-Meyer-Olkin) est moyen (0.639) mais il reste supérieur à 0.5 (annexes : tableau 62). Kaiser (1974) a suggéré une gradation allant d‟inacceptable (en dessous de 0.5) à médiocre (entre 0.5 et 0.6), moyen (entre 0.6 et 0.7), bien (entre 0.7 et 0.8) jusque très bien (entre 0.8 et 0.9) et excellent (au delà de 0.9). Le test de sphéricité de Bartlett est utilisé pour tester l‟hypothèse nulle que les variables ne sont pas corrélées dans la population : une valeur élevée est favorable au rejet de l‟hypothèse nulle. Si la signification (Sig.) tend vers 0.000, c‟est très significatif, inférieur à 0.05 significatif, entre 0.05 et 0.10 acceptable et au dessus de 0.10, on rejette l‟hypothèse (Le Moal 2002). Dans le cas présent, l‟analyse factorielle apparaitrait donc appropriée pour l‟analyse de la matrice des corrélations. La valeur propre d‟un facteur indique la variance totale attribuée à ce facteur. La variance portée par le facteur 1 s‟élève à 4.301 soit 35.844% de la variance totale (annexes : tableau 63), le deuxième facteur compte pour 15.627% et le troisième pour 12.850%. Le quatrième facteur compte pour 8.730% de la variance totale. Les quatre premiers facteurs représentent à eux seuls 73.052% de la variance totale. On retiendra quatre facteurs ayant des valeurs propres supérieures à 1 même si le scree test ou test du coude (annexes : figure 28) nous orienterait vers une solution à trois facteurs puisque graphiquement, le point où commence le changement de concavité est révélateur du nombre de facteurs. La matrice des composantes avant rotation (annexes : tableau 64) présente des coefficients qui expriment les variables centrées standardisées en fonction des facteurs. Les loadings représentent les corrélations existantes entre les facteurs et les variables. Un coefficient avec une grande valeur absolue indique que le facteur et la variable sont étroitement corrélés. Dans le cas présent, même si peu de facteurs sont corrélés avec plusieurs variables (on prend les valeurs absolues de loadings supérieures à 0.5), pour une meilleure interprétation des résultats, nous envisagerons une rotation. Or, la tâche d‟interprétation des facteurs est rarement simple, comme le stipule Desarbo (2007) et la rotation n‟est pas garante de résultats toujours fiables. Tout en restant prudent dans l‟interprétation des résultats, nous allons utiliser la méthode varimax (annexes : tableau 65) qui met en évidence, pour un même facteur, le nombre de variables à corrélations élevées. On obtient quatre facteurs après rotation. Le premier facteur représente l‟organisation des éléments sur la page ; on y trouve la position des éléments sur la page (en haut et au centre), le titre, la standardisation des éléments communs aux sites de la toile, la signification des liens et l‟accès aux sections principales. Le deuxième facteur concerne la page de démarrage du site : la possibilité pour l‟internaute d‟identifier le but du site depuis cette page et un survol de l‟ensemble des possibilités offertes par le site. Le troisième facteur est lié à la navigation, c’est-à-dire l‟emplacement des menus, l‟aide, ou le moteur de recherche interne. Avec le quatrième et dernier facteur, on envisage l‟effort que doit fournir l‟internaute lors de sa navigation, un effort en termes d‟orientation avec la carte du site et un effort de saisie.