Méthodologie pour l’utilisation des tests statistiques
La comparaison des taux moyens de réponses correctes est effectuée, à chaque fois que nous sommes en présence de deux échantillons indépendants, en fonction du résultat de l’algorithme indiqué ci-dessous (cf. Figure 2- 1).
On peut trouver, une description des tests statistiques utilisés dans cette partie, dans le livre de Millot (2009). Nous privilégions, lorsque les conditions nécessaires sont remplies (c’est-à-dire que les groupes d’échantillons suivent une loi normale ET ont des variances égales), le test statistique de Student car il est robuste18 et est l’un des plus utilisé.
Si l’un des échantillons ne suit pas une loi normale de distribution alors nous utilisons le test de Mann-Whitney. Lorsqu’il s’agit de comparer k échantillons indépendants (avec k > 2), nous utilisons le test de Friedman, car sur k échantillons, très souvent l’un des échantillons ne suit pas la loi normale et ne permet pas l’utilisation d’un test paramétrique.
L’ensemble des tests de ce chapitre ont été réalisés avec le module XLSTAT pour Excel. Les distributions sont parfois à la limite de suivre une loi normale (cf.Figure 2- 5 : Tests de normalité mentions TB et B ). Un test est dit robuste si ce dernier permet que le résultat issu de son utilisation reste valable même si l’on s’écarte un peu de la loi normale.
Dans les interprétations des résultats issus des tests statistiques, nous utilisons les expressions « très probable », « probable » et « très peu probable » en fonction de la valeur calculée de la p-value19. L’expression « probable » est utilisée pour une p-value comprise entre 0,01 et 0,1. Pour des valeurs en dehors de cet intervalle, ce sont les deux autres expressions qui sont utilisées en fonction de l’hypothèse émise et de la phrase choisie pour conclure.
Nous avons choisi de reproduire les graphiques issus des tests statistiques (lorsque cela est possible) afin d’avoir une lecture rapide et critique de la robustesse de ces derniers. 19 Valeur comprise entre 0 et 1 qui nous indique, que les données concernant les différents échantillons sont significativement différentes si cette valeur est inférieure à 0,05 (si nous choisissons un risque d’erreur de 5%). Plus cette valeur est proche de 0 et moins il y a de risque d’erreur sur la conclusion : les données sont différentes.
A l’opposé, si la p-value est égale à 1, cela traduit une identité des données comparées. Les groupes d’échantillons suivent une loi normale Test de Mann Whitney Les groupes d’échantillons ont des variances égales t test de Student pour deux échantillons indépendants t test de Welch pour deux échantillons indépendants
Nous nous limitons à une analyse succincte de l’influence que pourrait avoir le genre, la mention obtenue au baccalauréat et le type d’étude suivie lors des premiers mois de l’enseignement supérieur (L1, CPI ou CPGE). Cette analyse nous permet de mieux connaître ces « nouveaux étudiants »
en répondant à notre deuxième question de recherche rappelée ci-dessous : QR2 : Quelles sont les corrélations possibles entre les données génériques des étudiants et leurs taux de réponses correctes à un test conceptuel de physique ?
Le genre Assez peu de femmes françaises suivent des études scientifiques. Dans notre population, à l’Université elles sont 34 sur 220 soit 15%, en Cycle Préparatoire Intégré de l’école d’ingénieurs 21 sur 130 (soit 16% si on ne tient pas compte de la présence de 29 étudiants Chinois dont 16 femmes et 13 hommes qui ferait monter ce taux à 31%) et en CPGE de Lycée 13 sur 47 soit 28%.
Nous réunissons dans le tableau ci-dessous (cf. Tableau 2- 2), les taux moyens de réponses correctes en fonction du genre et cherchons à savoir si la différence affichée (39% contre 42%) est statistiquement significative.