Les échantillons non probabilistes
Un échantillon non probabiliste est un échantillon qui n’offre pas à tous les membres de la population une chance égale, ou pré-déterminée, d’être sélectionnés. La probabilité de sélection d’un membre de la population est donc inconnue. Il devient alors impossible de calculer la précision des résultats ainsi obtenus et d’utiliser les résultats pour extrapoler sur l’ensemble de la population.
Cette impossibilité réside essentiellement dans le fait qu’il est possible que les répondants peuvent ne pas être représentatifs de la population.
Baser une enquête sur des données recueillies auprès d’individus qui connaissent un chercheur est un exemple d’un échantillon non probabiliste. En effet, les personnes que le chercheur connaît ne représentent pas nécessairement l’ensemble de la population. Il faudrait donc conclure d’une telle étude que les personnes qui connaissent le chercheur se comportent d’une certaine manière mais on ne pourrait pas généraliser à l’ensemble de la population.
L’utilisation d’une école, à cause de sa proximité ou parce que le directeur est un intime du chercheur, entre dans la définition d’un échantillon non probabiliste. Le choix d’une classe, parce que le fils ou la fille du chercheur y est inscrit, n’est pas nécessairement représentatif de l’ensemble des classes de l’école. Le choix d’un groupe d’amis à l’intérieur de la classe entre également dans la catégorie d’un échantillon non probabiliste.
L’échantillon volontaire est un autre type d’échantillon non probabiliste.
Dans une classe, un échantillon volontaire serait formé de toutes les personnes qui se disent intéressées à participer à l’enquête. Il faut de demander si ces personnes ont les mêmes caractéristiques que celles qui décident de ne pas participer.
Il est toutefois possible et légitime d’utiliser un échantillon non probabiliste pour valider un questionnaire, notamment au niveau de la compréhension des questions ou encore pour calculer le temps d’administration ou de traitement.
Les échantillons probabilistes
Un échantillon est considéré comme probabiliste lorsque la probabilité d’être choisi est connue pour tous les membres d’une population. Il est alors possible d’effectuer des calculs afin de mesurer l’exactitude des résultats de l’enquête.
Il existe plusieurs méthodes d’échantillonnages probabilistes. Nous en examinerons les principales.
L’échantillon aléatoire simple
L’échantillonnage aléatoire simple consiste à sélectionner les répondants au hasard à partir d’une population. Dans ce cas, chaque membre de la population a une chance égale d’être sélectionné. On peut illustrer cette méthode de la façon suivante: le nom de toutes les personnes faisant parti d’une population se retrouvent à l’intérieur d’une immense cuve. Après avoir déterminé le nombre de personnes nécessaires pour l’enquête, on pige au hasard le nombre de noms de cette cuve. C’est le même principe qu’un tirage de tombola où tous les billets participants se trouvent à l’intérieur d’un baril de tirage. S’il y a 10 000 participants, vous avez une chance sur 10 000 que votre billet soit tiré si, bien entendu, chaque participant n’a qu’un seul billet. S’il y a 500 « gagnants », les 500 noms tirés représenteraient ainsi un échantillon.
Nous pourrions, à partir de cet échantillon, estimer l’âge, le sexe, le revenu ou toute autre variable pertinente des participants en partant du principe que le hasard sera représentatif de la population à l’intérieur d’une certaine marge. En prenant soin de remettre dans le baril les 500 premiers gagnants et en répétant l’exercice, nous aurions un deuxième échantillon de 500 personnes. Il est fort probable, toutefois, que l’âge moyen de ce deuxième échantillon sera différent du premier.
Mais cet écart, comme nous l’avons vu précédemment, ne variera que du pourcentage déjà établi par la taille de l’échantillon : c’est-à-dire que l’écart se situera à l’intérieur de la marge d’erreur. Dans notre exemple, un échantillon de 500 personnes nous donne une marge d’erreur de + ou – 4,47 % (on peut arrondir à 4,5 %). En fait, l’ensemble de tous les échantillons possibles nous donnerait la vraie moyenne de la population.
L’utilisation de la statistique en recherche (348 KO) (Cours PDF)