Cours statistiques inférentielles notion de base, tutoriel & guide de travaux pratiques statistiques en pdf.
Définitions
D’après le dictionnaire Petit Robert (édition 1996): inférer : tirer (d’un fait, d’une proposition) une conséquence, c’est arguer, conclure, déduire, induire.
Inférence: opération logique par laquelle on admet une proposition en vertu de sa liaison avec d’autres propositions déjà tenues pour vraies; c’est une déduction, induction.
Appliqué au terme statistique, on pourrait dire que les statistiques inférentielles servent à déduire à partir d’informations connues sur un ou plusieurs cas particuliers des conclusions sur ce qui se passe en général, qui est inconnu.
Autrement dit, les Statistiques inférentielles : Ensemble des méthodes et des théories permettant de généraliser à une population de référence des conclusions obtenues à partir de l’étude d’un échantillon extrait de cette population. Elles visent à:
– évaluer un paramètre ou une relation
– prédire une valeur
– déterminer si les différences sont dues au hasard
– déterminer si deux échantillons sont issus d’une même population
Notion de base
Notion de variable: la variable est une propriété, un caractère qui permet de décrire et de classer les sujets ou les individus (objets d’étude). Le choix d’un caractère détermine le critère qui servira à
classer les individus de la population en deux ou plusieurs sous-ensembles. Le nombre de ces sous ensembles correspond aux diverses situations possibles ou modalités de ce caractère ou cette variable.
Ces variables peuvent se présenter sous 3 types d’échelles
1. Variables nominales: sont des variables de nature qualitative dont les modalités ne sont pas hiérarchisées.
– elles expriment l’appartenance d’un individu à un ensemble ou une catégorie non hiérarchique – elles échappent à la mesure: elles peuvent seulement être constatées (par exemple, sexe, nationalité, profession)
– la relation qui définit une variable nominale est une relation d’appartenance à un ensemble.
2. Variables ordinales: sont des variables de nature qualitative dont les modalités sont hiérarchisées.
Pour de telles variables, les modalités peuvent être classées par ordre de grandeur (par exemple classe sociale, niveau d’études…). On distingue trois types de variables ordinales:
les variables rangées, qui se composent d’un nombre limité de modalités ordonnées les unes par rapport aux autres; par exemple, degré de concentration estimé sur une échelle à 4 degrés: 1 = non concentré; 2 = un peu concentré; 3 = moyennement concentré: 4 = non concentré;
les rangs, obtenus après un classement des unités d’observation de la première à la dernière, par exemple, d’après les résultats à un examen ou à une course; s’il n’y a pas d’ex æquo, il y aura autant de modalité que d’unité d’observation;
les scores rangés: mesures quantitatives classiques pour lesquelles on ne tient compte que des propriétés d’équivalence et d’ordre et pour lesquelles on ne prend pas en compte les autres propriétés arithmétiques du nombre (additivité, zéro vrai, intervalles numériques égaux).
Variables métriques ou d’intervalles: sont des variables de nature quantitative.
On peut attribuer à chaque élément évalué un nombre qui mesure ses propriétés. Ce nombre doit être tel que des intervalles numériques égaux représentent des distances égales dans la propriété mesurée.
………