1. Généralités.
2. Statistique descriptive univariée.
2.1. Représentation graphique.
2.2. Paramètres caractéristiques.
2.2.1 – Paramètres de position
2.2.2 – Paramètres de dispersion
2.2.3 – Paramètres de forme
3. Statistique descriptive bivariée.
3.1. Définitions.
3.2. Représentation graphique.
3.3. Caractéristiques marginales et conditionnelles.
3.4. Régression et corrélation.
3.4.1 Régression et corrélation.
3.4.2 Méthode des moindres carrés.
4. Régression orthogonale dans R².
4.1. Notion d’espace vectoriel euclidien.
4.1.1. Espace vectoriel R
4.1.2. Produit scalaire dans R n2
4.2. Approche euclidienne de la régression.
4.3. Régression orthogonale. Axe principal.
4.3.1. Introduction.
4.3.2. Définitions.
4.3.3. Diagonalisation de la matrice des variances-covariances.
4.3.4. Recherche des axes principaux.
4.3.5. Coordonnées factorielles et composantes principales.
4.3.6. Propriétés des composantes principales.
5. Régression multiple.
5.1. Position et résolution du problème.
5.2. Coefficient de corrélation multiple.
5.2.1 Définition.
5.2.2 Propriétés.
5.2.3 Application : technique de la régression pas à pas.
6. Initiation à la théorie des sondages.
6.1. Généralités.
6.2. Divers types de sondages.
6.3. Estimation des paramètres.
6.4. Etude du sondage élémentaire.
GENERALITES
OBJET DE LA STATISTIQUE
Le but de la statistique est de dégager les significations de données, numériques ou non, obtenues au cours de l’étude d’un phénomène.
Il faut distinguer les données statistiques qui sont les résultats d’observations recueillies lors de l’étude d’un phénomène, et la méthode statistique
qui a pour objet l’étude rationnelle des données.
La méthode statistique comporte plusieurs étapes.
La statistique descriptive ou déductive
C’est l’ensemble des méthodes à partir desquelles on recueille, ordonne, réduit, et condense les données.
A cette fin, la statistique descriptive utilise des paramètres, ou synthétiseurs, des graphiques et des méthodes dites d’analyse des données (l’ordinateur a facilité le développement de ces méthodes).
La statistique mathématique ou inductive
C’est l’ensemble des méthodes qui permettent de faire des prévisions, des interpolations sur une population à partir des résultats recueillis sur un échantillon.
Nous utilisons des raisonnements inductifs c’est-à-dire des raisonnements de passage du particulier au général.
Cette statistique utilise des repères de référence qui sont les modèles théoriques (lois de probabilités).
Cette statistique nécessite la recherche d’échantillons qui représentent le mieux possible la diversité de la population entière ; il est nécessaire qu’ils soient constitués au hasard ; on dit qu’ils résultent d’un tirage non exhaustif.
L’étude sur échantillon se justifie pour réduire le coût élevé et limiter la destruction d’individus pour obtenir la réponse statistique.
VOCABULAIRE STATISTIQUE
Population
C’est l’ensemble des unités ou individus sur lequel on effectue une analyse statistique.
? = { ? 1 , … , ? N } avec card( ? ) = N fini
Ce vocabulaire est hérité du 1er champ d’application de la statistique : la démographie (Vauban (1633-1707) effectua des recensements pour des études économiques et militaires).
Exemples de populations.
Les véhicules automobiles immatriculés en France
La population des P.M.E. d’un pays
Les salariés d’une entreprise
Les habitants d’un quartier
Echantillon
C’est un ensemble d’individus prélevés dans une population déterminée
Exemple d’échantillon.
L’échantillon des véhicules automobiles immatriculés dans un département.
Caractère
C’est un trait déterminé C présent chez tous les individus d’une population sur laquelle on effectue une étude statistique.
– Un caractère est dit quantitatif s’il est mesurable.
Exemples de caractères quantitatifs.
La puissance fiscale d’un véhicule automobile.
Le chiffre d’affaire d’une P.M.E.
L’âge, le salaire des salariés d’une entreprise.
– Un caractère est dit qualitatif s’il est repérable sans être mesurable.
Exemples de caractères qualitatifs.
La couleur de la carrosserie d’un véhicule automobile
Le lieu de travail des habitants d’un quartier
Le sexe et la situation matrimoniale des salariés d’une entreprise
Modalités
Ce sont les différentes situations Mi possibles du caractère.
Les modalités d’un caractère doivent être incompatibles et exhaustives; tout individu doit présenter une et une seule modalité.
Les modalités d’un caractère qualitatif sont les différentes rubriques d’une nomenclature ; celles d’un caractère quantitatif sont les mesures de ce caractère.
L’ensemble des modalités est noté E.
Pour un caractère quantitatif, la mesure du caractère peut être un nombre entier pris parmi un ensemble limité ; nous dirons qu’il est discret.
……
Cours probabilités et statistiques (900 Ko) (Cours PDF)