………
Introduction
La statistique peut être vue comme l’ensemble des méthodes et techniques permettant de traiter les données (informations chiffrées) associées à une situation ou un phénomène.
Cette démarche correspond à plusieurs objectifs, c’est pourquoi on subdivise la statistique en plusieurs domaines :
-Description d’une situation donnée (faire parler les chiffres).
C’est le cadre de la Statistique Descriptive.
-Mettre en évidence certaines relations.
On parle ici de statistique corrélative.
-Faire des prévisions à propos de phénomènes évoluant dans le temps.
Ce que l’on appelle les séries temporelles, ou chronologiques.
-D’induire des conclusions générales à partir de mesures faites sur un échantillon.
-De tester une hypothèse.
C’est l’objet de la statistique inférentielle.
Nous l’aborderons lors de la théorie des sondages (ou de l’échantillonnage).
En conséquence la statistique se révèle être un outil fondamental d’aide à la décision.
Objectifs du cours
-Acquérir une culture de base en statistique.
-Posséder le sens critique nécessaire à la compréhension de présentations ou travaux basés sur des études statistiques.
-Maîtriser les outils et techniques de base.
-Savoir choisir les outils adéquats pour le traitement des données, ceci en relation avec une problématique définie.
-Pouvoir utiliser de façon adéquate les logiciels statistiques.
I Statistique Descriptive et Corrélative
1.- Population, Echantillon, Variable Statistique, Effectifs, Fréquences, Variables
Discrètes et Continues, Densité de fréquence, Histogramme, Fonction de répartition.
2.- Indicateurs de position : Moyenne, Mode, Médiane, Quantiles.
3.- Indicateurs de dispersion : Variance, Ecart-type, Intervalle Semi-interquartile.
4.- Autres indicateurs : Coefficients de Variations, Coefficient de Dissymétrie
5.- Corrélation et Régression linéaire : Distributions Conjointes, Marginales, Conditionnelles. Covariance, Coefficient de Corrélation, Droite de Régression.
Variance expliquée et Résiduelle.
1.1.- Population, Échantillon, Variable Statistique
Définitions
*Population : ensemble d’unités statistiques.
Exemples :
– Tous les malades atteints de sclérose en plaque (où ? quand ?).
– Relevés pluviométriques quotidiens (population = jours).
*Echantillon: sous-ensemble de la population.
En général nous n’avons pas accès à toute la population (recensement), d’où l’idée d’en extraire un sous-ensemble. Si on a une connaissance a priori, on peut parler d’échantillon représentatif (stratification).
Variable statistique (ou caractère) : opération qui associe à chaque unité statistique une propriété, une modalité, un score.
*Observation : valeur prise par la variable sur une unité statistique.
*Données : sont constituées par l’ensemble des observations (tableaux, fichiers, données primaires).
Au sens mathématique du terme, une variable est une application de la population sur l’ensemble des scores. SPX →:
Le fait que l’on note X une application peut être source de confusion. Cette notation devient cohérente dès que l’on parle de la distribution de la variable.
*On distingue les variables nominales (ou caractères qualitatifs) des variables numériques (ou caractères quantitatifs). Si on peut ordonner les modalités on parle aussi de variable ordinale. Les variables numériques se prêtent aux calculs (moyennes etc…), dans ce cas S est un ensemble numérique p.ex. S = IR.
Exemples
1.- Etat clinique : guéri, stationnaire, aggravé.
2.- Groupe sanguin.
3.- Relevés pluviométriques quotidiens (NE ;1999).
4.- Statistique médicale (OFS).
Codes diagnostics et d’interventions par patients, durée de séjour, régime d’assurance.
5.- Statistique administrative des établissements de santé (hôpitaux, cliniques, homes) (OFS).
Nombre de cas et nombre de journées par service, nombre de médecins d’infirmières etc…