Les séries de fréquences bivariées

Les séries de fréquences bivariées

La distribution marginale de x est la correspondance entre xj et Fj., où est Fj. le nombre de fois que la valeur xj de x est observée indépendamment de la valeur prise par y. La distribution marginale de y est la correspondance entre yl et F.l, où est F.l le nombre de fois que la valeur yl de y est observée indépendamment de la valeur prise par x. b) Classes modales La classe modale de la distribution marginale de x est la classe 2040 ; ce qui signifie que les âges compris entre 20 et 40 ans sont observés avec la plus grande fréquence. La classe modale de la distribution marginale de y est la classe 1.6 y 2 ; ce qui signifie que les tailles comprises entre 1.6m et 2m sont observés avec la plus grande fréquence.La distribution conditionnelle de x pour y=y1 (y1 représente la taille comprise entre 1.2m et 1.6m) est la correspondance entre xj et Fjl où Fj1 est le nombre de fois que la valeur xj de x a été observée pour une valeur de y = y1.Interpolation linéaire : xmo/y=y2 = 20 + ((30 – 10)/((30 – 10)+(30 – 20))) . 20 = 33.3333 ans, soit 33 ans. On en déduit que, parmi 65 personnes qui ont une taille comprise entre 1.6m et 2m, celles qui ont un âge d’environ 33 ans sont observées avec la plus grande fréquence.) Le centre de gravité, G ; d’une distribution bivariée est le couple ( x , y ).

Il s’agit de la taille et de l’âge moyen de l’ensemble du groupe (utilisation des distributions marginales et non conditionnelles).  G = (32 ;1.66) g.2) La variance des âges de l’ensemble des personnes du groupe (utilisation des distributions marginales et non conditionnelles)Il faut ici utiliser les distributions conditionnelles de x et de y. On notera qu’il existe autant de moyennes conditionnelles pour x qu’il y a de valeurs ou (de classes) différentes pour y (puisque la condition porte sur y !). De même, il existe autant de moyennes conditionnelles pour y qu’il y a de valeurs (ou de classes) différentes pour x (puisque la condition porte sur x !).Les courbes de régression sont les courbes qui relient les points dont les coordonnées sont les valeurs de la variables (ou les centres de classe) et les moyennes conditionnelles correspondantes de l’autre variable. On obtient ainsi la courbe de régression de y en x (Cy/x) et la courbe de régression de x en y (Cx/y). La courbe Cy/x relie les points qui ont pour coordonnées les valeurs de la variable âge (dans ce cas, les centres de classes) et les tailles moyennes conditionnelles aux différentes valeurs prises par l’âge.

La courbe Cx/y relie les points qui ont pour coordonnées les valeurs de la variables taille (dans ce cas, les centres de classes) et les âges moyens conditionnels aux différents valeurs prises par la taille.Ce qui signifie : que les âges compris entre 0 et 20 ans sont plus « attirés » par les tailles comprises entre 1.2m et 1.6m que par les tailles comprises entre 1.6m et 2m ; etc… Cela semble logique : ce sont les classes de la population les plus jeunes et les plus vieilles qui sont plus « attirées » par les tailles les plus petites. j) Coefficient de Pearson Plus les taux de liaison sont dispersés autour de la moyenne (0), plus on s’éloigne de la situation d’indépendance parfaite. Calcul de la variance des tjl:La covariance est une mesure de la variation conjointe des valeurs de l’âge et de la taille autour de leur moyenne respective. Elle est ici positive. Cela signifie qu’en moyenne, les personnes dont l’âge est supérieur à l’âge moyen ont une taille supérieure à la taille moyenne et que les personnes dont l’âge est inférieur à l’âge moyen ont une taille inférieure à la taille moyenne.il s’agit du pourcentage minimal d’intoxication alimentaire dans une région indépendamment du pourcentage de la population consommant le CACO-LACO. Autrement dit, même s’il n’y avait aucun consommateur de CACO-LACO dans la région, il y aurait quand même 7.45% d’intoxication, soit environ 7450 cas d’intoxication. 0.55 : si le pourcentage de personnes consommant le CACO-LACO augmentait de 1%, le pourcentage d’intoxication dans la population augmenterait de 0.55%. 0.85 : il y a 85% de la variance des NI qui sont expliqués par la relation linéaire qui existe entre NI et NBC.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *