Méthode des moindres carrés
La solution qui au départ paraît la plus naturelle car c’est la « vraie distance » du point à la droite n’est pas retenue par les statisticiens pour différentes raisons.Cette méthode est géométriquement facile mais très compliquée à faire par le calcul.D’autre part si les unités n’étaient pas les mêmes comme dans cet exemple, cela n’aurait aucun sens.Une deuxième solution aurait été d’additionner les deux distances (horizontale et verticale) du point à la droite.Pour les mêmes raisons d’unités, on ne peut pas utiliser cette méthode.De plus ce qui nous intéresse est lié à un problème orienté. On cherche l’influence d’une variable sur l’autre. Ces deux variables ne jouent pas un rôle symétrique.Par exemple, pour un droitier connaissant ses performances du bras droit peut-on pronostiquer ses performances du bras gauche ?De même pour un gaucher peut-on pronostiquer ses performances du bras droit connaissant celles du bras gauche ?Finalement on est ramené à calculer les distances orientées, on compare la valeur calculée à la valeur observée en calculant l’écart entre ces deux valeurs. Si le point est au dessus de la droite l’écart aura une valeur négative, s’il est en dessous, l’écart aura une valeur positiveDeux choix restaient encore possible : additionner les valeurs absolues ou les carrés de ces écarts .Là encore le 1er choix qui consisterait à prendre les valeurs absolues et à les sommer, tout en étant licite, se révèle difficile à calculer.Par contre le calcul des carrés conduira à un calcul algébrique utilisant uniquement l’algèbre du second degré qui se révèlera facile à mettre en œuvre ( cf : calcul de l’écart type dans les statistiques à une variable)
Un nuage de points est tracé à l’écran, vous devez actionner une droite par rotation et déplacement afin que cette droite passe au mieux parmi le nuage. La somme des carrés des écarts des points à la droite s’affiche ainsi que la somme minimale.Dans le classeur1 les données du problème sont rentrées, en fixant une valeur de a pour le coefficient de la droite, et en faisant varier le coefficient b le tableau fournit automatiquement la somme des carrés des écarts, le graphique de la somme en fonction de b s’affiche ainsi que la formule associée.Vous avez découvert que la meilleure droite passe par le point G de coordonnées et .Reprendre l’animation précédente, faites apparaître le point G sur le graphique et faites coïncider le point P avec G.Faites tourner la droite autour de ce point G pour obtenir la somme minimale et noter les valeurs de a et de b correspondantes.Dans le classeur2, on a calculé les nouvelles coordonnées et des points quand on place l’origine du repère en G.
Dans ce nouveau repère l’équation de la droite d’ajustement est de la forme . En faisant varier le coefficient a le tableau fournit automatiquement la somme des carrés des écarts, le graphique de la somme en fonction de a s’affiche ainsi que la formule associée.Comme précédemment trouver la valeur de a correspondant à la somme minimale.Cette somme est fonction de a. C’est une expression du second degré dont la représentation graphique est une parabole et dont on peut déterminer l’abscisse du sommet (qui correspond au minimum de la somme)La nouvelle fenêtre « insertion d’une courbe de tendance » propose plusieurs types d’ajustement. Choisir le linéaire, cliquer sur l’onglet option et cocher « afficher l’équation sur le graphique »Sur le graphique la droite sera tracée et son équation sera affichée.