Régression linéaire par la méthode des moindres carrés
Approche de prévision développée
Généralité Nous examinons dans ce chapitre la notion de prévision, la nécessité de prévoir la production d’énergie photovoltaïque ainsi que deux approches de prévisions proposées pour ce type d’énergie. Ce chapitre traite également les notions essentielles de la régression et discute en détail la méthode des moindres carrés ainsi que le modèle ARMAX et traite ces propriétés en tant que méthode de prévision . Prévoir, c’est observer un ensemble de données qui permet d’envisager une situation future et d’entreprendre des actions pour y parer concrètement. Autrement dit c’est porter un jugement sur les événements ou évolutions possibles à venir en utilisant comme outils le passé et le présent. Il en résulte que les prévisions sont toujours entachées d’erreur et qu’il est possible d’en établir plusieurs pour un même événement à venir (qui constitue l’objet de la prévision). Des outils d’analyse doivent donc être développés afin de comparer et de hiérarchiser les prévisions pour discerner ce qui fait qu’on puisse, ou non, en qualifier certaines de » bonnes « . La première approche de la prévision consiste à en mesurer les spécificités. Pour envisager une typologie des problèmes de prévision en termes d’horizon, de type de produit ou de secteur, ou en termes de but opérationnel, il est utile de dégager quelques traits qui différencient fondamentalement : – le secteur d’activité. – l’utilisation opérationnelle. – la (ou les) fonction(s) utilisatrice(s) de la prévision. – l’horizon. L’approche est très dépendante du secteur d’activité : on ne prévoit pas des livraisons de ciment par les mêmes méthodes que des ventes de savons. Les causalités économiques sous-jacentes sont différentes suivant que le secteur est plus ou moins en amont dans le circuit industriel donc plus ou moins proche de la demande finale, suivant que le produit est stockable ou non, qu’il donne lieu à un marché de renouvellement (télévision) ou non (acier), que le produit est standardisé ou non. Les méthodes de prévisions Il existe en général deux méthodes de prévision : -Premièrement il y a les méthodes d’extrapolation qui utilisent le passé de la variable elle-même. Seul le passé de la variable est utilisé en vue de la prévoir sans apport d’information extérieure, nous citons à titre d’exemple : le lissage par les moyennes mobiles, la modélisation par ARMA. -Deuxièmement entrent en jeu les méthodes explicatives qui à son tour utilisent les valeurs passées et présentes d’une ou de plusieurs variables pour prévoir. L’ensemble d’information utilisé comporte des facteurs extérieurs qui peuvent influencer le futur en plus du passé de la variable elle-même. Parmi ces méthodes on peut citer : la régression linéaire, modèle ARMAX. La prévision à court terme Dans le cadre de ce mémoire, notre approche consiste à établir des modèles de prévision à court terme. Fondamentalement, l’ horizon d’une prévision à court terme dépend du contexte étudié : en gestion ou marketing, le court terme est de l’ordre de quelques mois alors que dans le domaine de la météo, le court terme est de l’ordre d’une ou deux journée(s). Avec un horizon à court terme, on suppose que le phénomène dépend de ses valeurs passées et présentes. Critères de validité de la méthode de prévision La prévision des valeurs futures d’une variable y peut se faire en utilisant différentes méthodes. Les prévisions obtenues peuvent être comparées et appréciées selon plusieurs critères parmi lesquels : L’erreur moyenne (mean error) : e¯ = 1 n (3.1) MVR en Sciences Cognitives RASETASON Dario Panoël Chapitre 3 33 Le carré moyen des erreurs (mean square error) : MSE = 1 n Xe 2 t (3.2) L’erreur quadratique moyenne (Le root mean square error ) : RMSE = √ MSE RMSE = r 1 n Xe 2 t (3.3) MSE étant l’erreur de prévision pour un instant t (la différence entre la valeur observée et la valeur prévue par une méthode quelconque). La meilleure méthode est celle qui fournie les valeurs les plus faibles pour ces critères. Prévision de l’ énergie photovoltaïque À titre récapitulatif, les méthodes de prévision de production d’énergie photovoltaïque peuvent être classifiées en quatre approches, à savoir, approche statistique, approche d’intelligence artificielle (IA) , approche physique et approche hybride. Dans tout ce qui suit, nous nous focalisons sur la première approche. Elle repose sur des modèles statistiques de séries temporelles comme les modèles ARMA. Or, ces derniers ne peuvent pas prendre en compte l’information climatique (les données météorologiques comme l’irradiation), qui est une information primordiale pour améliorer les prévisions photovoltaïques. Pour cela, nous avons proposé un autre type de modèle : le modèle ARMAX. Ce modèle considère les données météorologiques, et plus particulièrement le rayonnement solaire, comme variables exogènes. Signalons également que des techniques avancées d’intelligence artificielle, tels que les réseaux de neurones artificiels (RNA) sont aussi une des approches statistiques intéressantes mais son étude détaillée dépasse le cadre du présent mémoire.
Régression linéaire par la méthode des moindres carrés
Un modèle de régression linéaire est un modèle de régression d’une variable expliquée sur une ou plusieurs variables explicatives dans laquelle on fait l’hypothèse que la fonction qui relie les variables explicatives aux variables expliquées est linéaire.
Principe de la régression linéaire
La régression linéaire décompose une variable aléatoire y en son espérance (ou moyenne), exprimé linéairement en fonction d’autres variables non aléatoire : 1, x2, x3, …, xk, plus une erreur aléatoire . K est donc le nombre de variables explicatives (ou co-variables). Par exemple, si K = 3 nous avons le modèle linéaire suivant : yt = β1 + β2x2t + β3x3t + ut t = 1, 2, ….., T (3.4) MVR en Sciences Cognitives RASETASON Dario Panoël Chapitre 3 34 Les erreurs ut doivent vérifier un certain nombre de présupposés : -P1 être d’espérance nulle, E(ut) = 0 ; -P2 avoir la même variance pour tout t, var(ut) = σ 2 ; -P3 être non corrélées entre elles, corr(ut , us) = 0, t 6= s ; -P4 être normalement distribuées. Sous ces hypothèses, l’espérance de yt est β1 + β2 ∗ x2t + β3 ∗ x3t . Nous pouvons aussi écrire matriciellement le modèle et les présupposés : Y = y1 y2 . . . yT X = 1 x21 x31 1 x22 x32 . . . . . . . . . 1 x2T x3T U = u1 u2 . . . uT β = β1 β2 . . . βT (3.5) Avec ces notations, l’équation (3.4) s’écrit comme suit YT∗1 = XK∗T βT∗1 + UT∗1 (3.6) Et les présupposés s’expriment : P1 : E(Y ) = Xβ, P2+P3+P4 : U ∼ N(O, σ2 u IT ) It est la matrice identité d’ordre T. On peut encore les formuler comme suit Y ∼ N(Xβ, σ2 u IT ) (3.7) La méthode de MCO estime β par la valeur qui minimise la quantité (Y − X ∗ β) 0 (Y − X ∗ β) dans laquelle X 0 est la transposée de X. Le minimum est atteint pour βˆ = (X 0 X) −1 (X 0 Y ) (3.8) Si les présupposés P1 + P2 + P3 sont vérifiés, cet estimateur est sans biais et de variance minimale (théorème de Gauss-Markov). Il est normalement distribué et de matrice de covariance (σ 2 u (X 0 X)−1 ) βˆ ∼ N(β, σ2 u (X 0 X) −1 ) (3.9) Les vecteurs des valeurs ajustées et des résidus sont respectivement définis par Yˆ = yˆ1 yˆ2 . . . yˆT = Xβ et ˆ Uˆ = yˆ1 yˆ2 . . . yˆT (3.10) MVR en Sciences Cognitives RASETASON Dario Panoël Chapitre 3 35 La variance de l’erreur est estimée sans biais par S 2 u = 1 T − K X t (yt − yˆt) 2 ) = 1 T − K X t uˆ 2 t (3.11) On estime la matrice de covariances des paramètres en remplaçant dans (σ 2 u (X 0 X)−1 ) la variance inconnue (σ 2 u ) par son estimateur S 2 u . On note S 2 u (βˆ i), l’estimation de la variance de βˆ i ainsi obtenue, c’est l’élément (i, i) de la matrice (S 2 u (X 0 X)−1 ). Rappelons que le coefficient βˆ i est la quantité dont augmente y quand la variable xi augmente de 1, toutes choses égales par ailleurs ; dans certains milieux scientifiques, on appelle d’ailleurs βˆ i , coefficient de régression partielle de xi . On rencontrera ce terme dans les séries temporelles quand on étudiera la régression d’une série sur son passé. Une fois la régression effectuée, il faut s’assurer que les présupposés sur les erreurs sont vérifiés. Cette vérification s’effectue sur les résidus. Le diagramme de dispersion des résidus ou des résidus normalisés contre les valeurs ajustées permet de voir si la distribution de ces résidus est bien indépendante de la valeur ajustée. Le QQ-plot de normalité des résidus permet de vérifier l’hypothèse de normalité. Le logiciel R offre de nombreux diagnostiques, en particulier dans lm(), fonction de base de la régression linéaire. Dans le cas que nous traiterons, P4, la normalité sera systématiquement examinée ; P3, la non-corrélation des erreurs sera souvent rejetée. Il faudra donc comprendre le mécanisme de cette corrélation pour en tenir compte. Une fois la corrélation modélisée, la méthode des moindres carrés généralisés (MCG) permet de l’intégrer dans l’estimation de la régression. La connaissance du mécanisme de la corrélation des erreurs au cours du temps permet quant à elle de mieux prédire la série.