Modèle linéaire en univers stationnaire

Modèle linéaire en univers stationnaire

DÉFINITION GÉNÉRALE ET NOTATION GÉNÉRALE

Un modèle linéaire à une équation, en séries temporelles, suppose qu’une variable aléatoire univariée Yt est une fonction linéaire d’autres variables aléatoires univariées X2t , X3t . . . Xkt, à laquelle s’ajoute une variable aléatoire univariée ut appelée « terme d’erreur », et émet certaines hypothèses sur la distribution de toutes ces variables. On représente cet ensemble d’hypothèses de la manière suivante : Yt = β1 + β2X2t + β3X3t + · · · + βkXkt + ut , pour tout t = 1 . . . n (2.1) avec β1, β2 . . . βk des coefficients non aléatoires constants dans le temps. • La variable Yt est dite dépendante. Les variables X2t , X3t . . . Xkt sont dites explicatives. Yt et les Xit sont des variables aléatoires(1) (au sens où chacune d’elles peut avoir, d’un point de vue conceptuel, plusieurs valeurs possibles, en fonction du hasard, même si l’on observe effectivement une seule réalisation puisque la période t n’« a lieu » qu’une fois) et observables (puisqu’on peut en observer une réalisation). La variable ut est appelée terme d’erreur ou perturbation. C’est une variable aléatoire et non observable (en effet, ut = Yt −β1 −β2X2t −β3X3t −· · · −βkXkt, mais on ne peut pas déduire sa réalisation des réalisations observées de Yt et des Xit car les coefficients βi sont inconnus et donc non observés). Yt , X2t , X3t . . . Xkt et ut sont les composantes à la date t des processus stochastiques correspondants Y = {Yτ}τ=1…n, X2 = {X2τ}t=1…n, X3 = {X3τ}τ=1…n . . . Xk = {Xkτ}t=1…n, et u = {uτ}τ=1…n. • Le coefficient β1 est souvent appelé constante (ou « terme constant ») du modèle linéaire. De façon implicite, une variable explicative X1t vaut 1 à chaque période t (X1t = 1 pour tout t), ce qui implique que β1X1t = β1 pour tout t. Pour cette raison, l’indice des variables explicatives commence à 2 dans la formulation du modèle. On compte donc k variables explicatives, constante comprise (soit k−1 sans la constante !). Les coefficients βi sont des concepts non aléatoires (des valeurs uniques supposées exister dans la nature) et non observables (leur valeur est inconnue). Exemple La fonction de consommation suivante est un exemple de modèle linéaire : ln(Ct) = β1 + β2 ln(YIt) + β3Rt + ut , pour tout t = 1 . . . n ln(Ct) est le logarithme népérien de la consommation à prix constants Ct. ln(YIt) est le logarithme népérien du revenu disponible réel YIt. Rt représente le taux d’intérêt réel. ln(Ct) correspond à la variable dépendante Yt. ln(YIt) correspond à la variable explicative X2t. Rt correspond à la variable explicative X3t. On compte donc trois variables explicatives, constante comprise (k = 3). ln(Ct), ln(YIt), Rt et ut sont les composantes à la date t des processus stochastiques correspondants ln(C) = {ln(Cτ)}τ=1…n, ln(YI) = {ln(YIτ)}τ=1…n, R = {Rτ}τ=1…n et u = {ut}τ=1…n. Exemple Chapitre 2 La fonction de consommation suivante est un autre exemple de modèle linéaire : ln(Ct) = β1 + β2 ln(YIt) + β3Rt + β4 ln(Ct−1) + β5 ln(YIt−1) + ut , pour tout t = 2 . . . n ln(Ct) correspond à la variable dépendante Yt. ln(YIt) correspond à la variable explicative X2t. Rt correspond à X3t. ln(Ct−1) correspond à X4t. ln(YIt−1) correspond à X5t. On compte donc cinq variables explicatives, constante comprise (k = 5). Dans cet exemple, X4t = Yt−1 et X5t = X2t−1. ln(Ct), X2t, Rt et ut sont les composantes à la date t des processus stochastiques correspondants ln(C) = {ln(Cτ)}τ=1…n, ln(YI) = {ln(YIτ)}τ=1…n, R = {Rτ}τ=1…n et u = {uτ}τ=1…n. ln(Ct−1) est la composante de date t −1 du processus stochastique {ln(Cτ)}τ=1…n. ln(YIt−1) est la composante de date t − 1 du processus stochastique {ln(YIτ)}τ=1…n.

Interprétations du modèle linéaire et hypothèses sur les erreurs

Dans l’équation (2.1), la somme β1 + β2X2t + β3X3t + β4X4t + · · · + βkXkt est souvent interprétée, de manière conventionnelle, comme la partie de la variable dépendante Yt qui peut « s’expliquer » linéairement en fonction des variables explicatives X2t , X3t . . . Xkt, tandis que le terme d’erreur ut est interprété comme la partie ne pouvant « s’expliquer » linéairement en fonction des variables explicatives Pour intuitive qu’elle soit, cette interprétation est encore trop vague et manque de rigueur. Il reste à préciser les différents statuts statistiques d’un modèle linéaire. La section suivante établit le lien entre ces statuts et certaines propriétés du terme d’erreur.

HYPOTHÈSES SUR LE LIEN ENTRE TERME D’ERREUR ET VARIABLES EXPLICATIVES

Modèle linéaire comme approximation linéaire Statistiquement, les coefficients d’un modèle linéaire sont les coefficients de l’approximation linéaire de la variable dépendante par les variables explicatives, à condition que l’espérance du terme d’erreur soit nulle et que les covariances entre le terme d’erreur et chaque variable explicative soient nulles. Cela se formalise ainsi : si les processus stochastiques Y, X2 . . . Xk sont tels qu’ils sont reliés par le modèle linéaire (2.1) (voir section 1.1) sous les hypothèses que E(ut) = 0 ∀t et Cov(ut , Xit) = 0 ∀i = 2 . . . k et ∀t, la partie β1 + β2X2t + β3X3t + β4X4t + · · · + βkXkt représente l’approximation linéaire de la variable aléatoire Yt par les variables aléatoiresX2t . . . Xkt. En d’autres termes, β = Σ −1 Xt ΣXtYt où Xt est un vecteur(1) aléatoire à k éléments défini par Xt = (1X1t . . . Xkt) 0 . Remarque L’approximation linéaire d’une variable aléatoire Yt par des variables aléatoires X2t , X3t . . . Xkt est une fonction linéaire des variables X2t , X3t . . . Xkt, dont les coefficients sont choisis de manière à minimiser l’espérance du carré de l’écart entre Yt et cette fonction linéaire. Avec de telles hypothèses sur le terme d’erreur, le modèle linéaire suppose donc la constance dans le temps des coefficients de l’approximation linéaire de Yt par X2t , X3t . . . Xkt, et par là même un comportement particulier des espérances et variances des variables Yt et Xit (i = 2 . . . k) ainsi que des covariances entre ces variables, aux différentes périodes t. En effet, si ces espérances, variances et covariances varient dans le temps, elles doivent le faire de manière telle que Σ −1 Xt ΣXtYt soit constante dans le temps.

Modèle linéaire comme approximation conditionnelle 

La partie expliquée de la variable dépendante d’un modèle linéaire est aussi une approximation conditionnelle qui dépend d’une hypothèse plus forte que celle de la covariance nulle entre terme d’erreur et variables explicatives : il s’agit de l’indépendance entre terme d’erreur et variables explicatives. Si les processus stochastiques Y, X2 . . . Xk sont tels qu’ils sont reliés par le modèle (2.1) sous les hypothèses que E(ut) = 0 ∀t et que ut est indépendant de Xit ∀i = 2 . . . k et ∀t, la somme β1 +β2X2t +β3X3t +β4X4t + · · · +βkXkt représente l’approximation conditionnelle (1) de la variable aléatoire Yt par les variables aléatoires X2t . . . Xkt. Par conséquent : β1 + β2X2t + β3X3t + β4X4t + · · · + βkXkt = E(Yt |X2t . . . Xkt) (2.3) Il apparaît clairement que ce cas implique celui de la rubrique précédente (Modèle linéaire comme approximation linéaire). Un modèle linéaire, avec les hypothèses complémentaires que E(ut) = 0 ∀t et que ut est indépendant des variables explicatives X2t . . . Xkt, peut donc être interprété de la manière suivante : l’approximation conditionnelle de Yt par les variables explicatives X2t . . . Xkt est une fonction linéaire de ces variables explicatives avec des coefficients constants dans le temps. Cela revient à dire que l’approximation conditionnelle de Yt par les variables explicatives est identique à l’approximation linéaire de Yt par ces variables explicatives et que des coefficients sont constants dans le temps. D’ailleurs, l’hypothèse d’indépendance entre ut et X2t . . . Xkt pour tout t implique que Cov(ut , Xit) = 0 ∀i = 2 . . . k et ∀t et donc que les βi sont à la fois les coefficients de l’approximation linéaire et ceux de l’approximation conditionnelle.

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *