Variables intégrées, modèles VAR et cointégration
Problèmes économétriques liés aux variables intégrées
Plusieurs problèmes se posent lorsqu’on veut vérifier l’existence d’une relation linéaire entre plusieurs variables dont certaines ont une tendance stochastique (donc une racine unitaire), et lorsqu’on veut estimer les paramètres de cette relation supposée : Problèmes économétriques liés aux variables intégrées 201 PEARSON Education France — Exercices d’Économétrie – 2e édition — (Scriptex : 4e épreuve) — 201 — Variables intégrées, modèles VAR et cointégration PEARSON Education France — Exercices d’Économétrie – 2e édition — (Scriptex : 4e épreuve) — 202 — • Même si, dans la réalité, aucune relation linéaire ne lie ces variables, une estimation par MCO peut donner des résultats qui font croire faussement qu’une telle relation existe et qu’elle est importante (R 2 élevé, t-stats significatifs…). C’est le phénomène bien connu de régression fallacieuse ou régression factice (spurious regression (1) en anglais) [GRA 1974] et [PHI 1986]. En fait, l’existence d’une réelle relation à long terme entre des variables intégrées est soumise à certaines conditions, appeléescointégration entre les variables intégrées. En d’autres termes, si les variables sont intégrées (ce que l’on vérifie avec les tests de racine unitaire), il faut vérifier leur éventuelle cointégration pour savoir si elles entretiennent réellement une relation à long terme. Ces conditions de cointégration sont détaillées dans ce chapitre, ainsi que des méthodes permettant de vérifier empiriquement une éventuelle cointégration entre des variables intégrées observées. • Même en cas de cointégration entre la variable dépendante et les variables explicatives, les estimateurs des moindres carrés ordinaires convergent « trop vite » pour être distribués d’après une loi normale. Par conséquent, les tests d’hypothèse usuels ne suivent pas les lois Student ou asymptotiquement normales : l’inférence statistique classique (voir chapitres 2, 3 et 4) ne s’applique pas. D’autres techniques d’estimation permettent toutefois de générer des tests d’hypothèse sur les coefficients cointégrants, qui utilisent des distributions connues. 2 Définition de la cointégration Des processus stochastiques X1, X2 . . . Xw intégrés du même ordre d sont cointégrés s’il existe une combinaison linéaire de ces processus qui est intégrée d’un ordre inférieur à d. Il faut donc qu’il existe une valeur b > 0 et des valeurs β1, β2 . . . βw vérifiant : • β1X1 + β2X2 + · · · + βwXw est I(d − b). • Chaque variable X1, X2 . . . Xw est I(d). Remarque En pratique, le cas le plus fréquent est celui où toutes les variables sont intégrées d’ordre 1 (d = 1), et où il existe une combinaison linéaire de celles-ci, stationnaire et donc intégrée d’ordre 0 (b = 1 et d − b = 1 − 1 = 0). La définition générale permet toutefois de tenir compte d’autres cas possibles, quoique rares. Par exemple, des variables peuvent être chacune I(2) et cointégrées en raison de l’existence d’une combinaison linéaire de celles-ci de type I(1) (dans ce cas, d = 2, b = 1 et d − b = 1) ou I(0) (dans ce cas, d = 2, b = 2 et d − b = 0). β = (β1, β2 . . . βw) 0 est le vecteur cointégrant(ou de cointégration). β 0Xt = β1X1t +β2X2t + · · · + βwXwt est l’expression cointégrée. Il peut exister plusieurs vecteurs cointégrants linéairement indépendants pour les mêmesw variables. Le nombre de ces vecteurs est noté r. Dans tous les cas,r < w ; en d’autres termes on ne peut avoir plus de w − 1 vecteurs de cointégration linéairement indépendants. 1. On doit la découverte de ce phénomène à Yule [YUL 1926]. 202 Variables intégrées, modèles VAR et cointégration PEARSON Education France — Exercices d’Économétrie – 2e édition — (Scriptex : 4e épreuve) — 202 — PEARSON Education France — Exercices d’Économétrie – 2e édition — (Scriptex : 4e épreuve) — 203 — Toute combinaison linéaire de vecteurs de cointégration pour des variables est aussi un vecteur de cointégration pour ces variables. Tout multiple d’un vecteur de cointégration est Chapitre 6 également un vecteur de cointégration. Bien entendu, ce nouveau vecteur est linéairement dépendant du premier. Une même direction vectorielle est représentée par une infinité de vecteurs, tous linéairement dépendants, tous combinaisons linéaires les uns des autres. L’espace de vecteurs de cointégration est donc infini, même si r = 1, c’est-à-dire même s’il existe un seul vecteur de cointégration linéairement indépendant. Par « r vecteurs de cointégration linéairement indépendants », on entend donc « r directions vectorielles de cointégration différentes », chacune d’elles étant représentée par une infinité de vecteurs qui sont des multiples les uns des autres. Pour représenter de manière unique chacune de ces r directions vectorielles de cointégration, il faut appliquer une règle de normalisation arbitraire : par exemple, on peut les représenter toutes par leur vecteur dont le premier coefficient (le coefficient de la première variable) vaut 1, ou encore par leur vecteur dont le deuxième coefficient (celui de la deuxième variable) vaut 1,… On peut aussi représenter la première direction vectorielle (respectivement, la deuxième, la troisième…) par son vecteur dont le premier (respectivement, le deuxième, le troisième…) coefficient vaut 1(et ainsi de suite). Quand r > 1, même si chacune des r directions vectorielles a été normalisée et est donc représentée par un seul vecteur normalisé, toute combinaison linéaire de ces r vecteurs est aussi un vecteur de cointégration. Avoir normalisé les directions initiales ne suffit donc pas à limiter le nombre de vecteurs à r. Pour sélectionner seulement r vecteurs, il faut en plus appliquer une règle arbitraire d’identification, généralement fournie par des restrictions sur les coefficients suggérées par la théorie économique, financière, marketing… L’exemple le plus fréquent est celui de w variables X1, X2 . . . Xw, toutes I(1) et cointégrées s’il existe une combinaison linéaire β1X1 + β2X2 + · · · + βwXw stationnaire, donc une expression β1X1 + β2X2 + · · · + βwXwI(0). En pareil cas, chaque variable individuelle est non stationnaire avec une tendance stochastique puisqu’elle est I(1), et a donc tendance à s’éloigner davantage de ses propres conditions initiales, avec de larges fluctuations. Toutefois, étant cointégrées, ces variables divergent ensemble : elles ont tendance à ne pas trop s’éloigner les unes des autres, puisqu’une fonction de ces variables reste stationnaire. Une force économique les relie donc à long terme, de manière qu’elles ne s’écartent pas durablement d’une relation d’équilibre. La combinaison linéaire β1X1+β2X2+· · ·+βwXw représente la déviation par rapport à une relation d’équilibre entre les variables. La cointégration implique que cette déviation est stationnaire : elle fluctue autour d’une espérance constante, avec une dispersion constante. Cette déviation n’a donc pas tendance à diverger, à devenir trop grande : les variables ne s’écartent pas durablement de leur relation d’équilibre.