Validation des modèles HDF et IDF
Pour apprécier l’efficacité d‟un modèle, les calculs sont généralement effectués sur des données qui n’ont pas été utilisées dans son étalonnage. Il existe, dans la littérature, un très grand nombre de métriques pour évaluer la sensibilité d‟un modèle (Servat et Dezetter, 1990 ; Hingray et al., 2009 ; Biondi et al., 2012). Parmi les plus utilisés en hydrologie, on cite, entre autres, le coefficient de corrélation (R), le coefficient de détermination (R 2 ), l‟écart absolu moyen (EAM), l’erreur quadratique moyenne (EQM) et les critères d’efficacité, plus robustes, de Nash-Sutcliffe (NSE), Willmott (d) et Kling-Gupta (KGE). Une étude exhaustive de ces critères sort du cadre de cet exposé mais les expressions mathématiques de base sont données ci-dessous. La nomenclature des termes est commune aux différentes expressions : Oi et Pi correspondent aux valeurs observées et prévues (ou simulées) au pas de temps i, N est le nombre d‟observations, 𝑂 et 𝑃 sont les moyennes des N valeurs observées et simulées par le modèle. Le coefficient de détermination est le carré du coefficient de corrélation de Pearson. Il exprime la proportion de la variance expliquée par le modèle. Il varie de 0,0 à 1,0, avec des valeurs plus élevées indiquant une meilleure concordance entre les données observées et simulées ou prévues. Il est donnée par: 𝑅 2 = 𝑂𝑖 − 𝑂 × 𝑃𝑖 − 𝑃 𝑁 1 𝑂𝑖 − 𝑂 𝑁 2 1 × 𝑃𝑖 − 𝑃 𝑁 2 1 (82) Le coefficient d’efficacité NSE, proposé par Nash (1969) et repris par Nash et Sutcliffe (1970), a été largement utilisé pour évaluer la performance des modèles hydrologiques. Ce coefficient, variable de moins l’infini à 1.0, avec des valeurs plus élevées (NSE ≥ 0,6) indiquant un meilleur accord, a pour formulation : 𝑁𝑆𝐸 = 1 − 𝑂𝑖 − 𝑃𝑖 𝑁 2 𝑖=1 𝑂𝑖 − 𝑂 𝑁 2 𝑖=1 (83) Physiquement NSE, est la différence entre 1 et le rapport de l’erreur quadratique moyenne, à la variance des données observées exprimée par (Legates et McCabe, 1999) : 135 𝐸𝑄𝑀 = 𝑁 −1 × 𝑂𝑖 − 𝑃𝑖 2 𝑁 1 (84) Par exemple, si le carré des différences entre les simulations du modèle et les observations est aussi large que la variabilité dans les données observées, alors NSE vaut 0,0 indiquant que la moyenne observée 𝑂 est le meilleur prédicteur (Wilcox et al., 1990). L‟Indicateur d‟Agreement de Willmott (dr), est un autre critère, sans dimension, largement utilisé pour l‟évaluation de la performance de l‟ajustement d‟un modèle. Sous sa forme modifiée, il est donné par les expressions ci-dessous: 𝑑 = 1 − 𝑃𝑖 − 𝑂𝑖 𝑁 2 𝑖=1 𝑃𝑖−𝑂 + 𝑂𝑖 − 𝑂 𝑁 2 𝑖=1 (85) 𝑑1 = 1 − 𝑃𝑖 − 𝑂𝑖 𝑁 𝑖=1 𝑃𝑖−𝑂 + 𝑂𝑖 − 𝑂 𝑁 𝑖=1 (86) 𝑑1 ′ = 1 − 𝑃𝑖 − 𝑂𝑖 𝑁 𝑖=1 2 𝑂𝑖 − 𝑂 𝑁 𝑖=1 (87) Cet indice varie de -∞ à 1 avec des valeurs plus élevées indiquant que le modèle prédit des valeurs s’accordant mieux avec les observations. Pour améliorer la performance des modèles Pluie-Débit, Gupta et al. (2009) ont proposé une modification du critère de Nash-Sutcliffe telle que : 𝑁𝑆𝐸 = −𝛽𝑛 − 𝛼 2 + 2. 𝑅. 𝛼 (88) où R est le coefficient de corrélation (racine carrée de R 2 défini plus haut) entre les valeurs observées et estimées, est la racine carrée du rapport des variances des données simulées (𝜎𝑃 2 ) et observées (𝜎𝑂 2 ), 𝛽𝑛 est l‟erreur de bilan normée définie par : 𝛽𝑛 = 𝑂 − 𝑃 2 𝜎𝑂 2 (89) Ils proposent ensuite d’utiliser un critère de type distance euclidienne entre les valeurs prises par les trois composantes et leurs valeurs optimales. Ils introduisent alors le critère de KlingGupta (KGE), qui est la différence entre 1 et cette distance euclidienne. L’objectif étant d’atteindre les valeurs optimales des composantes, la distance euclidienne doit tendre vers zéro et on cherche ainsi à maximiser le KGE, comme le montrent les équations ci-dessous : 136 𝐾𝐺𝐸 = 1 − 𝐸𝐷 (90) 𝐸𝐷 = 𝑅 − 1 2 + 𝛼 − 1 2 + 𝛽 − 1 2 (92) 𝛽 = 𝑃 𝑂 (93) où est une mesure du biais du modèle. La valeur idéale de KGE est donc égale à 1. Dans la pratique, la recherche des jeux de paramètres optimaux pour le modèle considéré visà-vis d‟un critère d‟appréciation donné revient à trouver le jeu de paramètres qui donne la meilleure valeur du critère. Faciles à mettre en œuvre manuellement ou automatiquement, les critères de performance de Nash-Sutcliffe, Willmott et le coefficient de détermination sont utilisés dans la présente étude. Dans le cas des modèles HDF retenus (équations 70 et 71), le jeu de paramètres porte uniquement sur la constante b, la pente des courbes représentatives. D‟une façon générale, les courbes correspondant aux averses décennales, cinquantennales et centennales se superposent ou montrent un nuage de points ayant une tendance bien déterminée (figures 42 à 45).