Méthodologies pour la méta-modélisation
La conception d’un méta-modèle fiable nécessite traditionnellement plusieurs étapes clés. Elles sont résumées par le schéma représenté Figure 2.1. Certaines étapes sont complètement dictées par le cas d’application, notamment la définition des paramètres incertains, le choix de la réponse d’intérêt, la manière de l’évaluer ou encore l’utilisation qui est faite du méta-modèle. A l’inverse, la planification d’expériences, la construction du méta-modèle et sa validation sont des étapes génériques. Différentes méthodologies sont disponibles pour la réalisation de chacune d’entre elles. On se propose dans ce chapitre de décrire les méthodes utilisées pour ces étapes génériques dans le cadre de cette thèse, et en particulier les spécificités liées à la multi-fidélité. Tout d’abord, la planification d’expériences et ses enjeux sont brièvement introduits dans la partie 2.1. Dans un cadre classique de simple fidélité, les méthodes utilisées sont l’échantillonnage par hypercube latin pour la définition du plan d’expériences et le krigeage pour la construction du méta-modèle. Ces méthodes sont détaillées dans la partie 2.2. Celles utilisées dans un cadre multi-fidélité sont ensuite décrites au sein de la partie 2.3. Il s’agit de l’échantillonnage par hypercubes latins imbriqués et du co-krigeage multi-fidélité. Finalement, l’estimation de la qualité des méta-modèles obtenus fait l’objet de la partie 2.4
Introduction à la planification d’expériences
La planification d’expériences est un élément incontournable de la méta-modélisation. Elle consiste à choisir des points dans l’espace des paramètres où évaluer la réponse d’intérêt. L’ensemble des points d’expériences sélectionnés forme le plan d’expériences. La réponse d’intérêt est ensuite évaluée (i.e. simulée) pour chacun de ces points, formant l’ensemble des observations. Le plan d’expériences et ses observations sont les seules informations nécessaires à la construction d’un méta-modèle. La définition du plan d’expériences a donc un très fort impact sur la qualité du méta-modèle. De très nombreuses méthodes ont été proposées dans la littérature pour définir un plan d’expériences, notamment dans le cadre de la construction d’un méta-modèle. Ces méthodes sont largement détaillées dans les livres de [Koehler and Owen, 1996], [Fang et al., 2006] ou encore [Kleijnen, 2008]. Dans cette thèse, nous nous intéressons à la conception de méta-modèles prédictifs pour l’ensemble de l’espace sur lesquels ils sont définis. Pour cela, on considère des plans d’expériences exploratoires, pour lesquels les points d’expériences sont bien répartis dans l’espace. Certains plans d’expériences exploratoires, parmi les plus classiques, sont présentés ci-dessous. Pour la suite, on note d la dimension de l’espace des paramètres et n la taille du plan d’expériences, autrement dit le nombre d’expériences associées à ce plan. L’intervalle de variation des différents paramètres incertains est normalisé entre 0 et 1.
Plan d’expériences standard
Un premier type de plan d’expériences, dit standard ou tabulé, peut être considéré lorsque l’espace des paramètres est discrétisé de manière régulière. Chaque paramètre peut alors prendre k valeurs différentes, appelées facteurs. Dans ce cas, le plan d’expériences le plus intuitif est probablement le plan factoriel. Il consiste simplement à considérer un point d’expérience à chaque noeud du découpage ainsi obtenu. Un tel plan remplit relativement bien l’espace si un nombre de facteurs suffisant est considéré, mais peut également conduire à un nombre d’évaluations n = k d très important. Lorsque les simulations réalisées pour chacun des points du plan correspondent à des codes de calcul coûteux, le nombre n ne doit pas être trop important. Il faut donc que le nombre de facteurs reste faible (k = 2 ou 3). De nombreux autres plans standards sont décrits dans la littérature, tels ceux introduits par [Box and Behnken, 1960], [Plackett and Burman, 1946] ou encore [Doehlert, 1970]. Une représentation en dimension 3 est donnée en exemple pour certains de ces plans avec la Figure 2.2. Les plans d’expériences standards sont souvent proposés dans les logiciels pour la construction de méta-modèles. En effet, ils ont l’avantage d’être simples à calculer et faciles à appréhender pour l’utilisateur. Toutefois, ils sont peu adaptés à la méta-modélisation car ils n’offrent pas une grande flexibilité dans le choix du nombre d’expériences n. De plus, comme pour les plans factoriels, n est généralement important lorsque la dimension d est élevée.
Plan space-filling
Considérons maintenant l’espace des paramètres comme continu. Les plans d’expériences spacefilling désignent des plans d’expériences exploratoires particulièrement adaptés à la méta-modélisation [Pronzato and Müller, 2012]. Ce sont des plans pour lesquels le placement des points d’expériences est optimisé selon un critère géométrique ou statistique. L’optimisation est aussi dépendante du nombre d’expériences n et de la dimension d considérés. Un critère géométrique couramment utilisé consiste à maximiser la distance minimale entre les différents points du plan d’expériences. On parle alors de critère « maximin » [Johnson et al., 1990]. Un autre critère cherche à minimiser la distance maximale entre les points du plan et les points de l’espace. En d’autres termes, quel que soit le point de l’espace considéré, il faut que la distance entre ce point et le point du plan le plus proche soit aussi petite que possible. Il s’agit du critère « minmax » [Johnson et al., 1990]. La Figure 2.3 donne des exemples de plans construits à partir de ces deux critères géométriques. Un inconvénient de ces plans est qu’ils peuvent être coûteux à construire, en.Les critères statistiques employés sont généralement basés sur la discrépance [Fang, 2000]. Dans ce contexte, la discrépance désigne une mesure de l’écart entre la répartition des points du plan et une répartition uniforme. Elle peut se mesurer en comptant le nombre de points se trouvant à l’intérieur d’un volume défini par des intervalles de l’espace. Ainsi, plus la discrépance est faible, plus le nombre de points dans le volume tend à rester constant, quel que soit l’emplacement du volume dans l’espace. Des plans d’expériences minimisant la discrépance peuvent être construits grâce à des suites à faible discrépance telles que les suites de [Sobol’, 1967] ou [Halton, 1960]. On parle aussi de suites quasi aléatoires. Elles ont pour propriété de minimiser la discrépance lorsqu’elles tendent vers l’infini. Elles permettent ainsi de remplir l’espace de manière très régulière. Une comparaison entre un plan obtenu par tirage aléatoire (i.e. un plan non space-filling) et un plan obtenu par l’utilisation d’une suite de Sobol’ est proposée sur la Figure 2.4. Les suites à faible discrépance sont fréquemment utilisées au sein de méthodes de Monte Carlo pour le calcul numérique d’intégrales.