Mesure de la dépendance et copules
Les différentes théories et applications des méthodes statistiques occupent une place prépondérante dans le domaine de la science. Elles sont principalement utilisées pour décrire et interpréter un jeu de données. Les variables portant sur l’analyse de ces données peuvent être sous différentes formes: qualitatives et quantitatives. Dans chacun des cas, l’étude de la liaison entre des variables a toujours été une préoccupation primordiale des chercheurs. Dès lors, par le biais des travaux de nombreux auteurs, différentes mesures de dépendance ont été élaborées, parmi lesquelles le coefficient de corrélation linéaire. Ce dernier permet de quantifier le degré de liaison entre deux variables aléatoires quantitatives X et Y. Formellement, le coefficient de corrélation de Pearson associé à la paire (X, Y) est Pe E(XY)-E(X)E(Y) p (X Y) = Jvar (X) var (Y) En particulier, prX,y) = 0 quand les variables X et Y sont indépendantes. L’implication inverse est généralement fausse, car il se peut que prX,y) = 0 même si X et Y ne sont pas indépendantes. Le coefficient prX,y) affiche d’autres limites. Notamment, il est généralement incapable de bien saisir le degré de dépendance entre deux variables dont le lien n’est pas linéaire. Dans ce contexte, d’autres mesures de dépendance ont été proposées. Les plus connues sont certainement le tau de Kendall et le coefficient de corrélation des rangs de Spearman. Quoi qu’il en soit, ces mesures ne donnent qu’une indication sommaire de la structure de dépendance qui unit deux, ou plusieurs, variables aléatoires. C’est pourquoi la notion de copule a été introduite pour modéliser de façon générale plusieurs variables aléatoires par une fonction de dépendance.
Objectifs et structure du mémoire
L’objectif principal de ce travail est d’étudier la puissance de plusieurs tests de symétrie radiale pour copules multidimensionnelles sous de la dépendance de type Fisher. De manière spécifique, il y a trois objectifs poursuivis par ce mémoire: (1) Développer une extension d-dimensionnelle aux tests de Genest & Neslehova (2014) basés sur la copule empirique; (2) Étudier la puissance des tests de symétrie radiale de Bahraoui & Quessy (2017) et Genest & eslehova (2014) dans le cas bivarié sous des alternatives de Fisher ; (3) Comparer nos nouveaux tests basés sur la copule empirique avec ceux de Bahraoui & Quessy (2017). Le reste du mémoire est organisé comme suit. Le Chapitre 2 présente les structures de dépendance, la notion de symétrie radiale et les copules de Fisher. À cet effet, quelques définitions et propriétés des copules seront données; ensuite, la notion de symétrie radiale sera étudiée et quelques exemples de modèles de copules symétriques et asymétriques seront présentés. Le Chapitre 3 développe l’extension d-dimensionnelle des tests de Genest & Neslehova (2014). Le Chapitre 4 présente les résultats d’une étude de puissance des tests de symétrie radiale sous des contre-hypothèses de copules de Fisher. Le coeur du mémoire se termine par une brève conclusion. Quelques éléments techniques concernant le calcul de statistiques de tests sont dans l’Annexe A, alors que les codes Matlab utilisés pour les simulations ont été placés dans l’Annexe B.
Plan de simulation Genest & eslehova (2014) ont réalisé une étude de simulation afin d’étudier la précision de la méthode du multiplicateur et la puissance des tests de symétrie radiale basés sur les statistiques Rn, Sn et Tn. Leurs résultats montrent que la puissance de tous les tests augmente avec la taille de l’échantillon. Ils indiquent également que le test basé sur la statistique Sn est généralement le meilleur du point de vue de la puissance De leur côté, Bahraoui & Quessy (2017) ont étudié la puissance des tests basés sur les statistiques R~ , R~E, R~G, R~N et Sn . Selon leurs résultats de simulations, le test basé sur R~N est systématiquement moins puissant que ceux basés sur R~, R~ et R~G ; la performance de ces derniers est similaire à celle de Sn. Sous les alternatives Gumbel, Khi-deux et Student asymétrique, les performances de R~, R~E et R~G sont nettement meilleures que celles de Sn, tandis que sous les alternatives Clay ton, les puissances de R~, R~E et R~G sont très semblables à celle de Sn.
La statistique Sn étant meilleure que Tn et Rn, elle sera alors utilisée dans ce présent mémoire pour étudier la puissance des tests de symétrie radiale sous des contrehypothèses de copules de Fisher. Outre Sn, on a aussi inclus dans l’étude les statist iques R~, R~E , R~G et R~N proposées par Bahraoui & Quessy (2017). La performance de ces statistiques a été étudiée pour les tailles d’échantillon n E {125, 250}. À noter que le paramètre en nécessaire à l’estimation des dérivées partielles a été posé à e = 3 quand n = 125 et à en = 2 lorsque n = 250. Les modèles considérés dans l’étude appartiennent à la famille des copules de Fisher à l/ E {1, 4, 7} degrés de liberté dont les niveaux de dépendance, tels que mesurés par le tau de Kendall, sont TC E {1/4, 1/2, 3/4}. Des nuages de points générés à partir de données simulées de ces neuf modèles sont présentés à la Figure 4.1
Résultats et commentaires
La famille des copules de Fisher construite par Favre et al. (2018) possède la propriété d’asymétrie radiale. A cet effet, le pourcentage de rejet estimés à partir de 1000 échantillons de la copule permettra d’avoir une idée claire de la puissance des tests établis par Bahraoui & Quessy (2017) et Genest & Neslehova (2014). Les résultats des différentes simulations sont présentés aux Tableau 4.1 , Tableau 4.2, et Tableau 4.3 respectivement pour les degrés de liberté l/ = 1, l/ = 4 et l/ = 7. Sous les copules de Fisher à 1 degré de liberté, la puissance des tests augmente en fonction de la taille de l’échantillon, ce qui était prévisible. Mis à part la statistique R~N, qui s’avère la moins puissante peu importe la taille de l’échant illon et le tau de Kendall, les tests basés sur les statistiques R~ , R~E et R~G sont généralement meilleurs que celui basé sur Sn . Globalement, la statistique R~E est la plus puissante, suivie par R~E, et ensuite par R~G. Cependant, pour une taille n = 250 et un tau de Kendall de 0,75, la statistique Sn est meilleure que les tests basés sur la fonction caractéristique de copule. Pour /-L = 4 et v = 7 degrés de liberté, on constate des résultats t rès similaires au cas /-L = 1. La statistique R~E est ainsi la plus puissante, tandis que R~N est la moins performante. Donc, globalement, les tests de Bahraoui & Quessy (201 7) sont meilleurs que ceux de Genest & Neslehova (2014) sous la nouvelle famille des copules de Fisher dans le cas à d = 2 dimensions. Ces résultats confirment donc la supériorité des tests de symétrie radiale basés sur la fonct ion caractéristique de copule sur ceux basés sur la copule empirique sous une panoplie d ‘alternatives.
Analyse de la symétrie radiale de données multidimensionnelles
L’étude qui suit porte sur les éléments nutritifs et les habitudes alimentaires de femmes âgées de 25 à 50 ans. Les données proviennent du département de l’agriculture des États-Unis. L’échantillon de taille n = 737 comporte cinq variables, à savoir les apports quotidiens en calcium (en mg), fer (en mg), protéines (en g), vitamine A (en J..Lg et vitamine C (en mg). Les nuages de points ci-après proviennent des données brutes et rangs standardisés de la série. En visualisant les paires de variables deux à deux, les données semblent être asymétriques. Pour confirmer ou informer cette hypothèse, le test basé sur la nouvelle statistique de test Sn pour données multidimensionnelles a été mis en oeuvre. On a obtenu une p-valeur inférieure à 0,1%, ce qui rejette l’hypothèse nulle de symétrie radiale. Ainsi, la population à partir de laquelle les données proviennent a vraisemblablement une structure de dépendance asymétrique en regard des queues de sa distribution. Afin de trouver un modèle paramétrique adéquat, on pourrait alors envisager des familles de copules comme la Khi-deux, la Fisher, ou plus généralement une copule squared telle que décrite par Quessy & Durocher (2019). Une autre possibilité consiste à considérer la famille des copules à valeurs extrêmes.
Cette recherche avait pour but d’étudier la puissance empirique des tests de symétrie radiale proposés par Genest & Neslehova (2014) et par Bahraoui & Quessy (2017) sous des contre-hypothèses issues de la famille de Fisher. Les tests suggérés par Genest & Neslehova (2014) n’ont été élaborés que dans le cas bivarié, alors que ceux de Bahraoui & Quessy (2017) sont applicables à la fois dans les cas bivarié et multidimensionnel. En premier lieu, ce mémoire a développé des versions d-dimensionnelles des statistiques de test de Genest & Neslehova (2014), à savoir Rn n 11 … 11 {Cn(u ) – C~(U)}2 dU1 … dUd, Sn n 11 … 11 {Cn(u) – C~(U)}2 dCn(u), Tn Vn sup ICn(u) – C~(u)l· u E[O,l ]d La méthode du multiplicateur, nécessaire pour estimer la p-valeur des tests basés sur ces statistiques, a également été mise au point. Une étude de simulation MonteCarlo a ensuite permis de comprendre le comportement de ces statistiques lorsque les données proviennent d’une structure de dépendance asymétrique de type Fisher. La copule de Fisher a fait son apparition récemment dans la littérature, avec les travaux de Favre et al. (2018). Les résultats obtenus montrent que dans le cas bivarié, la supériorité des tests de Bahraoui & Quessy (2017) sur ceux de Genest & Neslehova (2014) est confirmée. Cependant, et contrairement à ce qui aurait pu être anticipé, c’est l’extension multidimensionnelle de la statistique Sn de Genest & Neslehova (2014) développée dans ce travail qui est la plus performante.
Avant-propos |