Mesure des efficacités à partir des données

Mesure des efficacités à partir des données

Méthode tag-and-probe sur les événements Z → ee

Afin de s’affranchir autant que possible des incertitudes de la simulation sur la mesure, l’efficacité combinée (online et offline) de reconstruction de l’électron doit être déterminée à partir des données. La méthode tag-and-probe utilise l’identification des électrons de désintégration du Z. Cette méthode a été utilisée dans les expériences du Tévatron (voir Réf. [71] par exemple). Ce canal est utilisé car les électrons ont une gamme d’énergie similaire à ceux issus de la désintégration du boson W, le nombre d’événements est élevé et le bruit de fond est faible. La méthode a été développée et testée sur données simulées dans ATLAS. L’efficacité devant être déterminée est la combinaison trigger e20-offline medium. L’échantillon d’événements Z → ee est sélectionné de la manière suivante : • le trigger e20 doit être passé ; • le cluster EM ayant déclenché le trigger doit satisfaire le critère d’identification offline tight (électron tag) ; • un second cluster EM doit être présent (électron probe) ; • les deux clusters EM doivent satisfaire les conditions : ET > 15 GeV et | η |< 1.37 ou 1.52 <| η |< 2.4 ; • les deux candidats doivent avoir des charges opposées et leur masse invariante doit être dans la gamme de masse 70 < Mee < 110 GeV. L’efficacité est alors simplement égale au rapport du nombre d’événements dans lesquels l’électron probe satisfait le critère testé sur le nombre d’événements sélectionnés. Cette méthode peut être appliquée de manière itérative pour déterminer l’efficacité de chaque coupure. Une vue transverse schématique d’un événement Z → ee, mettant en évidence les électrons tag et probe, est représentée sur la Figure 6.1. Les performances de la méthode peuvent être testées en comparant les résultats obtenus avec la valeur de l’efficacité calculée à partir de la vérité Monte-Carlo : l’accord obtenu pour l’efficacité combinée est représenté sur la Figure 6.2. A l’intérieur des fluctuations statistiques, aucun biais n’est observé. L’incertitude sur l’efficacité est dominée par l’incertitude statistique due au nombre d’événements sélectionnés ; les deux autres principales sources d’incertitude sont dues au choix des critères de sélection et à la présence du bruit de fond QCD. Pour 50 pb−1 , une incertitude relative de 2% peut être atteinte [25].

 Transfert vers les événements W → eν

L’efficacité globale de reconstruction de l’électron déterminée à partir des événements Z → ee ne peut être appliquée aux événements W → eν sans correction que si sa valeur est identique dans les deux types d’événement. Dans les données utilisées, les objets trigger (p. ex. l’électron au niveau EF) n’étaient pas accessibles ; seules les signatures trigger (p. ex. e20) étaient disponibles. Le transfert de l’efficacité vers les événements W → eν n’a donc pu être étudié que pour la reconstruction offline. Un comportement similaire est cependant attendu pour l’efficacité combinée. D’un point de vue topologique, les électrons issus de la désintégration des bosons W et Z sont similaires : l’activité hadronique est très faible autour de l’électron. Mais les distributions cinématiques sont différentes : les distributions de l’énergie transverse et de la pseudo-rapidité de l’électron dans les deux cas sont représentées sur les Figures 6.3 et 6.4 (80.000 électrons sont utilisés dans chaque cas). Le spectre en ET est plus dur pour le Z à cause de la masse plus élevée du boson. La Table 6.1 donne la répartition des électrons entre le tonneau et les bouchons : les électrons issus de la désintégration du boson W sont légèrement plus centraux. La Table 6.2 donne l’efficacité dans le tonneau, dans les bouchons et globale (les distributions de l’efficacité en fonction de l’énergie transverse et de la pseudo-rapidité sont représentées sur les Figures 6.5 et 6.6). Comme attendu, l’écart le plus significatif (0.010 ± 0.002) est obtenu pour l’efficacité globale, qui est fonction de la répartition des candidats. En appliquant l’efficacité globale déterminée sur les événements Z → ee aux événements W → eν, le nombre de candidats obtenu est : NW = εZ→ee ·N0 = 58231 où N0 est le nombre initial de candidats. En séparant les efficacités pour le tonneau et les bouchons (ε B Z→ee et ε EC Z→ee), le nombre de candidats obtenu est : N corr W = ε B Z→ee ·N B 0 +ε B Z→ee ·N B 0 = 58898 Or le nombre de candidats attendu d’après la simulation est 59148 : l’introduction des efficacités du tonneau et des bouchons par rapport à l’utilisation de l’efficacité globale permet de réduire le biais sur NW de −1.5% à −0.7%. Lorsque la statistique accumulée augmentera, il sera possible d’effectuer une carte de l’efficacité en bins (η −ET) du candidat électron de plus en plus fins, ce qui permettra de réduire le biais dû au transfert des événements W → eν vers les événements Z → ee. Avec 50 pb−1 de données, l’efficacité combinée de reconstruction de l’électron pourra être déterminée avec une précision ∆ε/ε ∼ 2% : cela correspond à une incertitude absolue de 0.014, supérieure à l’écart entre les efficacités de reconstruction offline dans les événements W → eν et Z → ee, calculé à partir de la simulation. Il n’est donc pas envisageable d’appliquer une correction estimée à partir de la simulation avec cette statistique. Une fois atteint un excellent accord données-simulation et une précision de l’ordre de 1% sur l’efficacité, il sera possible d’appliquer une correction globale estimée à partir de la simulation. Dans la suite, une incertitude relative de 2% est supposée sur la valeur de l’efficacité combinée.

Estimation du bruit de fond QCD à partir des données

L’incertitude sur la production inclusive de jets au LHC est telle que le nombre d’évènements QCD dans la région du signal doit être estimé à partir des données : deux méthodes ont été développées et sont présentées dans ce chapitre. Le cas des bruits de fond électrofaibles est ensuite décrit. 7.1 Méthode de la matrice Afin d’estimer le nombre d’événements de bruit de fond QCD dans la région du signal, la méthode dite de la matrice a été testée. Elle utilise la non-corrélation entre deux variables permettant de séparer le signal du bruit de fond : cette méthode a été testée en utilisant une variable d’identification de l’électron et l’énergie transverse manquante. Un critère global sur la qualité de la gerbe dans le compartiment avant de l’EMC est utilisé : le critère global est satisfait par le candidat électron si toutes les coupures associées aux variables du compartiment avant définies dans la section 5.2 sont satisfaites. Le candidat est noté ID s’il satisfait le critère global (le candidat satisfait alors le critère medium) et inverse-ID sinon (le candidat doit quand même satisfaire les autres critères d’identification). Les événements sont d’abord présélectionnés par la signature trigger e20. La non-corrélation des deux variables a été étudiée en comparant les distributions de E/T pour les deux échantillons définis par la qualité de la gerbe dans le compartiment avant de l’EMC. La Figure 7.1 représente les distributions de E/T entre 10 et 40 GeV pour les deux échantillons ; la Figure 7.2 représente l’écart relatif entre ces deux distributions. Les barres d’erreur correspondent aux erreurs statistiques dues au nombre d’événements simulés. Quatre régions sont définies : • région A : ID et E/T < 15 GeV ; • région B : Inverse-ID et E/T < 15 GeV ; • région C : Inverse-ID et E/T > 25 GeV ; • région D : ID et E/T > 25 GeV. Les distributions combinées (signal et bruit de fond) pour les deux échantillons sont représentées sur les Figures 7.3 et 7.4 (les régions A, B, C et D sont indiquées). La région D est la région du signal (l’événement satisfait alors la sélection complète, voir Sec. 5.1). En supposant les deux variables non corrélées, la contribution du bruit de fond dans la région D peut être extraite de la relation : N QCD D N QCD A = N QCD C N QCD B où N QCD X est le nombre d’événements QCD dans la région X. Cette méthode est appelée méthode de la matrice. En supposant que les régions A, B et C ne contiennent que des événements QCD, N QCD D est directement extrait. Cependant, ces régions contiennent des événements W → eν. Les nombres d’événements de signal dans ces régions sont exprimés en fonction du nombre d’événements de signal dans la région D : N W X = fX ·N W D où N W X est le nombre d’événements W → eν dans la région X. Les fractions fX sont estimées à partir de la simulation. La prise en compte des événements de signal est nécessaire pour ne pas obtenir une estimation biaisée : la contribution du signal est même dominante dans la région C (∼ 2/3, voir Fig. 7.4). La relation suivante est obtenue : N QCD D NA − fA ·N W D = NC − fC ·N W D NB − fB ·N W D où NX est le nombre total d’événements dans la région X. Cette relation est équivalente à l’équation du deuxième degré en N QCD D suivante : (fA fC− fB)·(N QCD D ) 2+(fANC+ fCNA−2 fA fCND−NB+ fBND)·N QCD D +NANC− fANCND− fCNAND+ fA fCN 2 D = 0 – 84 – 7.2 Méthode du fake rate Bande de contrôle N QCD D (×103 ) 0-10 GeV 32±13 0-15 GeV 30±14 0-20 GeV 28±12 Niveau attendu 46±13 TAB. 7.1 – Nombre d’événements QCD estimé à partir de la méthode de la matrice dans la région du signal pour L = 50 pb−1 . Les erreurs indiquées sont les erreurs binomiales dues au nombre d’événements simulés. Deux solutions N QCD D sont obtenues ; une seule solution est telle que ND > N QCD D > 0. Le choix du seuil en E/T pour la définition des régions A et B est arbitraire : l’erreur systématique associée à ce choix a été estimée en changeant successivement le seuil sur E/T à 10 et 20 GeV. Les résultats sont présentés dans la Table 7.1. En variant l’intervalle utilisé pour la bande de contrôle, le niveau estimé de bruit de fond reste stable. La précision de la méthode est limitée par les différences de distribution de E/T entre les échantillons de signal et de contrôle pour les événements de bruit de fond. Avec cette méthode, le niveau de bruit de fond est sous-estimé. La sousestimation est due à la corrélation entre l’identification de l’électron et le calcul de E/T : le calcul de E/T prend en compte l’identification de l’électron et le biais observé est donc intrinsèque à la méthode. La corrélation entre les deux variables est étudiée dans la section suivante, via le développement d’une seconde méthode.

Bruits de fond électrofaibles

La Table 5.3 donne le niveau des bruits de fond électrofaibles après sélection complète. Il est nécessaire de traiter les bruits de fond électrofaibles d’une manière compatible avec la soustraction du bruit de fond QCD à partir des données. Dans la méthode de la matrice, les bruits de fond électrofaibles peuvent être pris en compte d’une manière identique au cas du signal. Dans chaque région (A, B, C et D), le nombre d’événements attendu pour un canal est exprimé en fonction du nombre d’événements de signal dans la région D ; les fractions sont estimées à partir de la simulation. Dans la méthode du fake rate, les contributions des bruits de fond électrofaibles calculées à partir de la simulation peuvent être utilisées directement après la soustraction du bruit de fond QCD pour obtenir le nombre réel d’événements W → eν : cela suppose uniquement que l’efficacité de reconstruction de la trace d’un électron est identique dans les événements W → eν, Z → ee et W → τν. 

Incertitude théorique sur l’acceptance

L’acceptance est définie comme la fraction de l’espace de phase couvert par les sélections géométriques et cinématiques appliquées aux événements : elle ne peut être déterminée qu’à partir de la simulation. Dans ce chapitre, les principales sources théoriques d’incertitude sur la détermination de l’acceptance sont successivement étudiées : les corrections QCD, les corrections électrofaibles et les fonctions de distribution de parton. Les effets de reconstruction du détecteur sont également abordés. 8.1 Définition de l’acceptance L’acceptance (A) représente la probabilité que pour un événement de signal donné, les leptons issus de la désintégration du boson W satisfassent les coupures géométriques et cinématiques imposées dans la sélection des événements. Elle intervient dans la mesure de la section efficace totale : σ = N −B A ε L Les coupures sont appliquées sur les grandeurs reconstruites et ce sont donc ces grandeurs qui doivent être utilisées pour une détermination non biaisée de l’acceptance. Les effets de reconstruction du détecteur changent l’espace de phase du signal : l’espace de phase couvert par la sélection définie à partir des variables reconstruites est différent de celui couvert par la sélection définie à partir de l’électron et du neutrino produits. Cependant, pour l’étude de l’incertitude théorique, la précision recherchée requiert des échantillons de plusieurs centaines de milliers d’événements pour chaque configuration étudiée d’un générateur. Une simulation complète n’était donc pas possible à cause du temps de calcul1) . Dans la suite, les grandeurs calculées au niveau générateur (par opposition au niveau détecteur) seront utilisées. En particulier, l’approximation E/T = p ν T sera utilisée. L’impact des effets observés au niveau générateur sur les grandeurs reconstruites sera seulement discuté dans la section 8.6. Dans tout le chapitre, les valeurs d’acceptance au niveau générateur seront calculées pour la sélection suivante : • p e T > 25 GeV, | η e |< 1.37 ou 1.52 <| η e |< 2.4 • p ν T > 25 GeV. Dans une collision proton-proton, à un ordre donné en théorie des perturbations et pour un ensemble donné de PDFs, la prédiction d’observables correspondant à l’état final d’un processus dépend fortement de la modélisation de la gerbe partonique, de l’événement sous-jacent et de l’hadronisation : ces effets sont dits non perturbatifs. Dans un générateur, de nombreux paramètres contrôlent ces différentes étapes ; ils nécessitent d’être optimisés à partir des données. L’incertitude sur l’acceptance due aux effets non perturbatifs n’a pas été étudiée dans cette thèse. Cependant, afin d’obtenir une valeur finale d’incertitude, les résultats de la référence [25] sont utilisés. Une étude comparative des générateurs PYHTIA et HERWIG a permis d’identifier les 1)La simulation complète d’un événement nécessite environ 15 minutes pour un seul processeur. 89 Chapitre 8 – Incertitude théorique sur l’acceptance principales sources d’incertitude sur l’acceptance : le rayonnement d’état initial des partons (ISR, pour Initial State Radiation), l’impulsion transverse intrinsèque des partons initiaux (kT) et l’événement sous-jacent (UE, pour Underlying Event). Les incertitudes estimées sont : 2% (ISR), 0.4% (kT) et 0.2% (UE). En supposant ces effets non-corrélés, une incertitude globale de 2% est obtenue ; dans la suite, cette valeur sera utilisée pour l’incertitude dûe à la modélisation des événements non perturbatifs. Les autres sources théoriques d’incertitude sur l’acceptance sont : • les corrections d’ordre supérieur en QCD • les corrections d’ordre supérieur en théorie électrofaible • le choix des PDFs. Ces différents effets sont successsivement étudiés dans la suite du chapitre. 8.2 Les générateurs d’événements utilisés Quatre générateurs d’événements et un programme complémentaire ont été utilisés dans cette étude. • Deux générateurs Monte-Carlo à l’ordre dominant (LO, pour Leading-Order) en QCD : PYTHIA [66] (version 6.417) et HERWIG [72] (version 6.510), interfacé avec JIMMY [73] pour la modélisation de l’événement sous-jacent. Leur comparaison permet d’estimer de manière globale l’incertitude liée à la modélisation des effets non perturbatifs. • Un générateur Monte-Carlo à l’ordre NLO en QCD : MC@NLO [51] (version 3.31), interfacé avec HERWIG et JIMMY. La comparaison avec HERWIG permet d’étudier l’impact des corrections NLO QCD. • Un générateur Monte-Carlo incluant des corrections électrofaibles O(α) (premier ordre supérieur en théorie électrofaible) dans les processus de production hadronique du boson W : WINHAC [74] (version 1.21). • Le programme PHOTOS [75] (version 2.15), qui modélise le rayonnement de photons des fermions chargés ; il s’ajoute à un générateur hôte. La comparaison avec WINHAC permet d’estimer l’incertitude sur l’acceptance due à l’utilisation de PHOTOS pour modéliser les corrections électrofaibles sur un générateur hôte. PHOTOS a été utilisé pour la production des données simulées analysées dans cette thèse. Aucun générateur, actuellement, n’inclut à la fois des corrections NLO QCD et électrofaibles ; plusieurs générateurs sont donc nécessaires pour effectuer une analyse complète. Pour chaque configuration étudiée d’un générateur, 250.000 événements ont été générés. L’étude a été effectuée dans Athena (version 14.5.2). Les paramètres d’entrée du Modèle Standard communs à tous les générateurs utilisés sont donnés dans la Table 8.1. L’ensemble de PDFs CTEQ6L a été utilisé pour PYTHIA, HERWIG et WINHAC ; l’ensemble de PDFs CTEQ6M a été utilisé pour MC@NLO. 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *