Improving the search for new physics and the identification of electrons using machine learning at the ATLAS experiment
Thèse ou mémoire / Thesis or Dissertation
Date de publication
Autrices et auteurs
Identifiant ORCID de l’auteur
Contributrices et contributeurs
Direction de recherche
Publié dans
Date de la Conférence
Lieu de la Conférence
Éditeur
Cycle d'études
Doctorat / Doctoral
Programme
Affiliation
Mots-clés
- Particle physics
- LHC
- Identification des électrons
- Détection des anomalies
- ATLAS
- Deep learning
- Neural networks
- Electron identification
- Anomaly detection
- Physique des particules
- Apprentissage profond
- Réseaux neuronaux
Organisme subventionnaire
Résumé
Résumé
L’étude des collisions à haute énergie par l’expérience ATLAS au Grand Collisioneur d’Hadrons (LHC, de l’anglais Large Hadron Collider) est essentielle pour tester la validité du modèle standard de la physique des particules (SM, de l’anglais Standard Model of particle physics), le cadre théorique actuel qui décrit les particules fondamentales et leurs interactions, ainsi que pour établir des limites dans ses possibles extensions. Compte tenu du début de sa troisième période de prise de données et de la prochaine génération d’accélérateurs, l’expérience ATLAS est confrontée à des défis liés à la haute dimensionnalité des signaux enregistrés et à la grande quantité de données encore inexplorées.
Dans ce contexte, l’utilisation de techniques d’apprentissage profond a un grand potentiel pour améliorer la performance de la classification des objets physiques à l’origine de ces signaux, ainsi que pour fournir de nouveaux outils pour effectuer une inférence statistique rapide à partir des données. Cette thèse présente des applications des techniques d’apprentissage profond dans l’algorithme d’identification des électrons, ainsi qu’une nouvelle stratégie de recherche de résonances dans les distributions de masse invariantes avec l’expérience ATLAS.
Tout d’abord, de nouvelles mesures de l’efficacité de l’algorithme actuel d’identification des électrons sont présentés, en utilisant les données enregistrées au début du Run 3, ainsi que le retraitement des données du Run 2 avec la nouvelle version du logiciel utilisé par ATLAS. Une légère réduction des écarts entre les valeurs obtenues à partir des événements simulés et les données expérimentales est observée, une conséquence des améliorations apportées au logiciel utilisé par ATLAS avant le début du Run 3.
Ensuite, le développement d’un nouvel algorithme d’identification des électrons est présenté, où les informations brutes du détecteur sont traitées sous forme d’images via un réseau neuronal convolutif. Une étude de l’importance de ses variables d’entrée montre la pertinence de toutes les variables considérées actuellement. En outre, le rejet de la classe de bruit de fond la plus importante diminue lorsqu’un modèle entrainé avec des exemples provenant des simulations est utilisé pour rejeter des examples obtenus à partir de données expérimentales. Nous montrons que ce pouvoir de rejet est récupéré si ces exemples de données sont incorporés dans la formation.
Enfin, nous présentons une nouvelle stratégie de recherche de résonances dans des histogrammes de masse invariante. Elle utilise un réseau neuronal pour prédire de la signification statistique locale des résonances à partir des entrées dans l’histogramme. La mise en œuvre de cette méthode à l’aide de données de simulation réalistes donne de bons résultats, avec la prédiction de l’importance maximale au sein d’un histogramme ne présentant aucun biais et peu de variance. Les travaux visant à mettre en œuvre cette méthode dans le cadre de l’expérience ATLAS sont également présentés, y compris la production d’histogrammes de masse invariants à l’aide de données de simulation ATLAS.
The study of high-energy collisions by the ATLAS experiment at the Large Hadron Collider (LHC) is essential to test the validity of the Standard Model of particle physics (SM), the current theoretical framework that describes the fundamental particles and how they interact, as well as to constrain its possible extensions. In light of its third data-taking period and the next generation of accelerators, the ATLAS experiment faces challenges associated with the high-dimensionality of the recorded signals and the large amount of data still left unexplored. In this context, the use of deep learning techniques has great potential to enhance the performance of the classification of the physics objects that originate from these signals, as well as to provide new tools to perform fast statistical inference from the data. This thesis presents applications of these deep learning techniques to improve the electron identification algorithm performance, as well as a new strategy to search for resonances in invariant mass distributions with the ATLAS experiment. Firstly, new measurements of the efficiency of the current electron identification algorithm are presented, using data recorded at the beginning of Run 3, as well as the reprocessing of the Run 2 data with the new version of the ATLAS software. A small reduction on the discrepancies between the values obtained from MC simulated events and the data is observed, a consequence of the improvements made to the ATLAS software at the start of Run 3. Next, the development of a new electron identification algorithm is presented, where low-level detector information is processed in the form of images via a convolutional neural network. A study of the importance of its input features shows the relevance of all the current inputs considered. Furthermore, the rejection of the larger background class is decreased when a model trained with examples from simulated events is used to reject those obtained from experimental data. We show this rejection power is recovered if these data examples are incorporated into the training. Lastly, a novel strategy to search for resonances in invariant mass histograms is presented. It uses a neural network to predict the local statistical significance of resonances from its bin entries. The implementation of this method using realistic simulation data shows good results, with the prediction of the maximum significance within a histogram having no bias and a small variance. Work towards an implementation of this method within the ATLAS experiment is also presented, including the production of invariant mass histograms using ATLAS simulation data.
The study of high-energy collisions by the ATLAS experiment at the Large Hadron Collider (LHC) is essential to test the validity of the Standard Model of particle physics (SM), the current theoretical framework that describes the fundamental particles and how they interact, as well as to constrain its possible extensions. In light of its third data-taking period and the next generation of accelerators, the ATLAS experiment faces challenges associated with the high-dimensionality of the recorded signals and the large amount of data still left unexplored. In this context, the use of deep learning techniques has great potential to enhance the performance of the classification of the physics objects that originate from these signals, as well as to provide new tools to perform fast statistical inference from the data. This thesis presents applications of these deep learning techniques to improve the electron identification algorithm performance, as well as a new strategy to search for resonances in invariant mass distributions with the ATLAS experiment. Firstly, new measurements of the efficiency of the current electron identification algorithm are presented, using data recorded at the beginning of Run 3, as well as the reprocessing of the Run 2 data with the new version of the ATLAS software. A small reduction on the discrepancies between the values obtained from MC simulated events and the data is observed, a consequence of the improvements made to the ATLAS software at the start of Run 3. Next, the development of a new electron identification algorithm is presented, where low-level detector information is processed in the form of images via a convolutional neural network. A study of the importance of its input features shows the relevance of all the current inputs considered. Furthermore, the rejection of the larger background class is decreased when a model trained with examples from simulated events is used to reject those obtained from experimental data. We show this rejection power is recovered if these data examples are incorporated into the training. Lastly, a novel strategy to search for resonances in invariant mass histograms is presented. It uses a neural network to predict the local statistical significance of resonances from its bin entries. The implementation of this method using realistic simulation data shows good results, with the prediction of the maximum significance within a histogram having no bias and a small variance. Work towards an implementation of this method within the ATLAS experiment is also presented, including the production of invariant mass histograms using ATLAS simulation data.
Table des matières
Notes
Notes
Autre version linguistique
Ensemble de données lié
Licence
Approbation
Évaluation
Complété par
Référencé par
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Sauf si le document est diffusé sous une licence Creative Commons, il ne peut être utilisé que dans le cadre d'une utilisation équitable et non commerciale comme le prévoit la Loi (i.e. à des fins d'étude privée ou de recherche, de critique ou de compte-rendu). Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.