New Machine Learning Approach for Pulse Shape Analysis in LEGEND with Feature Importance Supervision

DSpace Repositorium (Manakin basiert)


Dateien:

Zitierfähiger Link (URI): http://hdl.handle.net/10900/168317
http://nbn-resolving.org/urn:nbn:de:bsz:21-dspace-1683174
http://dx.doi.org/10.15496/publikation-109644
Dokumentart: Dissertation
Erscheinungsdatum: 2025-07-22
Sprache: Englisch
Fakultät: 7 Mathematisch-Naturwissenschaftliche Fakultät
Fachbereich: Physik
Gutachter: Jochum, Josef (Prof. Dr.)
Tag der mündl. Prüfung: 2025-07-09
DDC-Klassifikation: 530 - Physik
Schlagworte: Maschinelles Lernen , Neutrino
Freie Schlagwörter:
Neutrinoless Double Beta Decay
Low Background Experiment
Lizenz: http://tobias-lib.uni-tuebingen.de/doku/lic_ohne_pod.php?la=de http://tobias-lib.uni-tuebingen.de/doku/lic_ohne_pod.php?la=en
Zur Langanzeige

Inhaltszusammenfassung:

Das Large Enriched Germanium Experiment for Neutrinoless double beta Decay (LEGEND) sucht nach dem neutrinolosen doppelten Betazerfall (0νββ Zerfall), einem Prozess, der wesentliche Erkenntnisse über die Entstehung des Universums und die Natur der Neutrinos liefern würde. Da es sich bei 0νββ Zerfall um einen extrem seltenen Zerfall handelt, ist eine hohe Sensitivität für LEGEND entscheidend. Um die Sensitivität zu verbessern und neue Möglichkeiten der Datenanalyse zu eröffnen, wird in dieser Arbeit die Verwendung eines neuen Ansatzes des maschinellen Lernens namens Feature Importance Supervision (FIS) für die Pulsformanalyse (PSA) untersucht. FIS basiert auf der Idee, physikalisches Wissen direkt in das Modell des maschinellen Lernens einzubeziehen. Die Verwendung dieser Methode bietet mehrere neue Möglichkeiten, darunter eine größere Freiheit bei der Auswahl der Trainingsdaten und die Einbeziehung verschiedener Korrekturen und Schnittparameter aus der klassischen PSA in LEGEND. Es wird erfolgreich demonstriert, dass eine energieunabhängige PSA mit FIS möglich ist, selbst wenn der Trainingsdatensatz Ereignisse mit unterschiedlichen Energien enthält. Dies bietet mehr Flexibilität bei der Auswahl des Trainingsdatensatzes. Zusätzlich werden drei verschiedene Versionen von FIS untersucht, die jeweils eine unterschiedliche Menge an Informationen enthalten. Zwischen diesen Versionen werden physikalisch bedeutsame Unterschiede in den Modellergebnissen beobachtet, die alle mit dem gegebenen Wissen korrelieren. Zum gegenwärtigen Zeitpunkt ist die Ausgabe des FIS-Modells mit großen Unsicherheiten behaftet, die vermutlich auf Unreinheiten im Trainingsdatensatz zurückzuführen sind. Die genaue Zusammensetzung der Trainingsdaten wird untersucht und kann durch Verwendung und Kombination verschiedener Parameter aus der klassischen Datenanalyse in mehrere Ereignisklassen eingeteilt werden. Diese Untersuchung kann in einer Fortsetzung der Arbeit genutzt werden, um diese Unsicherheiten zu minimieren.

Abstract:

The Large Enriched Germanium Experiment for Neutrinoless ββ Decay (LEGEND) searches for neutrinoless double beta decay (0νββ decay), a process that would provide essential insights into the formation of the universe and the nature of neutrinos. Since the 0νββ decay would be an extremely rare decay, high sensitivity is crucial for LEGEND. To improve this sensitivity and open up new possibilities in terms of data analysis, this work investigates the use of a new Machine Learning approach called Feature Importance Supervision (FIS) for Pulse Shape Analysis (PSA). FIS builds on the idea of incorporating physical knowledge directly into the Machine Learning model. Using this method can offer several new possibilities, including a higher degree of freedom in the choice of training data and the incorporation of different corrections and cut parameters from the classical PSA in LEGEND. It is successfully demonstrated that an energy-independent PSA is possible using FIS, even when the training dataset contains events at different energies. This provides more flexibility in the selection of the training dataset. Additionally, three different versions of FIS are investigated, each incorporating a variable quantity of information. Between these versions, physically meaningful differences in the model outputs are observed, all correlated with the given knowledge. At the current stage, the output of the FIS model carries large uncertainties, which are presumed to arise from impurities in the training dataset. The exact composition of the training data is investigated and can be categorised into several event classes by using and combining different parameters from classical data analysis. This investigation can be used in a continuation of the work to minimise these uncertainties.

Das Dokument erscheint in: