TY  - THES
A1  - Kobs, Konstantin
T1  - Think outside the Black Box: Model-Agnostic Deep Learning with Domain Knowledge
T1  - Think outside the Black Box: Modellagnostisches Deep Learning mit Domänenwissen
N2  - Deep Learning (DL) models are trained on a downstream task by feeding (potentially preprocessed) input data through a trainable Neural Network (NN) and updating its parameters to minimize the loss function between the predicted and the desired output. While this general framework has mainly remained unchanged over the years, the architectures of the trainable models have greatly evolved. Even though it is undoubtedly important to choose the right architecture, we argue that it is also beneficial to develop methods that address other components of the training process. We hypothesize that utilizing domain knowledge can be helpful to improve DL models in terms of performance and/or efficiency. Such model-agnostic methods can be applied to any existing or future architecture. Furthermore, the black box nature of DL models motivates the development of techniques to understand their inner workings. Considering the rapid advancement of DL architectures, it is again crucial to develop model-agnostic methods.
In this thesis, we explore six principles that incorporate domain knowledge to understand or improve models. They are applied either on the input or output side of the trainable model. Each principle is applied to at least two DL tasks, leading to task-specific implementations. To understand DL models, we propose to use Generated Input Data coming from a controllable generation process requiring knowledge about the data properties. This way, we can understand the model’s behavior by analyzing how it changes when one specific high-level input feature changes in the generated data. On the output side, Gradient-Based Attribution methods create a gradient at the end of the NN and then propagate it back to the input, indicating which low-level input features have a large influence on the model’s prediction. The resulting input features can be interpreted by humans using domain knowledge.
To improve the trainable model in terms of downstream performance, data and compute efficiency, or robustness to unwanted features, we explore principles that each address one of the training components besides the trainable model. Input Masking and Augmentation directly modifies the training input data, integrating knowledge about the data and its impact on the model’s output. We also explore the use of Feature Extraction using Pretrained Multimodal Models which can be seen as a beneficial preprocessing step to extract useful features. When no training data is available for the downstream task, using such features and domain knowledge expressed in other modalities can result in a Zero-Shot Learning (ZSL) setting, completely eliminating the trainable model. The Weak Label Generation principle produces new desired outputs using knowledge about the labels, giving either a good pretraining or even exclusive training dataset to solve the downstream task. Finally, improving and choosing the right Loss Function is another principle we explore in this thesis. Here, we enrich existing loss functions with knowledge about label interactions or utilize and combine multiple task-specific loss functions in a multitask setting.
We apply the principles to classification, regression, and representation tasks as well as to image and text modalities. We propose, apply, and evaluate existing and novel methods to understand and improve the model. Overall, this thesis introduces and evaluates methods that complement the development and choice of DL model architectures.
N2  - Deep-Learning-Modelle (DL-Modelle) werden trainiert, indem potenziell vorverarbeitete Eingangsdaten durch ein trainierbares Neuronales Netz (NN) geleitet und dessen Parameter aktualisiert werden, um die Verlustfunktion zwischen der Vorhersage und der gewünschten Ausgabe zu minimieren. Während sich dieser allgemeine Ablauf kaum geändert hat, haben sich die verwendeten NN-Architekturen erheblich weiterentwickelt. Auch wenn die Wahl der Architektur für die Aufgabe zweifellos wichtig ist, schlagen wir in dieser Arbeit vor, Methoden für andere Komponenten des Trainingsprozesses zu entwickeln. Wir vermuten, dass die Verwendung von Domänenwissen hilfreich bei der Verbesserung von DL-Modellen bezüglich ihrer Leistung und/oder Effizienz sein kann. Solche modellagnostischen Methoden sind dann bei jeder bestehenden oder zukünftigen NN-Architektur anwendbar. Die Black-Box-Natur von DL-Modellen motiviert zudem die Entwicklung von Methoden, die zum Verständnis der Funktionsweise dieser Modelle beitragen. Angesichts der schnellen Architektur-Entwicklung ist es wichtig, modellagnostische Methoden zu entwickeln.
In dieser Arbeit untersuchen wir sechs Prinzipien, die Domänenwissen verwenden, um Modelle zu verstehen oder zu verbessern. Sie werden auf Trainingskomponenten im Eingang oder Ausgang des Modells angewendet. Jedes Prinzip wird dann auf mindestens zwei DL-Aufgaben angewandt, was zu aufgabenspezifischen Implementierungen führt. Um DL-Modelle zu verstehen, verwenden wir kontrolliert generierte Eingangsdaten, was Wissen über die Dateneigenschaften benötigt. So können wir das Verhalten des Modells verstehen, indem wir die Ausgabeänderung bei der Änderung von abstrahierten Eingabefeatures beobachten. Wir untersuchen zudem gradienten-basierte Attribution-Methoden, die am Ausgang des NN einen Gradienten anlegen und zur Eingabe zurückführen. Eingabefeatures mit großem Einfluss auf die Modellvorhersage können so identifiziert und von Menschen mit Domänenwissen interpretiert werden.
Um Modelle zu verbessern (in Bezug auf die Ergebnisgüte, Daten- und Recheneffizienz oder Robustheit gegenüber ungewollten Eingaben), untersuchen wir Prinzipien, die jeweils eine Trainingskomponente neben dem trainierbaren Modell betreffen. Das Maskieren und Augmentieren von Eingangsdaten modifiziert direkt die Trainingsdaten und integriert dabei Wissen über ihren Einfluss auf die Modellausgabe. Die Verwendung von vortrainierten multimodalen Modellen zur Featureextraktion kann als ein Vorverarbeitungsschritt angesehen werden. Bei fehlenden Trainingsdaten können die Features und Domänenwissen in anderen Modalitäten als Zero-Shot Setting das trainierbare Modell gänzlich eliminieren. Das Weak-Label-Generierungs-Prinzip erzeugt neue gewünschte Ausgaben anhand von Wissen über die Labels, was zu einem Pretrainings- oder exklusiven Trainigsdatensatz führt. Schließlich ist die Verbesserung und Auswahl der Verlustfunktion ein weiteres untersuchtes Prinzip. Hier reichern wir bestehende Verlustfunktionen mit Wissen über Label-Interaktionen an oder kombinieren mehrere aufgabenspezifische Verlustfunktionen als Multi-Task-Ansatz.
Wir wenden die Prinzipien auf Klassifikations-, Regressions- und Repräsentationsaufgaben sowie Bild- und Textmodalitäten an. Wir stellen bestehende und neue Methoden vor, wenden sie an und evaluieren sie für das Verstehen und Verbessern von DL-Modellen, was die Entwicklung und Auswahl von DL-Modellarchitekturen ergänzt.
KW  - Deep learning
KW  - Neuronales Netz
KW  - Maschinelles Lernen
KW  - Machine Learning
KW  - Model-Agnostic
KW  - Domain Knowledge
Y1  - 2024
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-349689
ER  - 
TY  - THES
A1  - Allgaier, Johannes
T1  - Machine Learning Explainability on Multi-Modal Data using Ecological Momentary Assessments in the Medical Domain
T1  - Erklärbarkeit von maschinellem Lernen unter Verwendung multi-modaler Daten und Ecological Momentary Assessments im medizinischen Sektor
N2  - Introduction. 
Mobile health (mHealth) integrates mobile devices into healthcare, enabling remote monitoring, data collection, and personalized interventions. Machine Learning (ML), a subfield of Artificial Intelligence (AI), can use mHealth data to confirm or extend domain knowledge by finding associations within the data, i.e., with the goal of improving healthcare decisions. In this work, two data collection techniques were used for mHealth data fed into ML systems: Mobile Crowdsensing (MCS), which is a collaborative data gathering approach, and Ecological Momentary Assessments (EMA), which capture real-time individual experiences within the individual’s common environments using questionnaires and sensors. We collected EMA and MCS data on tinnitus and COVID-19. About 15 % of the world’s population suffers from tinnitus. 

Materials & Methods. 
This thesis investigates the challenges of ML systems when using MCS and EMA data. It asks: How can ML confirm or broad domain knowledge? Domain knowledge refers to expertise and understanding in a specific field, gained through experience and education. Are ML systems always superior to simple heuristics and if yes, how can one reach explainable AI (XAI) in the presence of mHealth data? An XAI method enables a human to understand why a model makes certain predictions. Finally, which guidelines can be beneficial for the use of ML within the mHealth domain? In tinnitus research, ML discerns gender, temperature, and season-related variations among patients. In the realm of COVID-19, we collaboratively designed a COVID-19 check app for public education, incorporating EMA data to offer informative feedback on COVID-19-related matters. This thesis uses seven EMA datasets with more than 250,000 assessments. Our analyses revealed a set of challenges: App user over-representation, time gaps, identity ambiguity, and operating system specific rounding errors, among others. Our systematic review of 450 medical studies assessed prior utilization of XAI methods. 

Results. 
ML models predict gender and tinnitus perception, validating gender-linked tinnitus disparities. Using season and temperature to predict tinnitus shows the association of these variables with tinnitus. Multiple assessments of one app user can constitute a group. Neglecting these groups in data sets leads to model overfitting. In select instances, heuristics outperform ML models, highlighting the need for domain expert consultation to unveil hidden groups or find simple heuristics. 

Conclusion. 
This thesis suggests guidelines for mHealth related data analyses and improves estimates for ML performance. Close communication with medical domain experts to identify latent user subsets and incremental benefits of ML is essential.
N2  - Einleitung. 
Unter Mobile Health (mHealth) versteht man die Nutzung mobiler Geräte
wie Handys zur Unterstützung der Gesundheitsversorgung. So können Ärzt:innen z. B.
Gesundheitsinformationen sammeln, die Gesundheit aus der Ferne überwachen, sowie
personalisierte Behandlungen anbieten. Man kann maschinelles Lernen (ML) als System
nutzen, um aus diesen Gesundheitsinformationen zu lernen. Das ML-System versucht,
Muster in den mHealth Daten zu finden, um Ärzt:innen zu helfen, bessere Entschei-
dungen zu treffen. Zur Datensammlung wurden zwei Methoden verwendet: Einerseits
trugen zahlreiche Personen zur Sammlung von umfassenden Informationen mit mo-
bilen Geräten bei (sog. Mobile Crowdsensing), zum anderen wurde den Mitwirkenden
digitale Fragebögen gesendet und Sensoren wie GPS eingesetzt, um Informationen in
einer alltäglichen Umgebung zu erfassen (sog. Ecologcial Momentary Assessments). Diese
Arbeit verwendet Daten aus zwei medizinischen Bereichen: Tinnitus und COVID-19.
Schätzungen zufolge leidet etwa 15 % der Menschheit an Tinnitus.

Materialien & Methoden. 
Die Arbeit untersucht, wie ML-Systeme mit mHealth Daten
umgehen: Wie können diese Systeme robuster werden oder neue Dinge lernen? Funktion-
ieren die neuen ML-Systeme immer besser als einfache Daumenregeln, und wenn ja, wie
können wir sie dazu bringen, zu erklären, warum sie bestimmte Entscheidungen treffen?
Welche speziellen Regeln sollte man außerdem befolgen, wenn man ML-Systeme mit
mHealth Daten trainiert? Während der COVID-19-Pandemie entwickelten wir eine App,
die den Menschen helfen sollte, sich über das Virus zu informieren. Diese App nutzte
Daten der Krankheitssymptome der App Nutzer:innen, um Handlungsempfehlungen
für das weitere Vorgehen zu geben.

Ergebnisse. 
ML-Systeme wurden trainiert, um Tinnitus vorherzusagen und wie er mit
geschlechtsspezifischen Unterschieden zusammenhängen könnte. Die Verwendung von
Faktoren wie Jahreszeit und Temperatur kann helfen, Tinnitus und seine Beziehung zu
diesen Faktoren zu verstehen. Wenn wir beim Training nicht berücksichtigen, dass ein
App User mehrere Datensätze ausfüllen kann, führt dies zu einer Überanpassung und
damit Verschlechterung des ML-Systems. Interessanterweise führen manchmal einfache
Regeln zu robusteren und besseren Modellen als komplexe ML-Systeme. Das zeigt, dass
es wichtig ist, Experten auf dem Gebiet einzubeziehen, um Überanpassung zu vermeiden
oder einfache Regeln zur Vorhersage zu finden.

Fazit. 
Durch die Betrachtung verschiedener Langzeitdaten konnten wir neue Empfehlun-
gen zur Analyse von mHealth Daten und der Entwicklung von ML-Systemen ableiten.
Dabei ist es wichtig, medizinischen Experten mit einzubeziehen, um Überanpassung zu
vermeiden und ML-Systeme schrittweise zu verbessern.
KW  - Maschinelles Lernen
KW  - Explainable Artificial Intelligence
KW  - Mobile Health
KW  - Machine Learning
KW  - Explainable AI
KW  - Mobile Crowdsensing
KW  - Ecological Momentary Assessments
Y1  - 2024
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-351189
ER  -