@phdthesis{Du2024, author = {Du, Keli}, title = {Zum Verst{\"a}ndnis des LDA Topic Modeling: eine Evaluation aus Sicht der Digital Humanities}, doi = {10.25972/OPUS-34826}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-348261}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2024}, abstract = {Als quantitative Textanalysemethode ist das LDA Topic Modeling in den letzten Jahren in den Digital Humanities weit verbreitet worden, um zahlreiche unstrukturierte Textdaten zu untersuchen. Wenn man LDA Topic Modeling anwendet, muss man mit vielen Faktoren umgehen, die das Ergebnis der Modellierung beeinflussen k{\"o}nnen. In dieser Dissertation wurde das LDA Topic Modeling, genauer gesagt sechs entscheidende Faktoren, durch Experimente evaluiert, n{\"a}mlich die Anzahl der Topics, der Hyperparameter Alpha, die Hyperparameter-Optimierung, der Hyperparameter Beta, die Iteration des Gibbs-Samplings und das Chunk-Length. Der Einfluss der sechs Faktoren wurde anhand eines deutschen Zeitungskorpus und eines deutschen Romankorpus aus zwei Perspektiven, der Dokumentklassifikation und der Topic-Koh{\"a}renz, untersucht. Ziel ist es, die Frage zu beantworten, unter welchen Umst{\"a}nden das LDA Topic Modeling stabil ist und damit einen Einblick in die Sensitivit{\"a}t der Methode gegen{\"u}ber Parametereinstellungen zu geben.}, subject = {Digital Humanities}, language = {de} }