Refine
Has Fulltext
- yes (48)
Is part of the Bibliography
- yes (48)
Year of publication
Document Type
- Doctoral Thesis (48) (remove)
Language
- German (48) (remove)
Keywords
- Deutsch (9)
- Deutschland (3)
- Korpus <Linguistik> (3)
- Linguistik (3)
- Literatur (3)
- Sprachwissenschaft (3)
- Textanalyse (3)
- Textlinguistik (3)
- Deutsche Sprachwissenschaft (2)
- Digital Humanities (2)
Institute
- Institut für deutsche Philologie (48) (remove)
Als quantitative Textanalysemethode ist das LDA Topic Modeling in den letzten Jahren in den Digital Humanities weit verbreitet worden, um zahlreiche unstrukturierte Textdaten zu untersuchen. Wenn man LDA Topic Modeling anwendet, muss man mit vielen Faktoren umgehen, die das Ergebnis der Modellierung beeinflussen können. In dieser Dissertation wurde das LDA Topic Modeling, genauer gesagt sechs entscheidende Faktoren, durch Experimente evaluiert, nämlich die Anzahl der Topics, der Hyperparameter Alpha, die Hyperparameter-Optimierung, der Hyperparameter Beta, die Iteration des Gibbs-Samplings und das Chunk-Length. Der Einfluss der sechs Faktoren wurde anhand eines deutschen Zeitungskorpus und eines deutschen Romankorpus aus zwei Perspektiven, der Dokumentklassifikation und der Topic-Kohärenz, untersucht. Ziel ist es, die Frage zu beantworten, unter welchen Umständen das LDA Topic Modeling stabil ist und damit einen Einblick in die Sensitivität der Methode gegenüber Parametereinstellungen zu geben.