Das Suchergebnis hat sich seit Ihrer Suchanfrage verändert. Eventuell werden Dokumente in anderer Reihenfolge angezeigt.
  • Treffer 2 von 6100
Zurück zur Trefferliste

Zum Verständnis des LDA Topic Modeling: eine Evaluation aus Sicht der Digital Humanities

Understanding LDA Topic Modeling: an evaluation from the perspective of Digital Humanities

Zitieren Sie bitte immer diese URN: urn:nbn:de:bvb:20-opus-348261
  • Als quantitative Textanalysemethode ist das LDA Topic Modeling in den letzten Jahren in den Digital Humanities weit verbreitet worden, um zahlreiche unstrukturierte Textdaten zu untersuchen. Wenn man LDA Topic Modeling anwendet, muss man mit vielen Faktoren umgehen, die das Ergebnis der Modellierung beeinflussen können. In dieser Dissertation wurde das LDA Topic Modeling, genauer gesagt sechs entscheidende Faktoren, durch Experimente evaluiert, nämlich die Anzahl der Topics, der Hyperparameter Alpha, die Hyperparameter-Optimierung, derAls quantitative Textanalysemethode ist das LDA Topic Modeling in den letzten Jahren in den Digital Humanities weit verbreitet worden, um zahlreiche unstrukturierte Textdaten zu untersuchen. Wenn man LDA Topic Modeling anwendet, muss man mit vielen Faktoren umgehen, die das Ergebnis der Modellierung beeinflussen können. In dieser Dissertation wurde das LDA Topic Modeling, genauer gesagt sechs entscheidende Faktoren, durch Experimente evaluiert, nämlich die Anzahl der Topics, der Hyperparameter Alpha, die Hyperparameter-Optimierung, der Hyperparameter Beta, die Iteration des Gibbs-Samplings und das Chunk-Length. Der Einfluss der sechs Faktoren wurde anhand eines deutschen Zeitungskorpus und eines deutschen Romankorpus aus zwei Perspektiven, der Dokumentklassifikation und der Topic-Kohärenz, untersucht. Ziel ist es, die Frage zu beantworten, unter welchen Umständen das LDA Topic Modeling stabil ist und damit einen Einblick in die Sensitivität der Methode gegenüber Parametereinstellungen zu geben.zeige mehrzeige weniger
  • As a quantitative text analysis method, LDA topic modeling has been widely used in the digital humanities in recent years to examine large amounts of unstructured text data. When using LDA topic modeling, one must deal with many factors that can influence the result of the modeling. In this dissertation, LDA topic modeling, more specifically six crucial factors, were evaluated through experiments, namely the number of topics, the hyperparameter alpha, the hyperparameter optimization, the hyperparameter beta, the iteration of Gibbs sampling andAs a quantitative text analysis method, LDA topic modeling has been widely used in the digital humanities in recent years to examine large amounts of unstructured text data. When using LDA topic modeling, one must deal with many factors that can influence the result of the modeling. In this dissertation, LDA topic modeling, more specifically six crucial factors, were evaluated through experiments, namely the number of topics, the hyperparameter alpha, the hyperparameter optimization, the hyperparameter beta, the iteration of Gibbs sampling and the chunk length. The influence of the six factors was investigated using a German newspaper corpus and a German novel corpus from two perspectives, document classification and topic coherence. The aim is to answer the question under which circumstances LDA topic modeling is stable and thus to provide an insight into the sensitivity of the method to parameter settings.zeige mehrzeige weniger

Volltext Dateien herunterladen

Metadaten exportieren

Metadaten
Autor(en): Keli DuORCiD
URN:urn:nbn:de:bvb:20-opus-348261
Dokumentart:Dissertation
Titelverleihende Fakultät:Universität Würzburg, Philosophische Fakultät (Histor., philolog., Kultur- und geograph. Wissensch.)
Institute der Universität:Philosophische Fakultät (Histor., philolog., Kultur- und geograph. Wissensch.) / Institut für deutsche Philologie
Gutachter / Betreuer:Prof. Dr. Fotis Jannidis, Prof. Dr. Christof Schöch
Datum der Abschlussprüfung:27.03.2024
Sprache der Veröffentlichung:Deutsch
Erscheinungsjahr:2024
DOI:https://doi.org/10.25972/OPUS-34826
Allgemeine fachliche Zuordnung (DDC-Klassifikation):8 Literatur / 80 Literatur, Rhetorik, Literaturwissenschaft / 800 Literatur und Rhetorik
Normierte Schlagworte (GND):Digital HumanitiesGND
Freie Schlagwort(e):Evaluation; Latent Dirichlet Allocation; Topic Modeling
Datum der Freischaltung:21.05.2024
Lizenz (Deutsch):License LogoCC BY: Creative-Commons-Lizenz: Namensnennung 4.0 International