Refine
Has Fulltext
- yes (6)
Is part of the Bibliography
- yes (6) (remove)
Document Type
- Complete part of issue (3)
- Doctoral Thesis (1)
- Master Thesis (1)
- Preprint (1)
Language
- German (6) (remove)
Keywords
- Literaturwissenschaft (6) (remove)
Die vorliegende Arbeit lässt sich dem Bereich der quantitativen Literaturanalyse zuordnen und verfolgt das Ziel, mittels computergestützter Verfahren zu untersuchen, inwieweit sich Romane hinsichtlich ihrer Figurenkonstellation ähneln. Dazu wird die Figurenkonstellation, als wichtiges strukturgebendes Ordnungsprinzip eines Romans, als soziales Netzwerk der Figuren operationalisiert. Solche Netzwerke können unter Anwendung von Verfahren des Natural Language Processing automatisch aus dem Text erstellt werden.
Als Datengrundlage dient ein Korpus von deutschsprachigen Romanen aus dem 19. Jahrhundert, das mit automatischen Verfahren zur Figurenerkennung und Koreferenzauflösung prozessiert und manuell nachkorrigiert wurde, um eine möglichst saubere Datenbasis zu schaffen.
Ausgehend von der intensiven vergleichenden Betrachtung der Figurenkonstellationen von Fontanes "Effi Briest" und Flauberts "Madame Bovary" wurde in einer manuell erstellten Distanzmatrix die menschliche Intuition solcher Ähnlichkeit zwischen allen Romanen des Korpus festgehalten, basierend auf der Lektüre von Zusammenfassungen der Romane. Diese Daten werden als Evaluationsgrundlage genutzt.
Mit Hilfe von Methoden der sozialen Netzwerkanalyse können strukturelle Eigenschaften dieser Netzwerke als Features erhoben werden. Diese wurden anschließend zur Berechnung der Kosinusdistanz zwischen den Romanen verwendet.
Obwohl die automatisch erstellten Netzwerke die Figurenkonstellationen der Romane im Allgemeinen gut widerspiegeln und die Netzwerkfeatures sinnvoll interpretierbar sind, war die Korrelation mit der Evaluationsgrundlage niedrig. Dies legt die Vermutung nahe, dass neben der Struktur der Figurenkonstellation auch wiederkehrende Themen und Motive die Erstellung der Evaluationsgrundlage unterbewusst beeinflusst haben.
Daher wurde Topic Modeling angewendet, um wichtige zwischenmenschliche Motive zu modellieren, die für die Figurenkonstellation von Bedeutung sein können. Die Netzwerkfeatures und die Topic-Verteilung wurden in Kombination zur Distanzberechnung herangezogen. Außerdem wurde versucht, jeder Kante des Figurennetzwerks ein Topic zuzuordnen, das diese Kante inhaltlich beschreibt. Hier zeigte sich, dass einerseits Topics, die sehr spezifisch für bestimmte Texte sind, und andererseits Topics, die über alle Texte hinweg stark vertreten sind, das Ergebnis bestimmen, sodass wiederum keine, bzw. nur eine sehr schwache Korrelation mit der Evaluationsgrundlage gefunden werden konnte.
Der Umstand, dass keine Verbindung zwischen den berechneten Distanzen und der Evaluationsgrundlage gefunden werden konnte, obwohl die einzelnen Features sinnvoll interpretierbar sind, lässt Zweifel an der Evaluationsmatrix aufkommen. Diese scheint stärker als zu Beginn angenommen unterbewusst von thematischen und motivischen Ähnlichkeiten zwischen den Romanen beeinflusst zu sein. Auch die Qualität der jeweiligen Zusammenfassung hat hier einen nicht unwesentlichen Einfluss. Daher wäre eine weniger subjektiv geprägte Möglichkeit der Auswertung von Nöten, beispielsweise durch die parallele Einschätzung mehrerer Annotatoren. Auch die weitere Verbesserung von NLP-Verfahren für literarische Texte in deutscher Sprache ist ein Desideratum für anknüpfende Forschungsansätze.
Der Einsatz von Geographischen Informationssystemen (GIS) bietet auch für die Geisteswissenschaften zahlreiche Ansätze zur Generierung von neuem Wissen. Die GIS-Software ist jedoch unterschiedlich geeignet für geisteswissenschaftliche Fragestellungen. Getestet wurden daher zwei kommerzielle und vier Open Source GIS-Programme: MapInfo, ArcGIS, Quantum GIS, gvSIG, DIVA-GIS und SAGA. MapInfo zeichnet sich besonders für GIS-Anfänger durch seine große Benutzerfreundlichkeit aus. Jedoch sind die Anschaffungskosten recht hoch. ArcGIS weist den größten Nutzungsumfang auf, wobei jedoch keine oder kaum eine „intuitive“ Nutzung möglich ist. Zudem sind die laufenden Kosten durch aufwändige Abo-Lizenzverträge besonders hoch. Quantum GIS ist eine freie Software, die benutzerfreundlich ist und auch Anfängern einen leichten Einstieg ermöglicht. Hunderte Erweiterungen machen Quantum GIS sehr leistungsstark und universal einsetzbar. gvSIG ist nicht ganz leicht zu bedienen, da zudem die Dokumentation nur fragmentarisch vorliegt. Der große Funktionsumfang macht es jedoch zu einem vollwertigen GIS, wenn auch manch ergänzende Funktion fehlt. DIVA-GIS ermöglicht einen schnellen Einstieg durch seine gute Dokumentation. Man gelangt jedoch recht bald an die Grenzen des Nutzungsumfangs durch die eingeschränkte Funktionalität. SAGA hingegen erfüllte alle hier gestellten Anforderungen, sodass es, trotz der geringeren Anzahl von Erweiterungen, zusammen mit Quantum GIS als Open Source eine echte Alternative zu kommerziellen GIS-Programmen darstellt.
Indirekte Charakterisierung trägt zu einem großen Teil zur Gesamtcharakteristik von Figuren bei, ist bisher aber dennoch vergleichsweise wenig erforscht. Diese Arbeit nähert sich dem Phänomen der indirekten Figurencharakterisierung durch eine eigene Explikation theoretisch an, nennt verschiedene Repräsentationsformen von indirekter Charakterisierung und führt die Theorie dann in Bezug auf Redewiedergabe anhand zahlreicher Beispiele aus. Der Untersuchung wird ein Korpus realistischer Erzähltexte zugrunde gelegt und darin manuell Formen der Redewiedergabe annotiert, um in einem späteren Schritt computergestützt einige Experimente mit den Annotationen durchzuführen. In ihrem Aufbau entspricht diese Arbeit dadurch einem Mixed-Methods-Design von qualitativer und quantitativer Literaturwissenschaft.
Die Zeitschrift promptus – Würzburger Beiträge zur Romanistik richtet sich an alle NachwuchswissenschaftlerInnen im Bereich der romanistischen Sprach- und Literaturwissenschaft sowie der Fachdidaktik. Das Ziel der Zeitschrift ist die Förderung der romanistischen Forschung im Allgemeinen und des wissenschaftlichen Nachwuchses der Romanistik im Besonderen. Sie versteht sich damit als Impulsgeber für junge romanistische Forschung, ohne sich dabei thematisch zu beschränken.
Die Zeitschrift promptus – Würzburger Beiträge zur Romanistik erscheint einmal jährlich und wird durch den gemeinnützigen Verein promptus e.V. herausgegeben.
Sie richtet sich an alle Nachwuchswissenschaftler im Bereich der romanistischen Sprach- und Literaturwissenschaft sowie der Fachdidaktik und bietet diesen die Möglichkeit, in einem frühen Stadium ihrer akademischen Laufbahn qualitativ hochwertige Arbeiten zu publizieren. Zudem versteht sich die Zeitschrift als Impulsgeber für junge romanistische Forschung, ohne sich dabei thematisch zu beschränken.
Die Zeitschrift promptus – Würzburger Beiträge zur Romanistik erscheint einmal jährlich und wird durch den gemeinnützigen Verein promptus e.V. herausgegeben.
Sie richtet sich an alle Nachwuchswissenschaftler im Bereich der romanistischen Sprach- und Literaturwissenschaft sowie der Fachdidaktik und bietet diesen die Möglichkeit, in einem frühen Stadium ihrer akademischen Laufbahn qualitativ hochwertige Arbeiten zu publizieren. Zudem versteht sich die Zeitschrift als Impulsgeber für junge romanistische Forschung, ohne sich dabei thematisch zu beschränken.