TY  - THES
A1  - Weimer, Lukas Matthias
T1  - Indirekte Figurencharakterisierung durch Formen der Redewiedergabe in realistischem Erzählen
T1  - Indirect Characterization through Forms of Speech Representation in Realistic Narration
N2  - Indirekte Charakterisierung trägt zu einem großen Teil zur Gesamtcharakteristik von Figuren bei, ist bisher aber dennoch vergleichsweise wenig erforscht. Diese Arbeit nähert sich dem Phänomen der indirekten Figurencharakterisierung durch eine eigene Explikation theoretisch an, nennt verschiedene Repräsentationsformen von indirekter Charakterisierung und führt die Theorie dann in Bezug auf Redewiedergabe anhand zahlreicher Beispiele aus. Der Untersuchung wird ein Korpus realistischer Erzähltexte zugrunde gelegt und darin manuell Formen der Redewiedergabe annotiert, um in einem späteren Schritt computergestützt einige Experimente mit den Annotationen durchzuführen. In ihrem Aufbau entspricht diese Arbeit dadurch einem Mixed-Methods-Design von qualitativer und quantitativer Literaturwissenschaft.
N2  - Indirect characterization contributes to a large extent to the overall characterization of characters, but has nevertheless been studied comparatively little so far. This thesis addresses the phenomenon of indirect characterization theoretically through an own explication, names different forms of representation of indirect characterization, and then elaborates the theory in regard to speech representation on the basis of numerous examples. The study is based on a corpus of realistic narrative texts, in which forms of speech representation are manually annotated, in order to run some computational experiments with the annotations in a later step. In its design, this work thus follows a mixed-methods design of qualitative and quantitative literary studies.
KW  - Literaturwissenschaft
KW  - Literaturtheorie
KW  - Charakterisierung
KW  - Figur
KW  - Realismus
KW  - indirekte Figurencharakterisierung
KW  - Korpusstudie
KW  - Digital Humanities
KW  - Mixed-Methods
KW  - Redewiedergabe
Y1  - 2022
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-292938
ER  - 
TY  - INPR
A1  - Volkmann, Armin
A1  - Bock, Sina
A1  - Seibt, Daniela
A1  - Kümmet, Sonja
A1  - Weiß, Michael
A1  - Dietz, Elisabeth
A1  - Huss, Patrick
A1  - Heer, Anna
A1  - El Hassan, Naitelqadi
T1  - Geisteswissenschaft und Geografische Informationssysteme (GIS): Erstellung von Kartierungen mit kommerzieller und Open Source Software im Vergleich
T1  - Digital Humanities and Geographic Information Systems (GIS): Making maps with commercial and open source software
N2  - Der Einsatz von Geographischen Informationssystemen (GIS) bietet auch für die Geisteswissenschaften zahlreiche Ansätze zur Generierung von neuem Wissen. Die GIS-Software ist jedoch unterschiedlich geeignet für geisteswissenschaftliche Fragestellungen. Getestet wurden daher zwei kommerzielle und vier Open Source GIS-Programme: MapInfo, ArcGIS, Quantum GIS, gvSIG, DIVA-GIS und SAGA. MapInfo zeichnet sich besonders für GIS-Anfänger durch seine große Benutzerfreundlichkeit aus. Jedoch sind die Anschaffungskosten recht hoch. ArcGIS weist den größten Nutzungsumfang auf, wobei jedoch keine oder kaum eine „intuitive“ Nutzung möglich ist. Zudem sind die laufenden Kosten durch aufwändige Abo-Lizenzverträge besonders hoch. Quantum GIS ist eine freie Software, die benutzerfreundlich ist und auch Anfängern einen leichten Einstieg ermöglicht. Hunderte Erweiterungen machen Quantum GIS sehr leistungsstark und universal einsetzbar. gvSIG ist nicht ganz leicht zu bedienen, da zudem die Dokumentation nur fragmentarisch vorliegt. Der große Funktionsumfang macht es jedoch zu einem vollwertigen GIS, wenn auch manch ergänzende Funktion fehlt. DIVA-GIS ermöglicht einen schnellen Einstieg durch seine gute Dokumentation. Man gelangt jedoch recht bald an die Grenzen des Nutzungsumfangs durch die eingeschränkte Funktionalität. SAGA hingegen erfüllte alle hier gestellten Anforderungen, sodass es, trotz der geringeren Anzahl von Erweiterungen, zusammen mit Quantum GIS als Open Source eine echte Alternative zu kommerziellen GIS-Programmen darstellt.
N2  - The use of Geographic Information Systems (GIS) is also in the Humanities an interesting method to analyze questions of space and time. For creating new results, we need to search reputed GIS software for our regular use. Within this article we tested two commercial and four open source GIS programs: MapInfo, ArcGIS, Quantum GIS, gvSIG, DIVA-GIS and SAGA. ArcGIS has the greatest functionality. But it is very expensive and not easy to use. MapInfo is particularly distinguished for GIS-beginners due to its large usability. However, the cost is quite high. Quantum GIS is a free software that is user friendly, and even for beginners easy to get started. gvSIG is not very easy to use and some ancillary functions are missing. DIVA-GIS provides a quick start by its good documentation. But the functionality is limited pretty soon. Many functions make SAGA to a full-fledged GIS, despite the lower number of enhancements. Hundreds extensions make Quantum GIS very powerful and versatile. Altogether for the Humanities the open source Quantum GIS represents a viable alternative to expensive commercial GIS software.
KW  - Geoinformationssystem
KW  - Literaturwissenschaft
KW  - Open Source
KW  - Digital Humanities
KW  - Geographisches Informationssystem
KW  - GIS
KW  - Digital Humanities
KW  - Geographic Information Systems
KW  - GIS
KW  - Literary Studies
KW  - Open Source Software
Y1  - 2012
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-74470
ER  - 
TY  - JOUR
A1  - Schöch, Christof
T1  - Ein digitales Textformat für die Literaturwissenschaften. Die Richtlinien der Text Encoding Initiative und ihr Nutzen für Textedition und Textanalyse
JF  - Romanische Studien
N2  - Die stetig voranschreitende Digitalisierung literarischer Texte verschiedenster Sprachen, Epochen und Gattungen stellt die Literaturwissenschaften immer wieder vor die Frage, wie sie diese Entwicklung mitgestalten und zu ihrem Vorteil nutzen können. Dabei ist digital nicht gleich digital, sondern es existiert eine Vielzahl sehr unterschiedlicher, digitaler Repräsentationsformen von Text. Nur wenige dieser Repräsentationsformen werden literaturwissenschaftlichen Anforderungen tatsächlich gerecht, darunter diejenige, die den Richtlinien der Text Encoding Initiative folgt. Der vorliegende Beitrag vergleicht zunächst einige derzeit gängige digitale Repräsentationsformen von Text. Für literaturwissenschaftliche Forschung besonders geeignet erweist sich hierbei eine Repräsentationsform, die den Richtlinien der Text Encoding Initiative folgt. Daher informiert der Beitrag anschließend über deren Nutzen für die literaturwissenschaftliche Arbeit, sowohl im Bereich der wissenschaftlichen Textedition als auch im Bereich der Analyse und Interpretation von Texten. Nur wenn die Literaturwissenschaften in ihrer Breite den Nutzen von offenen, expressiven, flexiblen und standardisierten, langfristig nutzbaren Formaten für die Forschung erkennen, können sie sich mit dem erforderlichen Nachdruck für deren Verbreitung einsetzen und durch die zunehmende Verfügbarkeit von Texten in solchen Formaten für die eigene Forschung und Lehre davon profitieren.
KW  - Digital Humanities
KW  - Text Encoding Initiative
KW  - Textedition
KW  - Textanalyse
Y1  - 2016
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-171351
VL  - 4
ER  - 
TY  - THES
A1  - Reger, Isabella
T1  - Figurennetzwerke als Ähnlichkeitsmaß
T1  - Character networks as a measure of similarity
N2  - Die vorliegende Arbeit lässt sich dem Bereich der quantitativen Literaturanalyse zuordnen und verfolgt das Ziel, mittels computergestützter Verfahren zu untersuchen, inwieweit sich Romane hinsichtlich ihrer Figurenkonstellation ähneln. Dazu wird die Figurenkonstellation, als wichtiges strukturgebendes Ordnungsprinzip eines Romans, als soziales Netzwerk der Figuren operationalisiert. Solche Netzwerke können unter Anwendung von Verfahren des Natural Language Processing automatisch aus dem Text erstellt werden. 
Als Datengrundlage dient ein Korpus von deutschsprachigen Romanen aus dem 19. Jahrhundert, das mit automatischen Verfahren zur Figurenerkennung und Koreferenzauflösung prozessiert und manuell nachkorrigiert wurde, um eine möglichst saubere Datenbasis zu schaffen.
Ausgehend von der intensiven vergleichenden Betrachtung der Figurenkonstellationen von Fontanes "Effi Briest" und Flauberts "Madame Bovary" wurde in einer manuell erstellten Distanzmatrix die menschliche Intuition solcher Ähnlichkeit zwischen allen Romanen des Korpus festgehalten, basierend auf der Lektüre von Zusammenfassungen der Romane. Diese Daten werden als Evaluationsgrundlage genutzt.
Mit Hilfe von Methoden der sozialen Netzwerkanalyse können strukturelle Eigenschaften dieser Netzwerke als Features erhoben werden. Diese wurden anschließend zur Berechnung der Kosinusdistanz zwischen den Romanen verwendet.
Obwohl die automatisch erstellten Netzwerke die Figurenkonstellationen der Romane im Allgemeinen gut widerspiegeln und die Netzwerkfeatures sinnvoll interpretierbar sind, war die Korrelation mit der Evaluationsgrundlage niedrig. Dies legt die Vermutung nahe, dass neben der Struktur der Figurenkonstellation auch wiederkehrende Themen und Motive die Erstellung der Evaluationsgrundlage unterbewusst beeinflusst haben.
Daher wurde Topic Modeling angewendet, um wichtige zwischenmenschliche Motive zu modellieren, die für die Figurenkonstellation von Bedeutung sein können. Die Netzwerkfeatures und die Topic-Verteilung wurden in Kombination zur Distanzberechnung herangezogen. Außerdem wurde versucht, jeder Kante des Figurennetzwerks ein Topic zuzuordnen, das diese Kante inhaltlich beschreibt. Hier zeigte sich, dass einerseits Topics, die sehr spezifisch für bestimmte Texte sind, und andererseits Topics, die über alle Texte hinweg stark vertreten sind, das Ergebnis bestimmen, sodass wiederum keine, bzw. nur eine sehr schwache Korrelation mit der Evaluationsgrundlage gefunden werden konnte.
Der Umstand, dass keine Verbindung zwischen den berechneten Distanzen und der Evaluationsgrundlage gefunden werden konnte, obwohl die einzelnen Features sinnvoll interpretierbar sind, lässt Zweifel an der Evaluationsmatrix aufkommen. Diese scheint stärker als zu Beginn angenommen unterbewusst von thematischen und motivischen Ähnlichkeiten zwischen den Romanen beeinflusst zu sein. Auch die Qualität der jeweiligen Zusammenfassung hat hier einen nicht unwesentlichen Einfluss. Daher wäre eine weniger subjektiv geprägte Möglichkeit der Auswertung von Nöten, beispielsweise durch die parallele Einschätzung mehrerer Annotatoren. Auch die weitere Verbesserung von NLP-Verfahren für literarische Texte in deutscher Sprache ist ein Desideratum für anknüpfende Forschungsansätze.
N2  - This thesis is a work in the field of Digital Literary Studies with the goal of computationally analyzing the similarity of novels with regard to their character constellation. The character constellation, as an important structural arrangement in a novel, is operationalized as a social network of these characters. Such networks can be generated automatically from a literary text using Natural Language Processing techniques.
The work is based on a corpus of German novels of the 19th century that have been preprocessed using automatic methods of character identification and coreference resolution. The results have been manually corrected in order to ensure the best possible data quality.
Starting from an intensive comparative contemplation of the character constellations in “Effi Briest” by Theodor Fontane and “Madame Bovary” by Gustave Flaubert, a distance matrix capturing the human intuition of similarity between character constellations of different novels was devised manually, based on summaries of the respective novels. This distance matrix serves as a means of evaluation.
Using methods of social network analysis, structural properties of character networks can be modeled as features and used to compute cosine distances between the novels.
The automatically generated networks are generally an adequate representation of the character constellations of the novels and the network features are meaningfully interpretable. Nevertheless, the correlation with the evaluation matrix was low. This raises the assumption that, apart from the structure of the character constellation, other properties such as recurring themes or motives may have subconsciously influenced the manual creation of the evaluation matrix.
Therefore, topic modeling was used to represent important interpersonal motives that might be of importance for the character constellation. The network features and the topic distribution were used in combination for the computation of distances. Moreover, each edge in a character network was associated with a topic, trying to describe the kind of the relation. It could be observed that the result is heavily influenced on the one hand by topics that are very specific for a single text and on the other hand by topics featured strongly in all texts, so that, again, no or only a very weak correlation with the evaluation matrix could be found.
The fact that there was no obvious relation between the computed distances and the manual distance matrix, even though the individual features are meaningfully interpretable, raises doubts about the evaluation matrix. It seems to be more strongly influenced by subconscious thematic and motivic similarities between the novels than assumed. The quality and extent of the respective summaries used in the creation of the manual matrix also have a substantial influence. Hence, a less subjective way of evaluation is needed, for example by parallel estimation of the distances by several annotators. Further improvement of the quality of NLP methods for literary texts in German is also a desideratum for following research.
KW  - Digital Humanities
KW  - Netzwerkanalyse <Soziologie>
KW  - Literaturwissenschaft
KW  - Figurennetzwerke
KW  - Topic Modeling
KW  - Figurenkonstellation
KW  - Digitale Textanalyse
Y1  - 2016
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-149106
ER  - 
TY  - CHAP
A1  - Jannidis, Fotis
A1  - Reger, Isabella
A1  - Weimer, Lukas
A1  - Krug, Markus
A1  - Puppe, Frank
T1  - Automatische Erkennung von Figuren in deutschsprachigen Romanen
N2  - Eine wichtige Grundlage für die quantitative Analyse von Erzähltexten, etwa eine Netzwerkanalyse der Figurenkonstellation, ist die automatische Erkennung von Referenzen auf Figuren in Erzähltexten, ein Sonderfall des generischen NLP-Problems der Named Entity Recognition. Bestehende, auf Zeitungstexten trainierte Modelle sind für literarische Texte nur eingeschränkt brauchbar, da die Einbeziehung von Appellativen in die Named Entity-Definition und deren häufige Verwendung in Romantexten zu einem schlechten Ergebnis führt. Dieses Paper stellt eine anhand eines manuell annotierten Korpus auf deutschsprachige Romane des 19. Jahrhunderts angepasste NER-Komponente vor.
KW  - Digital Humanities
KW  - Figurenerkennung
KW  - Named-Entity-Recognition
KW  - Domänenadaption
KW  - Literatur
Y1  - 2015
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-143332
UR  - https://dhd2015.uni-graz.at/
ER  -